蛋白質組

Marc Wilkins提出的概念

蛋白質組(Proteome)的概念最先由Marc Wilkins提出,指由一個基因組(Genome),或一個細胞、組織表達的所有蛋白質(protein)。蛋白質組的概念與基因組的概念有許多差別,它隨著組織、甚至環境狀態的不同而改變。在轉錄時,一個基因可以多種mRNA形式剪接,一個蛋白質組不是一個基因組的直接產物,蛋白質組中蛋白質的數目有時可以超過基因組的數目。蛋白質組學(Proteomics)處於早期“發育”狀態,這個領域的專家否認它是單純的方法學,就像基因組學一樣,不是一個封閉的、概念化的穩定的知識體系,而是一個領域。

主要功能


蛋白質組學集中於動態描述基因調節,對基因表達的蛋白質水平進行定量的測定,鑒定疾病、藥物對生命過程的影響,以及解釋基因表達調控的機制。作為一門科學,蛋白質組研究並非從零開始,它是已有20多年歷史的蛋白質(多肽)譜和基因產物圖譜技術的一種延伸多肽圖譜依靠雙向電泳(Two-dimensional gel electrophoresis, 2-DE)和進一步的圖象分析;而基因產物圖譜依靠多種分離后的分析,如質譜技術、氨基酸組分分析等。
由於可變剪輯及RNA編輯的存在,許多基因可以表達出多種不同的蛋白質。因此,蛋白質組的複雜度要比基因組的複雜度高得多。
如果某物種的基因組全序列已經破譯,並不代表該物種的蛋白質組也已破譯。具體分析某個基因的蛋白質產物要綜合基因組水平、轉錄水平和翻譯水平的修飾及調控來確定。

研究內容


主要有兩方面,一是結構蛋白質組學,二是功能蛋白質組學。其研究前沿大致分為三個方面:
① 針對有關基因組或轉錄組資料庫的生物體或組織細胞,建立其蛋白質組或亞蛋白質組及其蛋白質組連鎖群,即組成性蛋白質組學。
② 以重要生命過程或人類重大疾病為對象,進行重要生理病理體系或過程的局部蛋白質組或比較蛋白質組學。
③ 通過多種先進技術研究蛋白質之間的相互作用,繪製某個體系的蛋白,即相互作用蛋白質組學,又稱為“細胞圖譜”蛋白質組學。
此外,隨著蛋白質組學研究的深入,又出現了一些新的研究方向,如亞細胞蛋白質組學、定量蛋白質組學等。蛋白質組學是系統生物學的重要研究方法.

技術原理


雙向凝膠電泳技術(2-DE)
雙向凝膠電泳技術與質譜技術是目前應用最為廣泛的研究蛋白質組學的方法。雙向凝膠電泳技術利用蛋白質的等電點和分子量差別將各種蛋白質區分開來。雖然二維凝膠電泳難以辨別低丰度蛋白,對操作要求也較高,但其通量高、解析度和重複性好以及可與質譜聯用的特點,使其成為目前最流行、可靠的蛋白質組研究手段。雙向凝膠電泳技術及質譜基礎的蛋白質組學研究程序為樣品製備→等電聚焦→聚丙烯醯胺凝膠電泳→凝膠染色→挖取感興趣的蛋白質點→膠內酶切→質譜分析確定肽指紋圖譜或部分氨基酸序列→利用資料庫確定蛋白。蛋白質組研究要求有高解析度的蛋白質分離及準確、靈敏的質譜鑒定技術。凝膠電泳中蛋白質的著色不僅影響蛋白質分離的解析度,同時也影響後續的質譜鑒定。蛋白質的染色可分為有機試劑染色、銀染、熒光染色及同位素顯色四類。
Unlu等提出了一種熒光差異顯示雙向電泳(F-2D-DIGE)的定量蛋白質組學分析方法。差異凝膠電泳(DIGE)是對2-DE在技術上的改進,結合了多重熒光分析的方法,在同一塊膠上共同分離多個分別由不同熒游標記的樣品,並第一次引入了內標的概念。兩種樣品中的蛋白質採用不同的熒游標記后混合,進行2-DE,用來檢測蛋白質在兩種樣品中表達情況,極大地提高了結果的準確性、可靠性和可重複性。在DIGE技術中,每個蛋白點都有它自己的內標,並且軟體可全自動根據每個蛋白點的內標對其表達量進行校準,保證所檢測到的蛋白丰度變化是真實的。DIGE技術已經在各種樣品中得到應用。
高效液相色譜技術(HPLC)
儘管二維凝膠電泳(2-DE)是常用的對全蛋白組的分析方法,但其存在分離能力有限、存在歧視效應、操作程序複雜等缺陷。對於分析動態範圍大、低丰度以及疏水性蛋白質的研究往往很難得到滿意的結果。Chong等使用HPLC/質譜比較分析惡性腫瘤前和癌症兩種蛋白質差異表達。利用HPLC分離蛋白質,並用MALDI-TOF-MS鑒定收集的組分,從而在兩種細胞中的差異表達中對蛋白質進行定量分析。多維液相色譜作為一種新型分離技術,不存在相對分子質量和等電點的限制,通過不同模式的組合,消除了二維凝膠電泳的歧視效應,具有峰容量高、便於自動化等特點。二維離子交換-反相色譜(2D-IEC-RPLC)是蛋白質組學研究中最常用的多維液相色譜分離系統。
飛行時間質譜技術
表面增強激光解吸離子化飛行時間質譜技術於2002年由諾貝爾化學獎得主田中發明,剛剛產生便引起學術界的高度重視。SELDI技術是蛋白質組學研究中比較理想的技術平台,其全稱是表面增強激光解吸電離飛行時間質譜技術(SELDI-tof)。其方法主要如下:通常情況下將樣品經過簡單的預處理后直接滴加到表面經過特殊修飾的晶元上,既可比較兩個樣品之間的差異蛋白,也可獲得樣品的蛋白質總覽。因此,在應用方面具有顯著優勢。SELDI技術分析的樣品不需用液相色譜或氣相色譜預先純化,因此可用於分析複雜的生物樣品。SELDI技術可以分析疏水性蛋白質,PI過高或過低的蛋白質以及低分子質量的蛋白質(<25000),還可以發現在未經處理的樣品中許多被掩蓋的低濃度蛋白質,增加發現生物標誌物的機會。SELDI技術只需少量樣品,在較短時間內就可以得到結果,且試驗重複性好,適合臨床診斷及大規模篩選與疾病相關的生物標誌物,特別是它可直接檢測不經處理的尿液、血液、腦脊液、關節腔滑液、支氣管洗出液、細胞裂解液和各種分泌物等,從而可檢測到樣品中目標蛋白質的分子量、PI、糖基化位點、磷酸化位點等參數。
同位素標記親和標籤(ICAT)技術
同位素親和標籤技術是一種用於蛋白質分離分析技術,此技術是蛋白質組研究技術中的核心技術之一。該技術用具有不同質量的同位素親和標籤(ICATs)標記處於不同狀態下的細胞中的半胱氨酸,利用串聯質譜技術,對混合的樣品進行質譜分析。來自兩個樣品中的同一類蛋白質會形成易於辨識比較的兩個不同的峰形,能非常準確的比較出兩份樣品蛋白質表達水平的不同。ICAT的好處在於它可以對混合樣品直接測試;能夠快速定性和定量鑒定低丰度蛋白質,尤其是膜蛋白等疏水性蛋白等;還可以快速找出重要功能蛋白質。
由於採用了一種全新的ICAT試劑,同時結合了液相色譜和串聯質譜,因此不但明顯彌補了雙向電泳技術的不足,同時還使高通量、自動化蛋白質組分析更趨簡單、準確和快速,代表著蛋白質組分析技術的主要發展方向。針對磷酸化蛋白分析以及與固相技術相結合ICAT技術本身又取得了許多有意義的進展,已形成ICAT系列技術。
生物信息學在生命科學研究中起著越來越重要的作用。利用生物信息學對蛋白質組的各種數據進行處理和分析,也是蛋白質組研究的重要內容。生物信息學是蛋白質組學研究中不可缺少的一部分。生物信息學的發展,已不僅是單純的對基因組、蛋白質組數據的分析,而且可以對已知的或新的基因產物進行全面分析。在蛋白質組資料庫中儲存了有機體、組織或細胞所表達的全部蛋白質信息,通過用滑鼠點擊雙向凝膠電泳圖譜上的蛋白質點就可獲得

鑒定方法


如蛋白質鑒定結果、蛋白質的亞細胞定位、蛋白質在不同條件下的表達水平等信息。目前應用最普遍的資料庫是NRDB和dbEST資料庫。NRDB由SWISS2PROT和GENPETP等幾個資料庫組成,dbEST是由美國國家生物技術信息中心(NCBI)和歐洲生物信息學研究所(EBI)共同編輯的核酸資料庫;計算機分析軟體主要有蛋白質雙向電泳圖譜分析軟體、蛋白質鑒定軟體、蛋白質結構和功能預測軟體等。

研究進展


2014年5月28日,英國新一期《自然》雜誌公布兩組科研人員分別繪製的人類蛋白質組草圖。這一成果有助於了解各個組織中存在何種蛋白質,這些蛋白質與哪些基因表達有關等,從而進一步揭開人體的奧秘。
上世紀90年代,人類基因組計劃開始成形時,有科學家提出了破譯人類蛋白質組的想法。其目標是將人體所有蛋白質歸類並描繪出它們的特性、在細胞中所處的位置以及蛋白質之間的相互作用。但人類蛋白質組的規模和複雜性使此類研究困難重重。
研究人員藉助計算機對這些蛋白質片段與基因組進行了大量比對工作,並據此列出一個“清單”,描繪出哪些組織中的哪些基因表達與蛋白質的形成有關。在另一項研究中,美國約翰斯·霍普金斯大學研究人員與印度等國同行也採用質譜分析法繪製出一張蛋白質組草圖。