高通量測序

常規的實驗技術

徠高通量測序技術(High-throughputsequencing)又稱“下一代”測序技術("Next-generation"sequencingtechnology),以能一次并行對幾十萬到幾百萬條DNA分子進行序列測定和一般讀長較短等為標誌。根據發展歷史、影響力、測序原理和技術不同等,主要有以下幾種:大規模平行簽名測序(Massively Parallel Signature Sequencing, MPSS)、聚合酶克隆(Polony Sequencing)、454焦磷酸測序(454 pyrosequencing)、Illumina (Solexa) sequencing、ABI SOLiD sequencing、離子半導體測序(Ion semiconductor sequencing)、DNA 納米球測序(DNA nanoball sequencing)等。

簡介


測序法已經成為一種常規的實驗技術,不過最近新一代測序技術的顯著優勢,比如大規模平行信號(MPSS, Brenner et al.2000)和焦磷酸測序法(也稱454測序; Margulies et al.2005, Langaee and ronaghi2005)已經使測序技術發生了徹底的變革,它們可以同時對數百萬個短序列讀長進行測序。儘管面臨著來自生物信息學方面的挑戰,但是這些技術為探索更多生態學與進化問題提供了更多的機會,其中包括對生物多樣性的分析( Venter etal.2004)。此外,二代測序技術是最不可能由於操作不當、缺失、稀有轉錄及克隆細菌不穩定的原因而產生錯誤的。技術進步使得這一方法變得不斷可靠( Hamady et al.2008),絕大多數的轉錄表達(包括那些表達量極少的轉錄本)都能夠被精準地定量( StoloⅦ itzky etal.2005)。隨著序列讀長的增加,454焦磷酸測序法的使用頻率將大增,能進一步增加在非模式物種中鑒定基因的概率( Hudson2008)。由於測序的讀長較短,這項技術最初只能用於已測序的模式物種。

名詞解釋


根據發展歷史、影響力、測序原理和技術不同等,主要有以下幾種:大規模平行簽名測序(Massively Parallel Signature Sequencing, MPSS)、聚合酶克隆(Polony Sequencing)、454焦磷酸測序(454 pyrosequencing)、Illumina (Solexa) sequencing、ABI SOLiD sequencing、離子半導體測序(Ion semiconductor sequencing)、DNA 納米球測序(DNA nanoball sequencing)等。
高通量測序技術是對傳統測序一次革命性的改變,一次對幾十萬到幾百萬條DNA分子進行序列測定,因此在有些文獻中稱其為下一代測序技術(next generation sequencing)足見其劃時代的改變,同時高通量測序使得對一個物種的轉錄組和基因組進行細緻全貌的分析成為可能,所以又被稱為深度測序(deep sequencing)。

實驗過程


1.樣本準備(sample fragmentation)
2.文庫構建(library preparation)
3.測序反應(sequencing reaction)
4.數據分析(data analysis)

測序平台


自從2005年454 Life Sciences公司(2007年該公司被Roche正式收購)推出了454 FLX焦磷酸測序平台(454 FLX pyrosequencing platform)以來,因為他們的拳頭產品毛細管陣列電泳測序儀系列(series capillary array electrophoresis sequencing machines)遇到了兩個強有力的競爭對手,曾推出過3730xl DNA測序儀(3730xl DNA Analyzer)的Applied BioSystem(ABI)這家一直佔據著測序市場最大份額的公司的領先地位就開始動搖了,一個就是羅氏公司(Roche)的454 測序儀(Roch GS FLX sequencer),,另一個就是2006年美國Illumina公司推出的Solexa基因組分析平台(Genome Analyzer platform),為此,2007年ABI公司推出了自主研發的SOLiD 測序儀(ABI SOLiD sequencer)。這三個測序平台即為目前高通量測序平台的代表。(見表一)
公司名稱技術原理技術開發者商業模式
Apply Biosystems(ABI)基於磁珠的大規模并行克隆連接DNA測序法美國Agencourt私人基因組學公司(APG)上市公司:銷售設備和試劑獲取利潤
Illumina合成測序法英國Solexa公司首席科學家David Bentley上市公司:銷售設備和試劑獲取利潤
Roche大規模并行焦磷酸合成測序法美國454 Life Sciences公司的創始人Jonathan Rothberg上市公司:銷售設備和試劑獲取利潤,該產品已經於2013年停產。
Helicos大規模并行單分子合成測序法美國斯坦福大學生物工程學家Stephen Quake上市公司:2007年5月首次公開募股(IPO)(P.S.由於該平台準確率太低等原因,該公司已於2012年宣告破產)
Complete GenomicsDNA納米陣列與組合探針錨定連接測序法美國Complete Genomics公司首席科學家radoje drmanac私人公司:投資額為4650萬美元,該公司於2013年被華大基因收購。
表一:主流測序平台一覽
Roche 454焦磷酸測序
(pyrophosphate sequencing)
Illumina Solexa 合成測序
(sequence by synthesize)
Illumina Genome AnalyzerIIx測序原理
Illumina公司的新一代測序儀Hiseq 2000和Hiseq 2500具有高準確性,高通量,高靈敏度,和低運行成本等突出優勢,可以同時完成傳統基因組學研究(測序和註釋)以及功能基因組學(基因表達及調控,基因功能,蛋白/核酸相互作用)研究。Hiseq是一種基於單分子簇的徠技術,基於專有的可逆終止化學反應原理。測序時將基因組DNA的隨機片段附著到光學透明的玻璃表面(即Flow cell),這些DNA片段經過延伸和橋式擴增后,在Flow cell上形成了數以億計Cluster,每個Cluster是具有數千份相同模板的單分子簇。然後利用帶熒光基團的四種特殊脫氧核糖核苷酸,通過可逆性終止的SBS(邊合成邊測序)技術對待測的模板DNA進行測序。
ABI SOLiD連接法測序
(sequence by ligation)

技術應用


測序技術推進科學研究的發展。隨著第二代測序技術的迅猛發展,科學界也開始越來越多地應用第二代測序技術來解決生物學問題。比如在基因組水平上對還沒有參考序列的物種進行從頭測序(de novo sequencing),獲得該物種的參考序列,為後續研究和分子育種奠定基礎;對有參考序列的物種,進行全基因組重測序(resequencing),在全基因組水平上掃描並檢測突變位點,發現個體差異的分子基礎。在轉錄組水平上進行全轉錄組測序(whole transcriptome resequencing),從而開展可變剪接、編碼序列單核苷酸多態性(cSNP)等研究;或者進行小分子RNA測序(small RNA sequencing),通過分離特定大小的RNA分子進行測序,從而發現新的microRNA分子。在轉錄組水平上,與染色質免疫共沉澱(ChIP)和甲基化DNA免疫共沉澱(MeDIP)技術相結合,從而檢測出與特定轉錄因子結合的DNA區域和基因組上的甲基化位點。
這邊需要特別指出的是第二代測序結合微陣列技術而衍生出來的應用--目標序列捕獲測序技術(Targeted Resequencing)。這項技術首先利用微陣列技術合成大量寡核苷酸探針,這些寡核苷酸探針能夠與基因組上的特定區域互補結合,從而富集到特定區段,然後用第二代測序技術對這些區段進行測序。目前提供序列捕獲的廠家有Agilent和Nimblegen ,應用最多的是人全外顯子組捕獲測序。科學家們目前認為外顯子組測序比全基因組重測序更有優勢,不僅僅是費用較低,更是因為外顯子組測序的數據分析計算量較小,與生物學表型結合更為直接。
目前,高通量測序開始廣泛應用於尋找疾病的候選基因上。內梅亨大學的研究人員使用這種方法鑒定出Schinzel-Giedion 綜合征中的致病突變,Schinzel-Giedion綜合征是一種導致嚴重的智力缺陷、腫瘤高發以及多種先天性畸形的罕見病。他們使用Agilent SureSelect序列捕獲和SOLiD對四位患者的外顯子組進行測序,平均復蓋度為43倍,讀長為50 nt,每個個體產生了2.7-3 GB可作圖的序列數據。他們聚焦於全部四位患者都攜帶變異體的12個基因,最終將候選基因縮小至1個。而貝勒醫學院基因組測序中心也計劃對15種以Science雜誌年度十大科學突破上疾病進行研究,包括腦癌、肝癌、胰腺癌、結腸癌、卵巢癌膀胱癌、心臟病、糖尿病、自閉症以及其他遺傳疾病,以更好地理解致病突變以及突變對疾病的影響。前不久剛剛結束的評選中,外顯子組測序名列其中。
以上我們盤點了2010年第二代測序技術的最新進展和相關應用。但是除了第二代測序之外,還有另外一種以單分子實時測序和納米孔為標誌的第三代測序技術也正在如火如荼的發展中,只是還沒有正式發布。所以目前科學界所說的高通量測序還指的是第二代測序。

意義


高通量測序技術的誕生可以說是基因組學研究領域一個具有里程碑意義的事件。該技術使得核酸測序的單鹼基成本與第一代測序技術相比急劇下降, 以人類基因測序為例, 上世紀末進行的人類基因組計劃花費 30 億美元解碼了人類生命密碼, 而第二代測序使得人類基因組測序已進入萬(美)元基因組時代。如此低廉的單鹼基測序成本使得我們可以實施更多物種的基因組計劃從而解密更多生物物種的基因組遺傳密碼。同時在已完成基因組序列測定的物種中, 對該物種的其他品種進行大規模地全基因組重測序也成為了可能。