后基因組計劃

后基因組計劃

后基因組時代,亦稱功能基因組學時代。它以提示基因組的功能及調控機製為目標,其核心科學問題主要包括:基因組多樣性,基因組的表達調控與蛋白質產物的功能,以及模式生物基因組研究等。它的研究將為人們深入理解人類基因組遺傳語言的邏輯構架,基因結構與功能的關係,個體發育、生長、衰老和死亡機理,神經活動和腦功能表現機理,細胞增殖、分化和凋亡機理,信息傳遞和作用機理,疾病發生、發展的基因及基因后機理(如發病機理、病理過程)以及各種生命科學問題提供共同的科學基礎。

背景


人類基因組計劃的研究現狀
1、人類基因組測序
1990年~1998年,人類基因組序列已完成和正在測序的共計約330Mb,占人基因組的11%左右;已識別出人類疾病相關的基因200個左右。此外,細菌古細菌支原體酵母等17種生物的全基因組的測序已經完成。
值得一提的是,企業與研究部門的攜手,將大大地促進測序工作的完成。美國的基因組研究所(The Institute of Genome Research, TIGR)與PE(Perkin-Elmar)公司合作建立新公司,三年內投資2億美元,預計於2002年完成全序列的測定。這一進度將比美國政府資助的HGP的預定目標提前三年。美國加州的一家遺傳學數據公司(Incyte)宣布(1998年〕,兩年內測定基因組中的蛋白質編碼序列以及密碼子中的單核苷酸的多態性,最後將繪製一幅人的10萬個基因的定點陣圖。與Incyte公司合作的HGS(Human Genome Science)公司的負責人宣稱,截止1998年8月,該公司已鑒定出10萬多個基因(人體基因約為12萬個),並且得到了95%以上基因的EST(expressed sequence tag)或其部分序列。
1998年9月14日美國國家人類基因組計劃研究所(NHGRI)和美國能源部基因組研究計劃的負責人在一次諮詢會議上宣布,美國政府資助的人類基因組計劃將於2001年完成大部分蛋白質編碼區的測序,約佔基因組的三分之一,測序的差錯率不超過萬分之一。同時還要完成一幅“工作草圖”,至少覆蓋基因組的90%,差錯率為百分之一。2003年完成基因組測序,差錯率為萬分之一。這一時間表顯示,計劃將比開始的目標提前兩年完成。
2、疾病基因的定位克隆
人類基因組計劃的直接動因是要解決包括腫瘤在內的人類疾病的分子遺傳學問題。6000多個單基因遺傳病和多種大面積危害人類健康的多基因遺傳病致病基因及相關基因,代表了對人類基因中結構和功能完整性至關重要的組成部分。所以,疾病基因的克隆在HGP中佔據著核心位置,也是計劃實施以來成果最顯著的部分。
在遺傳和物理作圖工作的帶動下,疾病基因的定位、克隆和鑒定研究已形成了,從表位→蛋白質→基因的傳統途徑轉向“反求遺傳學”或“定位克隆法”的全新思路。隨著人類基因圖的構成,3000多個人類基因已被精確地定位於染色體的各個區域。今後,一旦某個疾病位點被定位,就可以從局部的基因圖中遴選出相關基因進行分析。這種被稱為“定位候選克隆”的策略,將大大提高發現疾病基因的效率。
3、多基因病的研究
目前,人類疾病的基因組學研究已進入到多基因疾病這一難點。由於多基因疾病不遵循孟德爾遺傳規律,難以從一般的家系遺傳連鎖分析取得突破。這方面的研究需要在人群和遺傳標記的選擇、數學模型的建立、統計方法的 改進等方面進行艱苦的努力。近來也有學者提出,用比較基因表達譜的方法來識別疾病狀態下基因的激活或受抑。實際上,“癌腫基因組解剖學計劃(Cancer Genome Anatomy Project,CGAP”就代表了在這方面的嘗試。
4、中國的人類基因組研究
國際HGP 研究的飛速發展和日趨激烈的基因搶奪戰已引起了中國政府和科學界的高度重視。在政府的資助和一批高水平的生命科學家帶領下,我國已建成了一批實力較強的國家級生命科學重點實驗室,組建了北京、上海人類基因組研究中心。有了研究人類基因組的條件和基礎,並引進和建立了一批基因組研究中的新技術。中國的HGP在多民族基因保存、基因組多樣性的比較研究方面取得了令人滿意的成果,同時在白血病食管癌肝癌鼻咽癌易感基因研究方面亦取得了較大進展。
首先建立了寡核苷酸引物介導的人類高分辨染色體顯微切割和顯微基因克隆技術;已建立的17種染色體特異性DNA文庫和24種染色體區特異性DNA文庫及其探針;構建了人X染色體YAC圖譜,已完成了人X染色體Xp11.2-p21.3跨度的約35cM STS-YAC圖譜的構建;建立了YAC-cDNA篩選技術。
目前的研究工作還包括: 疾病和功能相關新基因的分離、測序和克隆的技術和方法學的創新研究;中國少數民族HLA分型研究及特種基因的分析;人胎腦cDNA文庫的構建和新基因的克隆研究。
中國是世界上人口最多的國家,有56 個民族和極為豐富的病種資源,並且由於長期的社會封閉,在一些地區形成了極為難得的族群和遺傳隔離群,一些多世代、多個體的大家系具有典型的遺傳性狀,這些都是克隆相關基因的寶貴材料。但是,由於我國的HGP 研究工作起步較晚、底子薄、資金投入不足,缺乏一支穩定的、高素質的青年生力軍,我國的HGP 研究工作與國外近年來的驚人發展速度相比,差距還很大,並且有進一步加大的危險。如果我們在這場基因爭奪戰中不能堅守住自己的陣地,那麼在21 世紀的競爭中我們又將處於被動地位:我們不能自由地應用基因診斷基因治療的權力,我們不能自由地進行生物藥物的生產和開發,我們亦不能自由地推動其他基因相關產業的發展。

計劃介紹


生命科學工業
由於基因組研究與製藥、生物技術、農業、食品、化學、化妝品、環境、能源和計算機等工業部門密切相關,更重要的是基因組的研究可以轉化為巨大的生產力,國際上一批大型製藥公司和化學工業公司大規模紛紛投巨資進軍基因組研究領域,形成了一個新的產業部門,即生命科學工業。
世界上一些大的製藥集團紛紛投資建立基因組研究所。Ciba-Geigy 和Ssandoz合資組建了Novartis 公司,並斥資2.5億美元建立研究所,開展基因組研究工作。Smith Kline 公司花1.25億美元加快測序的進度,將藥物開發項目的25%建立在基因組學之上。Glaxo-Wellcome 在基因組研究領域投入4,700萬美元,將研究人員增加了一倍。
大型化學工業公司向生命科學工業轉軌。孟山都公司早在1985年就開始轉向生命科學工業。至1997年,該公司向生物技術和基因組研究的投入已高達66億美元。1998年4月,杜邦公司宣布改組成三個實業單位,由生命科學領頭。1998年5月,該公司又宣布放棄能源公司Conaco,將其改造成一家生命科學公司。Dow化學公司用9億美元購入Eli Lilly公司40%的股票,從事穀物和食品研究,后又成立了生命科學公司。Hoechst公司則出售了它的基本化學品部門,轉項投資生物技術和製藥。
傳統的農業和食品部門也出現了向生物技術和製藥合併的趨勢。Genzyme Transgenics 公司培養出的基因工程羊能以較高的產量生產抗凝血酶III,一群羊的酶產量相當於投資1.15億美元工廠的產量。據估計,轉基因動物生產的藥物成本是大規模細胞培養法的十分之一。一些公司還在研究生產能骨質疏鬆的穀物,以及大規模生產和加工基因工程食品。
能源、採礦和環境工業也已在分子水平上向基因組研究匯合。例如,用產甲烷菌Methanobacterium 作為一種新能源。用抗輻射的細菌Deinococcus radiodurans清除放射性物質的污染,並在轉入tod基因后,在高輻射環境下清除多種有害化學物質的污染。
功能基因組學
人類基因組計劃當前的整體發展趨勢是什麼?一方面,在順利實現遺傳圖和物理圖的製作后,結構基因組學正在向完成染色體的完整核酸序列圖的目標奮進。另一方面,功能基因組學已提上議事日程。人類基因組計劃已開始進入由結構基因組學向功能基因組學過渡、轉化的過程。在功能基因組學研究中,可能的核心問題有:基因組的表達及其調控、基因組的多樣性、模式生物體基因組研究等。
(1)基因組的表達及其調控
1)基因轉錄表達譜及其調控的研究
一個細胞的基因轉錄表達水平能夠精確而特異地反映其類型、發育階段以及反應狀態,是功能基因組學的主要內容之一。為了能夠全面地評價全部基因的表達,需要建立全新的工具系統,其定量敏感性水平應達到小於1個拷貝/細胞,定性敏感性應能夠區分剪接方式,還須達到檢測單細胞的能力。近年來發展的DNA微陣列技術,如DNA晶元,已有可能達到這一目標。
研究基因轉錄表達不僅是為了獲得全基因組表達的數據,以作為數學聚類分析。關鍵問題是要解析控制整個發育過程或反應通路的基因表達網路的機制。網路概念對於生理和病理條件下的基因表達調控都是十分重要的。一方面,大多數細胞中基因的產物都是與其它基因的產物互相作用的;另一方面,在發育過程中大多數的基因產物都是在多個時間和空間表達併發揮其功能,形成基因表達的多效性。在一個意義上,每個基因的表達模式只有放到它所在的調控網路的大背景下,才會有真正的意義。進行這方面的研究,有必要建立高通量的小鼠胚胎原位雜交技術。
2)蛋白質組學研究
蛋白質組學研究是要從整體水平上研究蛋白質的水平和修飾狀態。目前正在發展標準化和自動化的二維蛋白質凝膠電泳的工作體系。首先用一個自動系統來提取人類細胞的蛋白質,繼而用色譜儀進行部分分離,將每區段中的蛋白質裂解,再用質譜儀分析,並在蛋白質資料庫中通過特徵分析來認識產生的多肽
蛋白質組研究的另一個重要內容是建立蛋白質相互關係的目錄。生物大分子之間的相互作用構成了生命活動的基礎。組裝基因組各成分間的詳盡作圖已在T7噬菌體(55個基因)獲得成功。如何在模式生物(如酵母)和人類基因組的研究中建立自動方法,認識不同的生化通路,是值得探討的問題。
3)生物信息學的應用
目前,生物信息學已大量應用於基因的發現和預測。然而,利用生物信息學去發現基因的蛋白質產物的功能更為重要。模式生物體中越來越多的蛋白質構建編碼單位被識別,無疑為基因和蛋白質同源關係的搜尋和家族的分類提供了極其寶貴的信息。同時,生物信息學的演演算法、程序也在不斷改善,使得不僅能夠從一級結構,也能從估計結構上發現同源關係。但是,利用計算機模擬所獲得的理論數據,還需要經過實驗經過的驗證和修正。
(2)基因組多樣性的研究
人類是一個具有多態性的群體。不同群體和個體在生物學性狀以及在對疾病的易感性與抗性上的差別,反映了進化過程中基因組與內、外部環境相互作用的結果。開展人類基因組多樣性的系統研究,無論對於了解人類的起源和進化,還是對於生物醫學均會產生重大的影響。
1)對人類DNA的再測序
可以預測,在完成第一個人類基因組測序后,必然會出現對各人種、群體進行再測序和精細基因分型的熱潮。這些資料與人類學語言學的資料項結合,將有可能建立一個全人類的資料庫資源,從而更好地了解人類的歷史和自身特徵。另外,基因組多樣性的研究將成為疾病基因組學的主要內容之一,而群體遺傳學將日益成為生物醫藥研究中的主流工具。需要對各種常見多因素疾病(如高血壓糖尿病精神分裂症等)的相關基因及癌腫相關基因在基因組水平進行大規模的再測序,以識別其變異序列。
2)對其它生物的測序
對進化過程各個階段的生物進行系統的比較DNA測序,將揭開生命35億年的進化史。這樣的研究不僅能勾畫出一張詳盡的系統進化樹,而且將顯示進化過程中最主要的變化所發生的時間及特點,比如新基因的出現和全基因組的複製。
認識不同生物中基因序列的保守性,將能夠使我們有效地認識約束基因及其產物的功能性的因素。對序列差異性的研究則有助於認識產生大自然多樣性的基礎。在不同生物體之間建立序列變異與基因表達的時空差異之間的相關性,將有助於揭示基因的網路結構。
(3)開展對模式生物體的研究
1)比較基因組研究
在人類基因組的研究中,模式生物體的研究佔有極其重要的地位。儘管模式生物體的基因組的結構相對簡單,但是它們的核心細胞過程和生化通路在很大程度上是保守的。這項研究的意義是:1〕有助於發展和檢驗新的相關技術,如大規模測序、大規模表達譜檢驗、大規模功能篩選等;2〕通過比較和鑒定,能夠了解基因組的進化,從而加速對人類基因組結構和功能的了解;3〕模式生物體間的比較研究,為闡明基因表達機制提供了重要的線索。
后基因組計劃
后基因組計劃
目前對於基因組總體結構組成方面的知識,主要來源於模式生物體的基因組序列分析。通過對不同物種間基因調控序列的計算機分析,已發現了一定比例的保守性核心調控序列。根據這些序列建立的表達模式資料庫對破譯基因調控網路提供了必要的條件。 2)功能缺失突變的研究
識別基因功能最有效的方法,可能是觀察基因表達被阻斷後在細胞和整體所產生的表型變化。在這方面,基因剔除方法(knock-out)是一項特別有用的工具。目前。國際上已開展了對酵母、線蟲果蠅的大規模功能基因組學研究,其中進展最快的是酵母。歐共體為此專門建立了一個稱為EUROFAN(European Functional Analysis Network)的研究網路。美國、加拿大和日本也啟動了類似的計劃。
隨著線蟲和果蠅基因組測序的完成,將來也可能開展對這兩種生物的類似性研究。一些突變株系和技術體系建立后,不僅能夠成為研究單基因功能的有效手段,而且為研究基因冗餘性和基因間的相互作用等深層次問題奠定了基礎。小鼠作為哺乳動物中的代表性模式生物,在功能基因組學的研究中展有特殊的地位。同源重組技術可以破壞小鼠的任何一個基因,這種方法的缺點是費用高。利用點突變、缺失突變和插入突變造成的隨機突變是另一中可能的途徑。對於人體細胞而言,建立反義寡核苷酸核酶瞬間阻斷基因表達的體系可能更加合適。蛋白質水平的剔除術也許是說明基因功能最有力的手段。利用組合化學方法有望生產出化學剔除試劑,用於激活或失活各種蛋白質。
總之,模式生物體的基因組計劃為人類基因組的研究提供了大量的信息。今後,模式生物體的研究方向是將人類基因組8~10萬個編碼基因的大部分轉化為已知生化功能的多成分核心機制。而要獲得酶一種人類進化保守性核心機制的精細途徑,以及它們的紊亂導致疾病的各種途徑的知識,將只能來自對人類自身的研究。
通過功能基因組學的研究,人類最終將將能夠了解哪些進化機制已經確實發生,並考慮進化過程還能夠有哪些新的潛能。一種新的解答發育問題的方法可能是,將蛋白質功能域和調控順序進行重新的組合,建立新的基因網路和形態發生通路。也就是說,未來的生物科學不僅能夠認識生物體是如何構成和進化的,而且更為誘人的是產生構建新的生物體的可能潛能。