基因圖
基因圖
人類基因圖譜的完成,是醫學上一場革命的開始,但這場革命的成功將需要更長的時間。中國科學家承擔了這個工程1%的工作量。人類基因圖譜的繪製完成,給即將廣泛推行的全新基因醫療手段打下了堅實的基礎,它使人類向真正的“個性化醫療”時代又邁進一步。今後,遺傳疾病或是疑難雜症,只要根據患者個人的基因圖譜“逮住”其中出了問題的基因,用最直接的辦法使基因恢復正常狀態,人體就會作出相應調整,從而治癒疾病。
人類大約有3萬個基因,比科研人員原本預料的少了許多。通過了解人類基因的遺傳成分,科研人員就可為個人量身製作預防性療法並且製造各種新藥物,父母也可以檢查腹中胎兒是否有遺傳缺陷。而有朝一日,像糖尿病、癌症、早老性痴呆症、精神病等過去無法根治的病症,也能根治了。
人類基因組序列圖是一個了不起的成就,是當代世界最先進的生物、信息等多種學科技術的有機集成。人類基因組計劃開始於1990年,來自6國的一大批科研機構先後參與了這一紛繁複雜的工程。在研究項目啟動之初,要完全確認一個鹼基對需要花費10美元,一名經過嚴格訓練的技術人員一天只能完成1萬個鹼基對的測序,而隨著技術的突飛猛進,一個鹼基對的成本降到了5美分,利用機器人測序,其效率是每秒鐘1萬個鹼基對。在各國專家的精誠合作下,人類基因組計劃2000年6月完成了人類基因組序列的“工作框架圖”,2002年2月又公布了“精細圖”,此次又推出了“完成圖”。從“框架圖”到“完成圖”,人類基因組測序範圍從90%提高到了99%,以鹼基對為基礎的誤差率從1/1000降到了1/10000。科學家發現,人類基因數目約為3.4萬至3.5萬個,僅比果蠅多2萬個,遠小於原先10萬個基因的估計。基因是生命遺傳的基本單位,人類基因組包含30億個鹼基對,繪製出人類基因組序列圖就意味著掌握了探索人類“生命迷宮”的路標。
人類基因組序列圖的完成具有許多重要意義和實用價值。
首先,它為人類了解自身提供了一個十分重要的平台。通過研究基因序列可以進一步分辨出人與人之間、族群與族群之間在生理上有何異同。專家稱,人類基因組研究的下一個目標是人類基因組單體型圖計劃,美國、英國、日本、加拿大和中國科學家已在著手進行這一工程。人類基因組單體型圖計劃旨在分析各主要人類群體的差異,並在此基礎上進一步分析所有與疾病相關的序列差異,為21世紀的“個人醫學”奠定基礎。
其次,它會引起生物學研究的“徹底革命”。在基因時代之前,大學生物學系的研究生們幾十人花幾年時間分析一種基因的功能,而如今只要點擊幾下電腦鍵盤,同樣的信息即可展現眼前。自從人類基因組計劃開始以來,被確定引起人類疾病的基因數量發生了“爆炸”,從1990年的不足100個猛升到了今天的1400多個。
第三,它可能會促使人類社會進入“生物製藥的新時代”,為治癒許多疑難病症提供一條捷徑。科學家認為,通過對個體病人DNA的分析,將來有可能會設計出不引起副作用的專門藥物或是疫苗,從而達到百分之百的對症下藥。在不遠的將來,基因工程藥物、基因治療、生物晶元診斷技術等都會有極其廣闊的應用前景。美國正在這方面加大力度爭占制高點,根據基因研究而推出的新葯已有350種投入了生產。
第四,它還有利於能源開發和環境保護。美國能源部正在利用人類基因組計劃的成果加緊研究單細胞生物的各種功能。比如,利用先進的電腦測序技術尋找某些微生物,看其能否幫助清理核廢料,能否讓汽油燃燒更徹底,或者乾脆讓其替代成為產生燃料氫的來源體。
早在1990年,美國政府就開始了“人類基因組圖譜計劃”。2001年2月12日,中、美、日、德、法、英等6國科學家和美國塞萊拉公司聯合公布人類基因組圖譜及初步分析結果。作為現代生命科學和基因組科學的權威,在沃森(James Watson)等人的推動下,人類基因組計劃在過去10多年裡成功得以實施。
儘管有了全人類的基因組圖譜,但是每個人的基因組仍有不同之處。人們何時能有自己的基因組圖譜?答案是2007年。5月30日,時年79歲的沃森成為世界上首位獲得自己基因組圖譜的個人。此次破譯過程發現的人類遺傳變異的數量比之前人們所設想的要“豐富”得多。同時,生物科學界的“怪人”文特爾的私人生物技術公司也製作完成了他本人的個人基因組圖譜。
1953年3月,沃森與弗朗西斯·克里克發現了DNA的雙鏈分子結構,從此為人類探索生命遺傳秘密開闢了道路。沃森因此被稱為“DNA之父”。57年後,美國一家基因技術公司交給沃森一張光碟,上面記錄有數萬個人類基因中30億個鹼基對在沃森細胞內DNA雙鏈上的排列位置。這便是沃森的個人基因組圖譜。
而哈佛大學的喬治·丘吉爾更是宣布,要為10位志願者做他們各自的個人基因組圖譜。看來,基因組圖譜的個體化正在一步步地擴散。
事實上有了個人基因組圖譜,科學家便可以依據其基因排列順序推斷,這個人是否害羞、會不會患上精神疾病等等與基因遺傳有關的表象特徵。看來,繪製個人基因組圖譜有著無比的檢測優勢。
而除去價格因素,繪製個人基因組圖譜與傳統的遺傳檢測相比還有其他方面的優勢。美國貝勒大學(Baylor University)遺傳學專家理查德·吉布斯就認為,遺傳檢測針對性和局限性較大,只能確認被檢測基因是否是人類已知的基因變異種類之一。如果繪製個人基因組圖譜,則能夠以之與人類基因組圖譜基準相比較,可以發現任何異常。
事實上,沃森、文特爾個人基因組圖譜的誕生,意味著普通人不久也能擁有屬於自己的基因組圖譜,屆時關於你的一切,與天性甚或與環境相連的每個基本問題,都將在基因中得到解答,一個個性化、具體化的基因組學時代即將來臨。
關注0.1%的差異
在科學家完成人類基因組圖譜后,個體化的基因組圖譜便成為一個新的目標。畢竟人類基因組圖譜是很多人的,有參照基因,但沒有個體的具體信息。地球上所有人的基因組99.9%的部分都是相同的,這份基因組圖我們稱為參考序列。但是影響個體的也許就在0.1%的差異中。
由此,2007年基因學界最大的突破不是在技術上,而是在個體化上。科學家完成的是從概念中的人到具體化個體的突進。這樣,就可以有針對性地預防、治療疾病等。類似沃森基因組圖譜公布后,我們就可以知道沃森有患老年痴呆症的可能。這樣就可以提早做準備,做些預防。
儘管獲得個人基因組圖譜的個體還極少,但這已經給我們預示了一個方向,對於我們每個人的信息都將一一得到對應。而且以後,基因組測序的技術也在不斷得到提高,費用在不斷減少。
中國人也有了自己的個人基因組圖譜,那就是“炎黃一號”。“炎黃一號”儘管沒有對外聲稱具體到哪個中國人個體,但是華大基因院已經有技術和能力做到一個個體的基因組圖譜。
———白玉傑(浙江大學迪諾遺傳與基因組醫學研究中心教授)
首張亞洲人全基因序列圖譜
2007年10月11日,深圳華大基因研究院召開新聞發布會,宣布他們成功繪製出第一幅完整的中國人基因組圖譜,又稱“炎黃一號”。這是第一個亞洲人全基因序列圖譜。
此前,中國科學家承擔了國際人類基因組計劃1%的任務、國際人類單體型圖譜10%的任務。而隨著測序技術新的進步,極大加速了解碼生命的進程,成本降低了幾個數量級,時間也大為縮短。在此前提下,該合作研究團隊提出了“炎黃計劃”,即繪製中國人基因組序列圖譜和多態性圖譜的研究設想。
在研究人員看來,不同族群的基因圖譜必不可少。因為遺傳保證了生命的延續,而突變產生了不同物種以及人與人之間的差異。不同族群便有著各自獨特的遺傳背景,對不同病的易感性也可能不一樣。只有真正了解基因與疾病的關係,才能根據每個個體的基因進行疾病預測和檢測,及早做出預防方案或進行針對性治療。
由此,到2007年10月初,科學研究人員用新一代測序技術獨立完成了第一個100%中國人基因組圖譜。專家表示,這項在基因組科學領域里程碑式的科學成果,對於中國乃至亞洲人的DNA、隱形疾病基因、流行病預測等領域的研究具有重要作用。而科學研究人員也規劃好了下一步研究工作,將是進行上百個乃至更多的個體基因組分析,發現亞洲人基因組多態性的規律。
MHC指某一物種的某一號染色體(如人HLA在第6號染色體,小鼠H-2在17號染色體)上一組密切連鎖的基因,它在主要組織相容性抗原識別以及清除外來和內在抗原起重要作用。人的MHC稱為HLA,在小鼠稱為H-2。其餘靈長類和某些非靈長類動物的MHC有了新的命名規定與建議,原MHC的后兩個字母HC改為小寫,即Mhc。
各種動物MHC的作用基本相似,包括:⑴MHC編碼的抗原廣泛分佈於淋巴細胞和其它有核細胞的表面,與同種內移植排斥有關,也是刺激混合淋巴細胞反應(MLR)和移植物抗宿主反應(GVHR)的主要刺激抗原;⑵控制機體對抗原的免疫應答或免疫抑制,以及免疫活性細胞之間相互作用;⑶編碼補體系統中的某些組分;⑷ MHC中某些抗原出現的頻率與對某些疾病的易感性有關。
小鼠的組織相容性抗原有幾十種以上,由常染色體H-1、H-2、H-3……、H-30等基因編碼(H表示組織相容性histocompatibility),此外,還受小鼠性染色體基因(雄性為XY,雌性為XX)控制。其中H-2抗原為小鼠主要組織相容性抗原系統,而其他抗原均系次要組織相容性抗原系統。MHC在小鼠即為H-2,對H-2系統研究得較為清楚,位於第17對染色體內,長度約佔0.5分摩。H-2抗原具有高度多態性。用血清學方法檢出H-2Ⅰ類抗原特異性在100個以上,可分為私有抗原(private antigen)和公有抗原(public antigen)。私有抗原是某一近交系(inbred strain)小鼠特有的抗原標誌,在某一特定近交系小鼠只能檢出一個K區和一個D區的私有抗原。公有抗原是在不同品系小鼠中都可檢出的一些交叉抗原,每一品系小鼠通常都可檢出多個公有抗原特異性。根據血清學檢定抗原的反應格局,可將近交系小鼠分為不同單體型的品系,用H-2右上方小寫的英文字母表示,如H-2?x、H-2?d和H-2b等。
H-2基因群中可分為K、I、S和D四個區,I區又可分為I-A、I-E等亞區。按其編碼抗原結構和功能不同,又可將H-2複合體分為三類基因:⑴Ⅰ類基因,位於K區和D區,包括K、 D基因座,又增加了K2、L和L2(?)新的基因座;⑵Ⅱ類基因,位於I區,包括Aβ、Aα、Eβ和Eα等基因座;⑶Ⅲ類基因,包括補體C4、C2、Bf和編碼雄性激素結合蛋白性限蛋白 (sex limited protein, Slp)基因座(圖6-1)。由於小鼠H-2基因群含有Ⅰ(羅馬字)類基因,不同區中有I(英文大寫)區,應注意鑒別,切勿混淆。此外,H-2中有些基因位於Qa和TL區,可能參與H-2多態性的形成以及TCRγδ T細胞識別抗原時的遺傳限制。
在人類MHC稱為HLA(human leucocyte antigen),是迄今為止所知的人類最複雜的基因族。除成熟的紅細胞外,HLA抗原幾乎分佈於人體的各種有核細胞以及血小板。由於此組抗原首先在人外周血白細胞上發現,同時表達抗原水平較高,多採用外周血淋巴細胞來測這類抗原的型別,故稱為人類白細胞抗原(HLA)。
至1991年底,HLA基因座位已確定近60個,正式命名的等位基因278個。這些基因分類的方式主要有以下兩種。⑴傳統的分類法,即把HLA分為與小鼠H-2相似的Ⅰ類、Ⅱ類和Ⅲ 類基因,⑵1991年Bodmer建議將它重新劃分的三類:第一類包括傳統分類中的HLA-Ⅰ類和Ⅱ類,還包括一對DMA和DMB;第二類稱為免疫功能相關基因,包括C4、Bf、C2、TNFA、TNFB、HSP70、TAP1、TAP2、LMP2和LMP7等;第三類是一些與上述無關的基因。本章仍按傳統分類法進行討論。
HLA占第6號染色體很窄的一個區帶,估計占人體整個基因組的1/3000,長約3500kb。
利用交換率越大基因座位距離越遠,交換率越小基因座位距離越近的原理,可以通過交換率的計算作基因圖,經過家譜分析和交換率的計算作基因圖,A-B座位的交換率為0.8分摩 (centi Morgan, cM。是基因交換率在基因圖上的圖距單位,重組頻率在1%的兩個連鎖基因之間的距離為1cM),A-C為0.6cM,B-C為0.2cM,B-D為0.8cM,HLA基因群全長距離約為4cM。
自1964年以來,每隔3~4年召開一次國際組織相容性工作討論會(International Histocompatibility Workshop, IHW),於1991年11月在日本橫濱召開,並預定於1995年在法國召開第12次IHW。經過這些會議陸續報告了HLA的許多基因及大量的等位基因。現知在HLA-Ⅰ類基因區中,除已知的HLA-A、-B、-C座位外,還發現了-E、-F、-G,-H和-J,新發現的這些Ⅰ類基因座位大多數為偽基因。A座位已發現等位基因41個,B座位61個, C座位18個,E座位4個。在HLA-A與-E之間可能存在著重組熱點。在HLA-Ⅱ類基因中,已發現了近30個基因座位,等位基因更多,其中DR、DQ、DP均由一條A鏈與一條B鏈組成異源二聚體分子(參後述),而A鏈基因與B鏈基因及其等位基因為數甚多,後者如DRB1座位60個,DRB3座位4個,DRB5座位4個,DRB6座位3個;DQA1座位14個,DQB1座位19個;DPA1座位8個,DPB1座位38等等。DRA編碼DRα鏈;DRB1編碼β1鏈,決定的特異性為DR1、DR2、DR3、DR4、DR5等; DRB2為偽基因;DRB3編碼DRβ3鏈,決定DR52及Dw24、Dw25、Dw26等特異性;DRB4編碼DRβ4鏈,決定DR53特異性;DRB5編碼DRβ5鏈,決定DR51特異性; DRB6、B7、B8、B9均為偽基因。DQA1編碼DQα鏈;DQB1編碼DQβ鏈;DQA2、B2尚未得知其表達; DQB3為偽基因。DOB編碼DOβ鏈。DMA編碼DMα鏈;DMB編碼DMβ鏈。DNA編碼DNα鏈、DPA1編碼DPα鏈;DPB1編碼DPβ鏈;DPA2和DPB2為偽基因。此外與肽運轉至內質網有關的基因TAP1(transporter of antigen peptides)、TAP2和與抗原加工有關的基因稱之為低分子量多肽或稱大的多功能蛋白酶LMP2 (low molecular weight polypeptides or large multifunctional protease-2)、LMP7也位於Ⅱ類基因區。Ⅲ類基因區包括補體C2、C4、B因子,此外, 21羥化酶A與B、HSP70(heat shock protein70,熱休克蛋白70)和腫瘤壞死因子α、β基因也在這裡。21A是假基因,21B具有編碼21羥化酶功能。21羥化酶是腎上腺皮質合成皮質醇和醛固醇必不可少的酶,如此酶缺乏,可導致先天性腎上腺皮質增生症。
HLA和H-2基因的比較見圖6-5。小鼠H-2的Tla為存在於胸腺細胞和某些胸腺白血病細胞上的抗原(thymus-leukemia antigen); Tla與H-2D之間還有Qa區。Qa區中有17個Qa基因,還有12個Qa基因在Tla區,但大部分Qa基因是靜息基因(silent gene)。已測得6個Q基因有表達,其中Qa2、Qa3、Qa4、Qa5由Qa區基因編碼,Qa1和Qa6由Tla區編碼。
已確定的HLA血清學抗原共有161個,其中A有27個,B有59個,C有10個,D有26個, DR有24個,DQ有9個,DP有6個。C座位上的抗原編號是公認的,為了避免與補體C相混淆特標以“W”。某些抗原數字后帶有括弧的抗原編號,表示括弧前的抗原為括弧內抗原的裂解產物,如A23和A24是A9抗原的裂解產物(表6-4)。
1.HLA的家系遺傳 HLA單體型可作為一個單位遺傳給子代。a、b、c、d是雙親或子代HLA單體型的代號;1、2、3是HLA-A抗原,?為未檢出HLA-A抗原;5、7、8、12是HLA-B抗原。
基因頻率和基因平衡定律 基因頻率指在群體中某一等位基因出現的機率與該群體全部等位基因 之比。基因平衡定律指如果群體足夠大又是隨機交配,在沒有新的突變和自然選擇的情況下,基因頻率 可以世代維持不變。HLA基因頻率亦符合這一定律。在群體中,一個抗原頻率反映了控制這一抗原的基因頻率。
HLA 中的基因之間也有一定的交換和重組機率,一般取決於兩個基因之間的距離。但HLA多基因座組成的單體型並非完全隨機,有些基因比其它基因更多地連鎖在一起,稱為連鎖不平衡(linkage disequilibrium)。換句話說,實際觀察到的兩個或更多基因出現在同一條單倍體上的頻率大於按照獨立分配規律所預期的頻率。如在白種人中A1的基因頻率為0.12,B8的基因頻率為0.17, A1和B8基因出現在同一條單倍體上的預期頻率為0.12×0.17=0.02,但實際觀察到的頻率為0.09。HLA 的連鎖不平衡與對某些疾病的易感有關。
已被檢出的眾多的HLA抗原在不同人種甚至不同地區的人群中的分佈存在著很大的差別。如白種人HLA-A1、A3、D8檢出率較高;黃種人以A24、B46、B54的檢出率較高,黑種人以HLA-A36、A43、B53檢出率最高。在單體型的檢出率也同樣有差別,如北歐人以HLA-A1、B8,HLA-A8、B7兩個單體型最常見,黃種人以HLA-A9、B15和HLA-A2、B空白抗原的單體型較常見,中國漢族人以HLA-A2、B46,HLA-A11、B40和HLA-A2、B40單體型最常見。在研究HLA系統與疾病之間的關係時必須與所研究同一地區正常人群作為對照。
2.HLA的多態性(polymorphism)現象 多態性指在同一相互交配的群體中,同一基因座可編兩種以上的基因產物。HLA的多態性主要是由於復等位基因和共顯性所致:⑴復等位基因(multiple alleles),位於一對同源染色體上對應位置的一對基因叫等位基因。由於群體的突變,同一基因座的基因系列稱為復等位基因,對某一個體來說一個基因座只有一對等位基因,復等位基因是群體的概念。HLA存在為數眾多的復等位基因。⑵共顯性(codominant),共顯性狀態就是每一世代中無論是純合狀態還是雜合狀態,這一對等位基因所控制的性狀都能表現出來,HLA每個基因座上的等位基因都是共顯性的。