分子人類學

分子人類學

分子人類學是人類學的分支,利用人類基因組的分子分析以及DNA遺傳信息來分析人類起源、民族演化、古代社會文化結構等多方面多層次的問題,是一門新興交叉學科。

基本介紹


分子人類學(Molecular Anthropology)是人類學的分支,主要方法是比較DNA或蛋白質序列,早期方法亦包括血清學的比較研究。通過檢查不同特定住民的DNA序列,科學家能判斷特定住民之間或之內的親屬關係。人類學家們根據基因序列的特定相似處判斷不同的人群是否屬於同一基因組(haplogroup),以及是否發源自同一個地方。這就得以幫助人類學家跟蹤遷徙和定居的模式,去發現現代人類如何形成和發展的。2002年,中國第一所研究分子人類學的學術機構復旦大學現代人類學研究中心正式成立。
分子人類學
分子人類學
在過去分子人類學還沒有興起的年代,研究歷史探尋民族起源只能靠有限的史料和考古發現來大概推測,這是非常具有局限性的。尤其是史料,是非常有限的,也未必是真實的。所以,分子人類學的興起將大大打破這些局限,向人們揭示一個更真實更準確的歷史,從而更加清晰地分析一個民族的起源。分子人類學用DNA材料和計算生物學方法解答了很多人類學的問題。
人類分子遺傳學的研究成果支持人類走出非洲(Out of Africa)的學說,即生活在地球上的現代人類均是約5-10萬年前走出非洲的史前人類的後裔。Y-染色體單倍群及線粒體SNP研究表明,定居於東亞地區的現代人類,其祖先在離開東非洲後進入阿拉伯半島,沿印度洋海岸線進入東南亞地區(包括我國雲南),後來逐漸向北部內陸地區擴張,即東亞人群遷徙由南到北的“南線”(Southern route)假說。與此同時,還有“北線”(Northern route)假說,即史前人類大約在5-6萬年前從北非進入地中海東部地區,然後沿東西走向分別進入中亞和歐洲。

與人類起源論


分子人類學技術大量應用於人類學和考古學研究領域,在人類起源與演化、人群的遷徙與交流、人群間的親緣關係,以及考古鑒定等方面發揮著越來越大的作用。1987年,英國《自然》(Nature)周刊上刊登了美國加州大學伯克利分校三位分子生物學家卡恩(R. L. Cann)、斯通金(M. Stoneking)和威爾遜(A. C. Wilson)的《線粒體DNA與人類進化》(Mitochondrial DNA and human evolution)一文,他們選擇了其祖先來自非洲、歐洲、亞洲、中東,以及巴布亞紐幾內亞和澳大利亞土著共147名婦女,從她們生產後嬰兒的胎盤細胞中成功地提取出mtDNA,並對其序列進行了分析,根據分析結果繪製出一個系統樹。由此推測,所測定的嬰兒mtDNA可以將所有現代人最後追溯到大約29萬~14萬年,平均20萬年前生活在非洲的一位婦女。她就是今天生活在地球上各個角落的人的共同“祖母”。其後,又根據mtDNA發生突變的速率計算出非洲人群分化出世界其他人群的大致時間,為大約18萬~9萬年,平均約13萬年前。認為在大約13萬年前,這個“祖母”的一群後裔離開了他們的家園非洲,向世界各地遷徙擴散,並逐漸取代了生活在當地的土著居民直立人的後裔早期智人,從此在世界各地定居下來,逐漸演化發展成現在的我們。這就是著名的現代人起源的“夏娃假說”。
2000年美國斯坦福大學昂德希爾(P. A. Underhill)等利用變性高效液相層析技術,分析得到218個Y染色體非重組區位點構成的131個單倍型,對全球1062個具有代表性的男性個體進行研究,同樣根據分析結果繪製出一個系統樹。Y-DNA系統樹所展示的結果與mtDNA系統樹的結果非常相似。歐洲和亞洲等世界其他現代人群都起源於非洲,而美洲和澳洲現代人群又都起源於亞洲人群。這就是與“夏娃假說”相互應徵的“亞當假說”。同樣根據Y-DNA發生突變的速率計算出非洲人群分化出世界其他人群的大致時間在14萬~4萬年,平均約6萬年前。
1997年7月,美國《科學》(Science)周刊發表了一篇文章,引起學術界一片喧囂。德國慕尼黑大學的分子生物學家克林斯(M. Krings)等,對1856年發現於德國杜塞爾多夫城尼安德特峽谷的距今大約6萬年左右的尼安德特人化石,進行了mtDNA的抽提和PCR擴增,並對提取出的DNA進行了測序。發現尼人的mtDNA序列中有12個片斷與現代人類的完全不同,尼人的mtDNA處在現代人類的變異範圍之外,推算得出的分化時間在30萬年以上。而歷史上尼人和現代人的並存歷史在10萬年以內,如果這兩個人種之間有直接傳承關係,其差異應該不超過10萬年。由此推測,尼人不可能是現代人類的直系祖先,他們根本就沒有將其血緣遺傳給現代人類,只成為人類演化史上的一個旁支。這一研究結果支持“現代人起源於非洲的假說”。這一科學發現曾被評為1997年世界十大科技成就之一。其後,又有科學家成功地從出土於高加索和克羅埃西亞的尼安德特人化石中提取了mtDNA序列,同樣得出尼人與現代人沒有遺傳聯繫的結論。
褚嘉佑等14位中國學者1998年在《美國科學院學報》(Proceedings of the National Academy of Sciences of the United Sates of America,PNAS)上發表了一篇文章也支持現代人起源於非洲的觀點。他們利用30個常染色體微衛星位點(由2-6個鹼基重複單位構成的DNA序列),分析了包括中國漢族和少數民族的南北人群在內的28個東亞人群的遺傳結構,結果支持現代中國人也起源於非洲的假說。並且認為現代中國人群是由東南亞進入中國大陸,而非通過中亞移民過來的。但是由於樣本量較少、群體代表性不強,且微衛星位點突變率較高,對追溯久遠事件有一定局限性等原因,褚嘉佑等人的工作對證明東亞人群起源於非洲的觀點還不十分令人信服。
1999年,宿兵等人對包括中國各省份的漢族和少數民族,以及東北亞、東南亞、非洲、美洲和大洋洲總共925個個體的不同人群,利用19個Y-SNP(Y染色體單核苷酸多態位點)構成的一組Y染色體單倍型,系統地研究了包括中國各人群在內的現代東亞人的起源和遷徙。結果顯示包括中國各人群在內的所有現代東亞人群的Y-SNP單倍型均來自較晚發生的突變,而更早的類型僅存在於非洲。因此認為,現代東亞人全部來自於非洲的某個古代類型。而且,東亞人群的遷徙是從東南亞進入到中國的南方,再向北遷移逐漸擴散到中國各地區及東北亞,並有可能完全取代了生活在當地的原土著居民,而成為該地區的新居民。
對於經過漫長跋涉由非洲遷徙而來的這些現代人群,是完全取代了生活在東亞大陸上的原土著居民成為東亞地區的新居民,還是與當地的土著居民有著某些程度的融合,兩者共同對現在的我們有遺傳貢獻呢?這個問題也令許多科學家有非常濃厚的興趣。他們基於這樣一個假設,即從非洲遷徙而來的現代人群並沒有在群體上完全取代當地土著居民,當地土著居民也可能有少量的基因遺傳下來,在以上實驗的基礎上擴大東亞地區的樣本量,來看這些當地土著居民的可能貢獻率或不完全取代的可能性有多少?這些遺留下來的基因又有可能保留在現代哪些人群中?
2001年,柯越海等人對來自中國各地區近12 000份男性隨機樣本進行了M89、M130和YAP三個Y染色體單倍型的分型研究。所選擇的三個Y染色體非重組區的突變型M89、M130和YAP均來自另一個Y染色體單倍型M168。M168突變型是人類走出非洲並擴散到非洲以外其他地區的代表性突變位點,它是所有非洲以外人群Y染色體的最近的共同祖先,所以M168是現代人類單一起源於非洲的最直接證據,在除非洲以外的其他地區沒有發現一例個體具有比M168更古老的突變型。該項研究結果顯示萬份樣品無一例外具有M89、M130和YAP三種突變型之一,並沒有發現個體攜帶有以上三種Y-SNP突變型之外的類型,也沒有發現同時具有M89、M130和YAP突變中任意兩個以上突變的個體,這一結果與非洲以外的世界其他地區的基因型分型結果是一致的。在所檢測的所有中國12000份樣品中全部都攜帶有來自非洲的M168突變型的“遺傳痕迹”,因此認為,Y染色體的證據並不支持中國現代人獨立起源的假說,而支持包括中國人在內的東亞現代人起源於非洲的假說。
其後,又有一些遺傳學研究,特別是通過對Y染色體、線粒體DNA、常染色體及單核苷酸多態性等多種遺傳標記和分型手段對東亞人群的廣泛研究,結果都證明東亞現代人具有共同的非洲起源特徵。通過對Y-DNA單倍型的變異速率推算出大致在距今約6萬~1.8萬年前,最早的一批走出非洲的現代人經由東南亞地區最先進入東亞的南方,隨著東亞冰川期的結束,逐漸北上擴散至東亞大陸。而另外一支則沿著東南沿海從東南亞大陸向東逐漸進入太平洋群島。

單倍體遺傳點


男性和女性攜帶有兩套連續遺傳機制。第一套是Y染色體在男性間的遺傳,從父到子。第二套連續遺傳機制是線粒體DNA,即mtDNA在女性之間進行遺傳。只有非常特殊的情況下,mtDNA在男性間進行遺傳。

線粒體DNA

線粒體存在於細胞質里,是細胞的“能量工廠”,它們包含少量遺傳物質---DNA。每個人的線粒體都來自母親。與作為基因組的染色體DNA不同,線粒體DNA的優點在於它不會進行重組。DNA重組過於頻繁就喪失追溯到父系源流的能力。而線粒體DNA卻是在不斷克隆自身,只會接受極少的父系mtDNA。線粒體DNA不但所處的位置與細胞核DNA不同,遺傳方式也迥然有別--它測定線粒體DNA是追蹤母系血親的惟一辦法。線粒體DNA的另一點優勢在於,高度變化區域的進化快速,顯示線粒體DNA的某些染色體領域趨於局外中立。因此線粒體DNA還被當作一種特殊的“鍾”,用來估計家系大約是在多久之前彼此分離的。因此線粒體是從母系遺傳的角度研究人類進化的重要工具,就像Y染色體是研究父系遺傳的工具。同時,線粒體基因組是獨立於核基因組的遺傳物質,它普遍存在於真核細胞中,線粒體內包含有DNA和轉錄與轉譯系統,是具有一定自主性的細胞器。線粒體基因組具有的獨特優點:線粒體DNA分子小、拷貝數高; 結構和組織簡單而高度保守; 母系遺傳,缺乏重組; DNA突變率高。線粒體DNA跟RFLP的原理是一樣的,只不過目的DNA由基因組DNA變為線粒體DNA。
除男性精子細胞外,人身體所有細胞裡面都有線粒體,但只有女性的線粒體基因能隨其卵子遺傳給後代。mtDNA是Mitochondrial DNA(線粒體DNA)的縮寫,是承載線粒體遺傳密碼的物質。男人線粒體只伴隨此男人生活一生,然後終結,不能遺傳給後代。mtDNA表現為母系遺傳。mtDNA結構類型是反映母系脈絡的重要指標。通過檢測現代人mtDNA,能弄清各民族、各地人的母系血緣關係。通過檢測古屍線粒體,可弄清歷史上各個民族間的母系血緣關係、歷史故事、遷徙路線、歷史名人的民族、身份。
母親給兒女貢獻了50%的遺傳基因,對兒女遺傳特性有著和父親一樣的影響力。古代一夫多妻,有時搶掠戰敗民族女性為妻為妾。勝族由於不適應敗族地區氣候地理條件,一般打完勝仗帶著搶來的妾返回祖籍並共同生活生育兒女。異族妻妾生育的孩子雖有一半異族基因,但文化上被視作其父民族的人。兒子長大後繼續到異族領地搶掠妻妾,生育的孫子輩已有75%異族血統,但仍被視作屬於其爺爺民族的人。雖然孫子的Y染色體仍然和爺爺的一樣類型,但其母系線粒體mtDNA,以及身體常染色體已和其爺爺的大不相同。如此不斷循環,導致民族的文化、語言雖然還是祖先的,但若干代后民族人口的血統、基因已發生很大改變。
因此,一個民族、地區人群的母系線粒體mtDNA結構類型和構成比例,比父系Y染色體更能反映其遺傳和血統特性。

Y染色體

Y染色體存在於細胞核中,即細胞核DNA(nDNA)。與mtDNA不同的是,Y染色體在非重組區域存在交換。
基因的本質是DNA鏈上有功能的片斷,它參與蛋白質等的合成,最終決定了生物的特徵,它的多樣性也決定了生物界的多樣性。此外,DNA鏈上還有更多沒有具體表達功能的片斷,這些片斷不受自然選擇壓力的影響,可以勻速自由地突變,更忠實地記載了人群進化的歷史。
DNA大部分存在於生物體細胞的細胞核內,此外,在細胞核以外的其他地方也有少量的DNA分子存在,如線粒體內存在線粒體DNA(mtDNA),植物的葉綠體內存在葉綠體DNA。在男性精子中線粒體位於精子的尾部。在受精的時候,精子只有頭部進入卵子的體內,尾部則自然脫落,因此,子女的mtDNA只來源於母親,呈現隨母系遺傳的方式。而父系遺傳的最典型代表則是存在於男性精子細胞核中的Y染色體(Y-DNA),卵子沒有Y染色體。也即mtDNA只在母親和女兒之間傳遞,呈嚴格的母系遺傳;Y-DNA只在父親和兒子之間傳遞,呈嚴格的父系遺傳。
在分子人類學研究中,mtDNA和Y-DNA的研究在探究人類歷史以及不同人群之間的淵源關係有很大的優勢:mtDNA和Y-DNA均呈單倍體,無重組,這一特點可以使它們能夠完整地保存母系或父系祖先的遺傳信息,容易構建譜系樹;mtDNA和Y-DNA的遺傳呈單系遺傳,可直接追蹤母系或父系遺傳的歷史;mtDNA和Y-DNA的有效群體大小為常染色體的1/4,一方面使mtDNA和Y-DNA能在較短時間內積累比較多的突變,另一方面容易形成人群特異的遺傳標記,提高了mtDNA和Y-DNA在進化研究中的信息量和解析度。

DNA遺傳


線粒體只會遺傳自母親,以哺乳類而言,一般在受精之後,卵子細胞就會將精子中的線粒體摧毀。 1999年發表的研究中顯示,父系精子線粒體(含有mtDNA)帶有泛素(ubiquitin)標記,因而在胚胎中會被挑選出來,進而遭到摧毀。不過某些細胞外的人工受精技術可直接將精子注入卵子細胞內,可能會幹擾摧毀精子線粒體的過程。
由於母系遺傳的特性,使得研究者能夠藉由線粒體DNA追溯到母系族譜(與之相對的為專門用來追溯父系族譜的Y染色體),但最近科學家發現的線粒體DNA重組特徵對線粒體夏娃概念提出了挑戰。
由於mtDNA並非高度保守,而是擁有較快的突變速率,因此可用來研究種系發生學,生物學家挑選少量不同物種的基因,分析其序列的保留與變異程度,可建立出演化樹。

假設


線粒體DNA用於研究母系遺傳的前提在於,線粒體DNA不容易重組和改變。但分子人類學的理論還遠未成熟,分子數據應用在人類學問題時實際上常常被證實很難解釋,這是分子序列的比較方法引起的後果。比如研究人種A和人種B在進行分子進化率的時候,就必須選擇人種C進行參照,如果A和C之間的分子差別與B與C之間的差別類似,那麼就推論A和B的分子率類似。同時由於科學依賴於未來的發現不會與現有理論產生矛盾。實際上,目前的發現也有否定線粒體遺傳的假設,那麼當前學說很有可能在未來20年內被完全否定。所以對待分子人類學研究的結論必須審慎,不能盲從。

不可靠性重組


科學家認為,線粒體DNA分子是相對穩定的,不會互相交換DNA片斷,造成它們發生變化的唯一因素是自發變異。這種變異以相對穩定的速率進行並積累,可以作為“分子鐘”使用。兩個人的線粒體DNA的差異程度,就決定了這兩個人最近的母系共同祖先生活在多少年前。科學家曾經對世界不同地區和民族的女性進行線粒體DNA調查,確定現代人的線粒體來自於約15萬年前的一位女性,這位母系祖先被稱為“線粒體夏娃”。但在幾年前,人們發現了一個罕見的例外,一名男子的線粒體DNA中,有一部分來自於他的父親。為了檢驗線粒體DNA不會重組的假設是否正確,哈佛醫學院的科學家對這名男子和他的父母進行線粒體DNA序列比較。結果發現,有一些來自父親的線粒體DNA片斷混合在母系DNA中。進一步試驗表明,負責複製線粒體DNA的酶停止複製母親的DNA、跳到父親的DNA上從對應的位置開始複製時,就發生了線粒體DNA的重組。這一成果顯示,線粒體DNA可能並不那麼穩定,而會因為自發變異之外的原因發生改變。尋找人類母系祖先的研究,比人們原先認為的更複雜。
但美國科學家的新研究也顯示,有關線粒體的一個關鍵科學假設可能存在問題,使得追溯人類母系祖先所用的“分子鐘”不準確。美國哈佛醫學院科學家說,mtDNA分子也會發生DNA片斷交換和重組,這與此前人們所認為的不同。該成果發表在新一期美國《科學》雜誌上,可能對以前的一系列科研成果造成衝擊,涉及人類的進化、原始人類的遷徙,乃至各種人類語言之間的關係。

漢族先民


根據2007年研究,山西陶寺遺址的龍山文化居民中,上層貴族100%為O3類型,而根據2008年金力、李輝的數據,陝西仰韶文化的居民的Y染色體SNP類型也是O3,所以,我們可以清晰的看出,古代漢族先民,尤其是貴族,都是O3佔有絕對主體的,仰韶文化和龍山文化居民的Y染色體成分是基本相同的,種族上是同一成分。
O3是漢族的絕對主體,佔據非常重要的位置,根據2004年文波的數據,山東漢族為59.5%(110/185)、河南52%(26/50)、陝西漢族56.7%(51/90)、雲南漢族63.4%(59/93)、廣東漢族53.9%(34/64)、四川漢族57.1%(36/63)、浙江漢族是50.9%(54/106),張詠莉2002年福建漢族的為58.8%(47/80),2006年Hammer的數據北方漢族65.9%(29/44)、台灣漢族49/84(58.3%)(注意這個數據和張詠莉2002年福建漢族的58.8數據幾乎一樣,類似的還有Nonaka的台灣漢族,183個裡106個O3,比例58.2%,福建閩南漢族和台灣漢族數據高度一致),XUE的2006年數據,哈爾濱漢族O3頻率是68.6%(23/35),Lu chuncheng的數據中南京漢族為53.6%(429/800)、馬明義的數據中四川漢族61.8%(211/341)2007年Zhou ruixia的數據,甘肅71.3%(62/87),所有數據中,除了河北人83.3%(10/12)由於樣本太少外,根據2003年李輝的數據顯示,福建長汀客家人中O3的比例高達74.3%(110/148)。還有一個類似的數據,是2002年李輝在《廣西六甲人來源》一文中的數據,為77.8%,(21人/27人)。
總體上看,所有漢族中,O3都是主體的,不同的取樣可能造成數據有波動,但總體出現頻率大部分一般在50-70%之間,雖然幅員遼闊人口眾多,但漢族內部卻表現出了驚人的一致,顯示了漢族的共同起源。
今天12億漢族的絕大多數,都是5000年前中原原始居民的直系後代。主體是仰韶文化和龍山文化的O3(兩種文化居民的父系成分相同),O3也就是來自中原仰韶文化和龍山文化的居民構成了各地漢族父系遠祖的壓倒性絕對多數,其次是河北的磁山文化的O1,紅山文化的O3、O2和O1,和良渚文化的O1,其次還有湖北大溪文化和江西吳城文化的O2a,今天廣闊的中國土地,仍然為5000年前中國遠古漢族先民的子孫所佔據。
隨著研究不斷深入,南線學說無法全面解釋現有東亞人群南北方的遺傳差異,以及北部地區檢測到的屬於中亞和歐洲地區的遺傳信號。對於“北線”假說是否成立,以及中亞及歐洲遺傳信號是否僅僅由於近期(而非史前)基因交流的結果,在之前缺少有力證據支持。
研究表明,東亞人群中存在4個主要Y-單倍群占檢測人數約93%,支持南線學說。重要的是,研究發現東亞確實存在中亞和西部歐亞的遺傳輸入(約7%)。對這些單倍群分別進行系統地理髮育分析發現,它們基本都表現出沿北線的末次冰川期后的人群擴張。尤其是Y染色體單倍群Q的一個亞分支Q1a1-M120,推測是史前人群沿北線遷移,途徑東亞北部留下的最好痕迹。Y染色體單倍群Q分佈在東歐、北歐、高加索、西亞、南亞、中亞、西伯利亞、美洲和東亞,但Q的分支Q1a1-M120局限性地分佈在東亞,主要是東亞北方人群,並且表現出了最高的多態性。另外,美洲的Q來源人群(Q1a3a)的祖先單倍群Q1a3*在東亞北部也有檢出。單倍群Q1a1-M120和Q1a3*-M346來源的個體表現出的共祖時間分別是1.54和1.78萬年。這些證據很好地支持了史前人群走北線的遷移方式,並且正是這種北線對東亞的人口輸入,加大了東亞南北方人群的遺傳差異。

人口移動


Genetic Evidence Supports Demic Diffusion of Han Culture,(“遺傳學證實漢文化的擴散源於人口擴張”)(Bo WEN, Hui LI, et al, Nature, No.431,September 2004, pp.302 - 305)
(英國的《自然》雜誌,與美國的《科學》和《細胞》雜誌被公認為世界自然科學界三個最頂級的學術刊物。)論文用基因學證據,論證了南北方漢族父系血統的相同起源,漢文化的擴散源於人口擴張,而不是所謂的"融合"。南北漢族的相貌體格的差異主要是母系差異和地理環境造成的。

南方漢族


據史料記載和考古發現,漢族起源於黃河流域,是從黃河流域不斷往南遷徙的。根據復旦大學的基因研究對照歷史遷移記錄,漢民族的擴張主因是歷史上的由北往南的人口移動,並非所謂的南方少數民族接受漢文化形成了南方漢族。南方漢族的父系近八成來自中原南遷的北方漢族,母系則近六成來自南遷的北方漢族。也就是說現代南方漢族主要成分是從中原南遷的北方漢族,而不是所謂的南方少數民族接受漢文化而形成了南方漢族。