基因組

生物體所有遺傳物質的總和

徠在分子生物學和遺傳學領域,基因組是指生物體所有遺傳物質的總和。這些遺傳物質包括DNA或RNA(病毒RNA)。

簡介


在生物學中,一個生物體的基因組是指包含在該生物的DNA(部分病毒是RNA)中的全部遺傳信息,又稱基因體(genome)。基因組包括基因和非編碼DNA。1920年,德國漢堡大學植物學教授漢斯·溫克勒(Hans Winkler)首次使用基因組這一名詞。
更精確地講,一個生物體的基因組是指一套染色體中的完整的DNA序列。例如,生物個體體細胞中的二倍體由兩套染色體組成,其中一套DNA序列就是一個基因組。基因組一詞可以特指整套核DNA(例如,核基因組),也可以用於包含自己DNA序列的細胞器基因組,如線粒體基因組或葉綠體基因組。當人們說一個有性生殖物種的基因組正在測序時,通常是指測定一套常染色體和兩種性染色體的序列,這樣來代表可能的兩種性別。即使在只有一種性別的物種中,“一套基因組序列”可能也綜合了來自不同個體的染色體。通常使用中,“遺傳組成”一詞有時在交流中即指某特定個體或物種的基因組。對相關物種全部基因組性質的研究通常被稱為基因組學,該學科與遺傳學不同,後者一般研究單個或一組基因的性質。

種類


病毒

病毒基因組可以由RNA或DNA組成。 RNA病毒的基因組包含單鏈或雙鏈RNA,也包含一種或多種單獨的RNA分子。 DNA病毒基因組可以是單鏈或雙鏈DNA。大多數DNA病毒基因組由單個線性DNA分子組成,但有些由DNA病毒基因組由環狀DNA分子組成。

原核

原核生物和真核生物基因組由DNA組成。古細菌有一個環狀染色體組成的DNA基因組。大多數細菌也有一個環狀染色體,然而,一些細菌物種含有線性染色體 或多個染色體。大多數原核生物基因組中不含有重複DNA 。一些共生細菌基因組種含有高比例的假基因,例如Serratia symbiotica基因組種只有約40%的DNA編碼蛋白質。一些細菌基因組還含有輔助遺傳物質,它們在質粒中存在。為此,基因組這個詞不應該用作染色體的同義詞。

真核

真核基因組由一條或多條線性DNA染色體組成。組成真核生物基因組的染色體的數量差異很大,傑克跳線螞蟻和無性線蟲的基因組每個只有一對染色體,而蕨類物種有720對染色體。人類細胞具有22對常染色體和1對性染色體。
除了細胞核中的染色體外,真核生物的細胞器如葉綠體和線粒體都有自己的DNA和染色體,因此,也有“線粒體基因組”和“質體基因組”的說法。與它們來源的細菌一樣,線粒體和葉綠體都含有環狀染色體。
與原核生物不同,真核生物具有蛋白質編碼基因的外顯子 -內含子組織和一定數量的重複DNA。哺乳動物和植物基因組的大多數由重複DNA組成。
編碼序列
攜帶合成蛋白質遺傳信息的DNA序列是編碼序列。不同物種中編碼序列占基因組的比例差異很大。較大的基因組不一定含有更多的基因,並且複雜真核生物中非重複DNA的比例隨著基因組大小的增加而減少。簡單的真核生物如秀麗隱桿線蟲和果蠅中,編碼DNA比例高於重複DNA ,而更複雜真核生物基因組則往往主要由重複DNA組成。一些植物和兩棲動物基因組中重複DNA的比例超過80% 。同樣,人類基因組中只有2%編碼DNA。
非編碼序列
非編碼序列包括內含子,非編碼RNA的序列,調控DNA和重複DNA。人類基因組的98%屬於非編碼序列。基因組的重複DNA有串聯重複序列和分散重複序列。
轉座子
轉座子(TEs)是具有特定結構的DNA序列,它們可以在基因組中跳動,位置不固定。I類TE通過複製和粘貼機制跳動位置,II類TE從基因組中切除並插入新位置。
TE的運動是真核生物基因組進化的驅動力,因為它們的插入可以破壞基因功能,TE之間的同源重組可以導致基因的複製,TE還可以將外顯子和調節序列改組到新的位置。
反轉錄轉座子
反轉錄轉座子可以轉錄成RNA,然後在另一個位點被複制到基因組中。反轉錄轉座子可分為長末端重複序列(LTR)和非長終端重複序列(非LTR)兩大類反轉錄轉座子。

大小

基因組大小是一個拷貝的單倍體基因組中DNA鹼基對的總數。
基因組大小與原核生物和低等真核生物的形態複雜性呈正相關。然而,在軟體動物和上述所有其它高等真核生物之後,這種相關性已不再存在,主要是因為重複DNA的緣故。

改變

徠生物體所有細胞都源自同一個單細胞,因此它們應該具有相同的基因組。但是,在某些情況下,細胞間會出現差異。細胞分裂期間的DNA複製和環境誘變劑的作用都可導致體細胞發生突變。在某些情況下,這種突變會導致癌症,因為它們會導致細胞更快地分裂並侵入周圍組織。在減數分裂期間,二倍體細胞分裂兩次以產生單倍體生殖細胞。在此過程中,重組導致遺傳物質從同源染色體重新洗牌,因此每個配子具有獨特的基因組。

進化

基因組不僅僅是生物體基因的總和,基因組還含有其它可以考慮特定基因及其產物的特徵。
複製在基因組的塑造過程中起了重要作用。複製的範圍包括短串聯重複序列的延伸、基因簇的複製、整個染色體甚至整個基因組的複製。這種複製可能是創造遺傳新性狀的基礎。

遺傳變異


基因組
基因組
必須指出僅有一個基因組並不能獲得物種的遺傳差異或遺傳多態性。例如,原則上講,人類基因組序列可以僅僅從某個個體的一個細胞的一半DNA中測定。要知道是哪些DNA變異導致特定性狀或疾病則需要進行個體間比較。這一點也解釋了通常使用“基因組”(與通常使用“基因”相提並論)不僅僅指某特定DNA序列,也指某物種整個家族的序列。
儘管這個概念看上去與直覺相抵觸,其實這與說沒有任何一個特定的形狀是印度豹的形狀是相同的概念。印度豹形狀各異,它們的基因組序列也並不相同。然而各動物個體和它們的序列都有共性,因此可以從單一實例中來了解印度豹和“豹性”。

最小基因組


既然基因組和相應生物體如此複雜,一種研究策略就是減少基因組中的基因數目至最小但仍可以使生物體理論上可以生存。對於單細胞生物多細胞生物最小基因組的實驗研究已經開展。這些工作在體內和體外進行。通過理解最小生物體的功能,然後不斷增加其複雜性,從而理解諸如癌症等多細胞疾病。

基因組計劃


人類基因組計劃旨在對人類基因組繪製物理圖譜並測序。其他基因組計劃包括小鼠,水稻,擬南芥,河豚和細菌(如大腸桿菌)等。通過各種基因組計劃,許多基因組已被測序。測序費用一直在降低,可能最終測序單個基因組只需要幾千美元。

大小的比較


生物基因組大小(鹼基對)
病毒, 噬菌體Φ-X174;5387 - 最早完成測序的基因組
病毒, 噬菌體λ5×104
細菌, 大腸桿菌4×106
變形蟲, 無恆變形蟲(Amoeba dubia)67×1010 - 2005年12月已知的最大基因組
植物,一種貝母(Fritillary assyriaca13×1010
真菌,釀酒酵母2×107
線蟲, 秀麗隱桿線蟲8×107
昆蟲, 黑腹果蠅2×108
哺乳動物, 人3×109
註:一個人類細胞的DNA長度約為1.8米。

特點


真核生物、原核生物和病毒的基因組有不同的特點。

真核生物

1.基因組較大。真核生物的基因組由多條線形的染色體構成,每條染色體有一個線形的DNA分子,每個DNA分子有多個複製起點;
2.不存在操縱子結構。真核生物的同一個基因簇的基因,不會像原核生物的操縱子結構那樣,轉錄到同一個mRNA上;
3.存在大量的重複序列。真核生物的基因組裡存在大量重複序列,通過其重複程度可將其分成高度重複序列、中度重複序列、低度重複序列和單一序列;
4.有斷裂基因。大多數真核生物為蛋白質編碼的基因都含有“居間序列”,即不為多肽編碼,其轉錄產物在mRNA前體的加工過程中被切除的成分;
5.真核生物基因轉錄產物為單順反子;
6.功能相關基因構成各種基因家族。

原核生物

1.基因組較小,通常只有一個環形或線形的DNA分子;
2.通常只有一個DNA複製起點;
3.非編碼區主要是調控序列;
4.存在可移動的DNA序列;
5.基因密度非常高,基因組中編碼區大於非編碼區;
6.結構基因沒有內含子,多為單拷貝,結構基因無重疊現象;
7.重複序列很少,重複片段為轉座子;
8.有編碼同工酶的等基因;
9.基因組的大部分序列是用來編碼蛋白質的,基因之間的間隔序列很短;
10.功能相關的序列常串連在一起,由共同的調控元件調控,並轉錄成同一mRNA分子,可指導多種蛋白質的合成,這種結構稱操縱子。

病毒

1. 不同病毒基因組大小相差較大;
2.不同病毒基因組可以是不同結構的核酸;
3. 除逆轉錄病毒外,通常為單倍體基因組;
4.有的病毒基因組是連續的,有的病毒基因組分節段;
5. 有的基因有內含子;
6. 病毒基因組大部分為編碼序列;
7. 基因重疊。

研究


2015年3月,中科院昆明動物所和深圳華大基因國家基因庫的研究人員成功破譯了高山倭蛙基因組,這是迄今為止破譯的全世界首個現代蛙類基因組,也是目前破譯的全世界第二個兩棲動物的基因組。此次研究為兩棲動物進化研究提供了新線索,相關研究成果在美國科學院院刊(PNAS)雜誌在線發表。