組蛋白基因

組蛋白基因

組蛋白基因(histone gene) 組蛋白基因是已知的重複基因中唯一具有蛋白質編碼機能的基因。它們在DNA合成開始前短暫地表達,因而它們的活動與細胞周期密切相關。

概述


組蛋白基因(histone gene)組蛋白基因在各種生物體內重複的次數不一樣,但都在中度重複的範圍內。通常每種組蛋白的基因在同一種生物中拷貝數是相同的。雞的基因組中組蛋白基因有10個拷貝,在哺乳動物中為20拷貝,非洲爪蟾為40拷貝,而海膽的每種組蛋白的基因達300-600拷貝。不同生物中組蛋白基因在基因組中的排列不一樣,組蛋白基因沒有一定的排列方式,而在拷貝數高的基因組中(>100拷貝),大部份組蛋白基因串聯重複形成基因簇。

發育


海膽發育早期五種組蛋白基形成一個重複單位,每種組蛋白基因之間是非轉錄間隔區,5個間隔區均不相同。這樣的重複單位在整個基因組中重複300次以上,而且這些重複單位基本上是相同的。在海膽中,5種組蛋白基因的轉錄方向都是相同的,每種組蛋白基因獨立的產生自己的mRNA。非洲爪蟾卵細胞5S基因重複單位包括一個基因和一個假基因。在三種不同的海膽中,其組蛋白基因重複單位中非轉錄間隔區在長度和序列上差異是很大的,儘管它們的組蛋白基因的長度和序列相差不多。實際上,在同一種海膽內不同的組蛋白基因重複單位之間,相應的非轉錄間隔區也不是完全相同的。另外,在海膽胚胎髮育晚期,要由晚期組蛋白基因來編碼組蛋白,該基因與上述的早期組蛋白基因有輕微的差異,但該組蛋白基因不成簇排列,整個基因組僅有10個拷貝,呈散在分佈。
在果蠅和非洲爪蟾中,5種組蛋白也排成一個重複單位,也存在間隔區,而且組蛋白基因的轉錄方向不一樣。多個重複單位也形成串聯重複排列。進化到哺乳動物,組蛋白基因一般不再形成重複單位,而呈散在分佈或集成一小群。儘管組蛋白基因在基因組中的排列和分佈在不同生物之間相差甚大,但是所有組蛋白基因都不含內含子,而且在序列上相應的組蛋白基因都很相似,從而編碼的組蛋白在結構上和功能上也極為相似。
基因組中存在大量重複序列用以編碼組蛋白是有其重要意義的。DNA複製時,組蛋白也要成倍增加,而且往往在DNA合成一小段后,組蛋白馬上就要與其相結合,這要求在較短的時間內合成大量的組蛋白,因而需要有大量的組蛋白基因存在。人體基因組中還有幾個大的基因簇,也屬於中度重複順序長的分散片段型。在一個基因簇內含有幾百個功能相關的基因,這些基因簇又稱為超基因(Super gene),如人類主要組織相容性抗原複合體HLA和免疫球蛋白重鏈及輕鏈基因都屬於超基因。超基因可能是由於基因擴增后又經過功能和結構上的輕微改變而產生的,但仍保留了原始基因的結構及功能的完整性。
引自http://www.37c.com.cn/topic/004/theory/LL1_2_6.htm