基因結構
基因結構
人類結構基因4個區域:①編碼區,包括外顯子與內含子;②前導區,位於編碼區上游,相當於RNA5’末端非編碼區(非翻譯區);③尾部區,位於RNA3’編碼區下游,相當於末端非編碼區(非翻譯區);④調控區,包括啟動子和增強子等。基因編碼區的兩側也稱為側翼順序
大多數真核生物的基因為不連續基因(interrupted或discontinuous gene)。所謂不連續基因就是基因的編碼序列在DNA分子上是不連續的,被非編碼序列隔開。編碼的序列稱為外顯子(exon),是一個基因表達為多肽鏈的部分;非編碼序列稱為內含子(intron),又稱插入序列(intervening sequence,IVS)。內含子只參與轉錄形成pre-mRNA,在pre-mRNA形成成熟mRNA時被剪切掉。如果一個基因有n個內含子,一般總是把基因的外顯子分隔成n+1部分。內含子的核苷酸數量可比外顯子多許多倍。
每個外顯子和內含子接頭區都有一段高度保守的一致順序(consensus seqence),即內含子5’末端大多數是GT開始,3’末端大多是AG結束,稱為GT-AG法則,是普遍存在於真核基因中RNA剪接的識別信號。
側翼順序在第一個外顯子和最末一個外顯子的外側是一段不被翻譯的非編碼區,稱為側翼順序(flanking sequence)。側翼順序含有基因調控順序,對該基因的活性有重要影響。
1.啟動子 啟動子(promoter)包括下列幾種不同順序,能促進轉錄過程:
(1)TATA框(TATA box):其一致順序為TATAATAAT。它約在基因轉錄起始點上游約-30-50bp處,基本上由A-T鹼基對組成,是決定基因轉錄始的選擇,為RNA聚合酶的結合處之一,RNA聚合酶與TATA框牢固結合之後才能開始轉錄。]
(2)CAAT框(CAAT box):其一致順序為GGGTCAATCT,是真核生物基因常有的調節區,位於轉錄起始點上游約-80-100bp處,可能也是RNA聚合酶的一個結合處,控制著轉錄起始的頻率。
(3)GC框(GC box):有兩個拷貝,位於CAAT框的兩側,由GGCGGG組成,是一個轉錄調節區,有激活轉錄的功能。
此外,RNA聚合酶Ⅲ負責轉錄tRNA的DNA和5SrDNA,其啟動子位於轉錄的DNA順序中,稱為下游啟動子。
2.增強子在真核基因轉錄起始點的上游或下游,一般都有增強子(enhancer),它不能啟動一個基因的轉錄,但有增強轉錄的作用。此外,增強子順序可與特異性細胞因子結合而促進轉錄的進行。研究表明,增強子通常有組織特異性,這是因為不同細胞核有不同的特異因子與增強子結合,從而對基因表達有組織、器官、時間不同的調節作用。
例如人類單拷貝胰島素基因5’末端上游約250 bp處有一組織特異性增強子,在胰島β細胞中有一特異因子可作用於該區以增強胰島素基因的轉錄和翻譯,其它組織中無此因子,這是何以胰島素基因只有在胰島β細胞中才得以很好表達的原因.
3.多聚腺苷酸化附加信號 是位於真核基因3‘端的一段保守序列,由AATAAA6個鹼基組成。目前研究表明,它是mRNA3’端的polyA附加信號,不是終止信號。研究還發現,在進行多聚腺苷酸化之前,應該現在3‘端水解掉10—15bp。所以,這段順序又稱為RNA裂解信號,其作用是:一、知道核酸內切酶在此信號下游10—15bp特定位點處裂解mRNA;二、在聚合酶的作用下,在成熟mRNA3‘端加上200—250個A的poly A尾部。
En:增強子:P1、P2、P3:啟動子(TATA框,CAAT框,GC框);E:外顯子:I:內含子;
UT:非翻譯區;GT-AG:外顯子-內含子接頭
6.終止子在一個基因的末端往往有一段特定順序,它具有轉錄終止的功能,這段終止信號的順序稱為終止子(termianator)。終止子的共同順序特徵是在轉錄終止點之前有一段迴文順序,約7-20核苷酸對。迴文順序的兩個重複部分分由幾個不重複鹼基對的不重複節段隔開,迴文順序的對稱軸一般距轉錄終止點16-24bp(圖3-2)。
在迴文順序的下游有6-8個A-T對,因此,這段終止子轉錄后形成的RNA具有髮夾結構,並具有與A互補的一串U,因為A-U之間氫健結合較弱,因而DNA雜交部分易於拆開,這樣對轉錄物從DNA模板上釋放出來是有利的,也可使RNA聚合酶從DNA上解離下來,實現轉錄的終止。