Alu序列

Alu序列

Alu重複序列是哺乳動物基因組中SINE家族的一員,約有50萬份拷貝。也就是說平均4~6 kb中就有一個Alu序列。是中度重複序列DNA。由於這種DNA序列中有限制性內切核酸酶AluⅠ的識別序列AGCT,所以稱為Alu重複序列。典型的人基因組Alu序列長282 bp,由兩個同源但有差別的亞基構成。

結構特點


Alu重複序列是哺乳動物基因組中SINE家族的一員,約有50萬份拷貝。也就是說平均4~6 kb中就有一個Alu序列。由於這種DNA序列中有限制性內切核酸酶AluⅠ的識別序列AGCT,所以稱為Alu重複序列。典型的人基因組Alu序列長282 bp,由兩個同源但有差別的亞基構成。限制性剪切酶Alu I 可將其剪切成130bp和170bp兩段,因此將其定名為Alu序列,平均每5kbDNA就有一個Alu序列。亞基來源於有缺失突變和點突變的7SLRNA基因。兩個亞基間由腺嘌呤核苷酸密集的序列連接。右邊的亞基中有無關的31 bp插入片段,稱為IH。Alu序列兩端各有一個正向重複序列,末端有一個poly(A)尾。
Alu序列一般散在分佈,少數呈簇狀分佈。在細胞遺傳學水平上觀察,Alu重複序列集中在基因轉錄最活躍的染色體區段內。在所有已知的基因內含子中,幾乎都發現了Alu序列。
與Alu序列亞基有很高同源性的7SLRNA是7SRNA的一部分,是將蛋白質運送到內質網以便分泌出胞外的信號識別顆粒(signal—recognition particle,SRP)的組成部分。7SRNA5,端的90個核苷酸同Alu序列左端同源,中間的160個核苷酸與Alu序列沒有同源性,而3,端的40個核苷酸與Alu序列右端同源。7SRNA基因是由RNA聚合酶Ⅲ轉錄的。人體Alu重複序列絕大多數要由RNA聚合酶Ⅲ轉錄成RNA,而且Alu 3,端有polyA尾,這些都提示Alu重複序列是通過RNA為中介,反轉錄成DNA后整合在基因組新位置上的。這裡要提及的是,所有真核細胞里都含有3種RNA聚合酶;RNA聚合酶I負責轉錄rRNA基因,產生核糖體RNA(ribosomal RNA,rRNA);RNA聚合酶Ⅱ負責轉錄所有編碼蛋白質的基因,產生信使RNA(messenger RNA,mRNA),再由多聚腺嘌呤核苷酸聚合酶(poly(A)polymerase)負責加上poly(A)尾;RNA聚合酶Ⅲ負責轉錄轉移RNA(transfer RNA,tRNA)以及細胞核和細胞質內的各種小RNA,這些被轉錄的基因一般長300bp左右,且在基因組的重複拷貝數可達幾千份甚至上百萬份。
Alu家族不同成員之間的一致序列(consensus sequence)的同一性平均達87%。小鼠基因組內約有5萬份拷貝的B1重複序列,長130 bp,與Alu的一個亞基的同源性達70%--80%。
哺乳動物基因組中為什麼有這麼多重複拷貝的DNA序列,目前還不是很清楚。現已發現,Alu序列中有一個14 bp的區段同乳多空病毒(papova virus)如SV40病毒,以及乙型肝炎病毒的複製起始序列幾乎完全相同。這提示Alu序列很可能同真核生物基因組中的複製起始有某種相關,但這也存在爭論。因為Alu重複序列的拷貝數比複製起始點的預期數多出幾十倍。此外還發現,中國倉鼠的Alu類家族(Alu-equivalent family)的一些成員,當位於其他轉錄單位附近時,能在體內被轉錄生成單獨的RNA分子。

功能作用


Alu家族的功能是多方面的,由於在許多核內不均一RNA中含有大量的Alu序列,而且Alu序列含有某些真核基因內含子剪切接頭相似的序列,因而,Alu序列可能參與hnRNA的成熟與加工。Alu序列在人基因組中不尋常地大量存在,提示它與遺傳重組及染色體不穩定有關。最近發現在人的組織細胞中存在自然發生的染色體外雙鏈環狀DNA,被稱為人類質粒,而這些質粒又毫無例外的含有Alu序列。研究還表明,Alu序列中的某些區段有形成Z-DNA的能力。另外,Alu序列可能具有調節作用。

Alu鹼基序列


GGCCGGGCGCGGTGGCTCACGCCTGTAATCCCAGCACTTTGG
GAGGCCGAGGCGGGCGGATCACCTGAGGTCAGGAGTTCGAGA
CCAGCCTGGCCAACATGGTGAAACCCCGTCTCTACTAAAAATA
CAAAAATTAGCCGGGCGTGGTGGCGCGCGCCTGTAATCCCAG
CTACTCGGGAGGCTGAGGCAGGAGAATCGCTTGAACCCGGGA
GGCGGAGGTTGCAGTGAGCCGAGATCGCGCCACTGCACTCCA
GCCTGGGCGACAGAGCGAGACTCCGTCTC