非編碼RNA
非編碼RNA
非編碼RNA(Non-coding RNA)是指不編碼蛋白質的RNA。其中包括rRNA,tRNA,snRNA,snoRNA 和microRNA 等多種已知功能的 RNA,還包括未知功能的RNA。這些RNA的共同特點是都能從基因組上轉錄而來,但是不翻譯成蛋白,在RNA 水平上就能行使各自的生物學功能了。非編碼RNA 從長度上來劃分可以分為3類:小於50 nt,包括microRNA,siRNA,piRNA;50 nt到500 nt,包括rRNA,tRNA,snRNA,snoRNA,SLRNA,SRPRNA 等等;大於500 nt,包括長的mRNA-like 的非編碼RNA,長的不帶polyA 尾巴的非編碼RNA等等。
細胞中含量最高的是rRNA 和tRNA 這兩種常見的非編碼RNA。廣義上的非編碼RNA是包括這兩種RNA的,研究的比較透徹。狹義上的非編碼RNA往往不包括rRNA 和tRNA,因此在這裡就不做介紹了。這裡介紹的非編碼RNA種類,是在狹義上的非編碼RNA 的定義,即,不包括mRNA,tRNA 和rRNA 的其他RNA分子。在此主要介紹一下表達量相對比較高的snRNA、snoRNA 和作為研究熱點的microRNA。
snRNA
snRNA 是small nuclear RNA的簡稱,也稱作小核RNA。其功能是與蛋白因子結合形成小核核糖蛋白顆粒(small nuclear ribonucleo-protein particle,簡稱snRNPs),行使剪接mRNA的功能。snRNA 主要包括5 種:U1,U2,U4,U5 和U6。存在於所有snRNP 中的蛋白叫做通用蛋白,也稱做sm 蛋白。通用蛋白和snRNA的結合位點已經研究清楚了。除U6 外,Sm蛋白可以結合到所有的其他snRNA 的保守序列AAU4-5GGA上,這段序列被稱為Sm蛋白的結合位點,這也可以作為判斷一個RNA是否是snRNA 的一個特徵。
snoRNA
snoRNA 是最早在核仁發現的小RNA,稱作小核仁RNA,最初發現它們的生物功能是用來修飾rRNA的。大多數小核仁RNA可以分為兩類。一類是C Dbox snoRNA,這一類snoRNA是對RNA的鹼基進行甲基化修飾的。其特點是含有4 個Box:Box C、Box D、BoxC’和BoxD’。事實上對C D box snoRNA 的預測已經有很多已經發表的軟體,比如說snoscan。另一類是H/ACA box,這一類snoRNA 對RNA的鹼基進行甲尿嘧啶化修飾。其特點是形成一個雙stem,中間加一個loop 區,中間的loop 區中有一個boxH。而在尾部的tail 有個boxACA。由於boxH 和boxACA 的一級序列特徵的界定比較松。比如BoxH 是ANANNA,很多A rich 的區域都能滿足這個特徵。而boxACA 是ACANNN,只有3 個鹼基的明確信息。所以單單從一級序列特徵上判斷一個RNA 是否為snoRNA 是比較容易出錯的。好在,HACA snoRNA 的二級結構是非常明確的。所以,用二級結構結合尾部的Box ACA的特徵,聯合判斷一個RNA是否為HACA snoRNA 是切實可行的。
microRNA
MicroRNA 是一類21~23 nt 的小RNA,其前體大概是70~100 nt 左右,形成標準的stem 結構,加工后成為21~23 nt 的單鏈RNA。microRNA 的作用機制是與mRNA 互補,讓mRNA 沉默或者降解。現在流行的RNAi 技術就是利用了細胞體內的這個機制,在體外人工加入類似microRNA 的smallRNA 來沉默對應的mRNA
circularRNA
環狀RNA與已知的線狀RNA不同,形成一個共價閉合的連續循環。在環狀RNA中,RNA分子的3'和5'末端通常是連接在一起的。這種特性賦予了環狀RNA許多特性,其中許多特性是最近才被識別出來的。
許多環狀RNA來源於蛋白質編碼基因,但是細胞中產生的環狀RNA還沒有被證明可以編碼蛋白質。因此它們被歸類為非編碼RNA。最近,一些環狀RNA顯示出了作為基因調節器的潛力。像許多其他非編碼亞型一樣,大多數環狀RNA的生物學功能尚不清楚。
由於環狀RNA沒有5'或3'端,它們對核外酶介導的降解具有抵抗性,並且可能比細胞中的大多數線性RNA更穩定。
非編碼RNA的工作主要分為兩個方面,一是大規模的鑒定新的非編碼RNA,二是通過各種方法研究非編碼RNA的功能。大規模鑒定非編碼RNA的方法可以分為用理論預測和實驗發現兩種。前者主要藉助計算機,從已有的非編碼RNA中提取特徵信息,然後以特徵信息做全基因組搜索,比較成功的預測軟體有:預測snoRNA 的snoScan和snoGPS,預測tRNA 的tRNAScan,預測microRNA 的mirScan,另外如RNAz,RNAmotif 等也都是很好的非編碼RNA預測工具。理論預測方法簡便快捷,但是最終的確定還是依賴於實驗,因此理論預測與實驗驗證通常是相輔相成的。
很多實驗有鑒定非編碼RNA的方法,這些方法被稱作“RNomics”。RNomics 的核心在於構建非編碼RNA 的cDNA 文庫,根據長度不同,非編碼RNA的cDNA文庫可以主要分為小於50 nt,50~500 nt以及大於500 nt 3 種,另外對於大於500 nt 的還可以分為帶polyA 尾巴和不帶polyA 尾巴這兩種。Ambion 公司、Invitrogen 公司以及Qiagen 公司都推出了可以用來構建非編碼RNA 的cDNA 文庫的試劑盒。得到非編碼RNA的cDNA文庫以後,有多種方法可以用來鑒定文庫中的非編碼RNA。比較傳統的是克隆測序,這種方法工作量很大,且對低丰度的非編碼RNA 檢測效率較差,但是這種方法操作流程比較簡單,且對儀器設備要求不高,成本相對較低,因此仍被廣泛使用。隨著測序技術的發展,得到非編碼RNA的cDNA 文庫以後,不用克隆就可以直接測序,這種方法簡單快捷,工作量小,可以檢測到大量低丰度的非編碼RNA,但是對儀器要求較高,成本也很高,使用的測序儀主要有454 和solexa 兩種。隨著技術的改進和成本的降低,這種直接測序的方法將成為主流。
另外一種廣泛使用的非編碼RNA 檢測技術,是2000 年以後發展起來的全基因組tiling 晶元技術,這種技術的核心在於構建高密度的覆蓋全基因組的晶元,生產這種晶元的主要有affymetrix 公司和agilent 公司,這種技術的優點在於不用構建cDNA 文庫,更不用做克隆,只要有分離純化的非編碼RNA就可以檢測,操作簡單,成本很低,可以檢測到大量低丰度的非編碼RNA,這種方法的缺點在於不能準確的確定非編碼RNA的轉錄起始終止位點,也很難區分剪切加工產物。非編碼RNA的功能研究主要集中在microRNA 和siRNA,主要原因在於這兩種小RNA的功能作用方式,都是通過同目標基因進行鹼基配對,尋找這些小RNA的靶點相對來講比較容易;而對於長的非編碼RNA來講,它們往往要形成複雜的二級甚至是三級結構,預測其靶點比較困難。隨著研究的深入,也有為數眾多的長的非編碼RNA的功能被鑒定出來,例如Xist 和Khps1 就屬於長的帶polyA 尾巴的非編碼RNA。
大量研究數據表明,高等生物多達一半以上的DNA轉錄為RNA,其中絕大多數為ncRNA。甚至,有的科學家預言ncRNA在生物發育的過程中,有著不亞於蛋白質的重要作用。但是,今天對整個ncRNA的世界卻了解甚少,主要任務是發現更多的ncRNA及其生物功能。毫無疑問,要了解ncRNA 的生物功能,也就是要弄清每個細胞類型在特定的時間內所有蛋白和所有ncRNAs 的功能以及它們之間、它們和DNA之間的相互作用。這一研究的道路還很長,遠比基因組計劃更為艱巨。因此,要徹底弄清ncRNA 的調控網路,將是揭示生命奧秘的最終突破。