病毒基因組
病毒基因組
病毒是最簡單的生物,完整的病毒顆粒包括外殼蛋白和內部的基因組DNA或RNA(有些病毒的外殼蛋白外面有一層由宿主細胞構成的被膜(envelope),被膜內含有病毒基因編碼的糖蛋白。
病毒不能獨立地複製,必需進入宿主細胞中藉助細胞內的一些酶類和細胞器才能使病毒得以複製。外殼蛋白(或被膜)的功能是識別和侵襲特定的宿主細胞並保護病毒基因組不受核酸酶的破壞。
病毒基因組的結構特點
牛乳頭瘤病毒基因組結構和功能
RNA噬菌體的基因組結構和功能
乙肝病毒基因組的結構特點和功能
1.病毒基因組大小相差較大,與細菌或真核細胞相比,病毒的基因組很小,但是不同的病毒之間其基因組相差亦甚大。如乙肝病毒DNA只有3kb大小,所含信息量也較小,只能編碼4種蛋白質,而痘病毒的基因組有300kb之大,可以編碼幾百種蛋白質,不但為病毒複製所涉及的酶類編碼,甚至為核苷酸代謝的酶類編碼,因此,痘病毒對宿主的依賴性較乙肝病毒小得多。
2.病毒基因組可以由DNA組成,也可以由RNA組成,每種病毒顆粒中只含有一種核酸,或為DNA或為RNA,兩者一般不共存於同一病毒顆粒中。組成病毒基因組的DNA和RNA可以是單鏈的,也可以是雙鏈的,可以是閉環分子,也可以是線性分子。如乳頭瘤病毒是一種閉環的雙鏈DNA病毒,而腺病毒的基因組則是線性的雙鏈DNA,脊髓灰質炎病毒是一種單鏈的RNA病毒,而呼腸孤病毒的基因組是雙鏈的RNA分子。一般說來,大多數DNA病毒的基因組雙鏈DNA分子,而大多數RNA病毒的基因組是單鏈RNA分子。
3.多數RNA病毒的基因組是由連續的核糖核酸鏈組成,但也有些病毒的基因組RNA由不連續的幾條核酸鏈組成如流感病毒的基因組RNA分子是節段性的,由八條RNA分子構成,每條RNA分子都含有編碼蛋白質分子的信息;而呼腸孤病毒的基因組由雙鏈的節段性的RNA分子構成,共有10個雙鏈RNA片段,同樣每段RNA分子都編碼一種蛋白質。目前,還沒有發現有節段性的DNA分子構成的病毒基因組。
4.基因重疊即同一段DNA片段能夠編碼兩種甚至三種蛋白質分子,這種現象在其它的生物細胞中僅見於線粒體和質粒DNA,所以也可以認為是病毒基因組的結構特點。這種結構使較小的基因組能夠攜帶較多的遺傳信息。重疊基因是1977年Sanger在研究ΦX174時發現的。ΦX174是一種單鏈DNA病毒,宿主為大腸桿菌,因此,又是噬菌體。它感染大腸桿菌后共合成11個蛋白質分子,總分子量為25萬左右,相當於6078個核苷酸所容納的信息量。而該病毒DNA本身只有5375個核苷酸,最多能編碼總分子量為20萬的蛋白質分子,Sanger在弄清ΦX174的11個基因中有些是重疊的之前,這樣一個矛盾長時間無法解決。重疊基因有以下幾種情況:
(1)一個基因完全在另一個基因裡面。如基因A和B是兩個不同基因,而B包含在基因A內。同樣,基因E在基因D內。
(2)部分重疊。如基因K和基因A及C的一部分基因重疊。
(3)兩個基因只有一個鹼基重疊。如基因D的終止密碼子的最後一個鹼基是J基因起始密碼子的第一個鹼基(如TAATG)。這些重疊基因儘管它們的DNA大部分相同,但是由於將mRNA翻譯成蛋白質時的讀框不一樣,產生的蛋白質分子往往並不相同。有些重疊基因讀框相同,只是起始部位不同,如SV40DNA基因組中,編碼三個外殼蛋白VP1、VP2、VP3基因之間有122個鹼基的重疊,但密碼子的讀框不一樣。而小t抗原完全在大T抗原基因裡面,它們有共同的起始密碼子。
5.病毒基因組的大部分是用來編碼蛋白質的,只有非常小的一份不被翻譯,這與真核細胞DNA的冗餘現象不同如在ΦX174中不翻譯的部份只佔217/5375,G4DNA中佔282/5577,都不到5%。不翻譯的DNA順序通常是基因表達的控制序列。如ΦX174的H基因和A基因之間的序列(3906-3973),共67個鹼基,包括RNA聚合酶結合位,轉錄的終止信號及核糖體結合位點等基因表達的控制區。乳頭瘤病毒是一類感染人和動物的病毒,基因組約8.0Kb,其中不翻譯的部份約為1.0kb,該區同樣也是其他基因表達的調控區.
6.病毒基因組DNA序列中功能上相關的蛋白質的基因或rRNA的基因往往叢集在基因組的一個或幾個特定的部位,形成一個功能單位或轉錄單元。它們可被一起轉錄成為含有多個mRNA的分子,稱為多順反子mRNA(polycistroniemRNA),然後再加工成各種蛋白質的模板mRNA。如腺病毒晚期基因編碼病毒的12種外殼蛋白,在晚期基因轉錄時是在一個啟動子的作用下生成多順反子mRNA,然後再加工成各種mRNA,編碼病毒的各種外殼蛋白,它們在功能上都是相關的;ΦX174基因組中的D-E-J-F-G-H基因也轉錄在同一mRNA中,然後再翻譯成各種蛋白質,其中J、F、G及H都是編碼外殼蛋白的,D蛋白與病毒的裝配有關,E蛋白負責細菌的裂解,它們在功能上也是相關的。
7.除了反轉錄病毒以外,一切病毒基因組都是單倍體,每個基因在病毒顆粒中只出現一次。反轉錄病毒基因組有兩個拷貝。
8.噬菌體(細菌病毒)的基因是連續的;而真核細胞病毒的基因是不連續的,具有內含子,除了正鏈RNA病毒之外,真核細胞病毒的基因都是先轉錄成mRNA前體,再經加工才能切除內含子成為成熟的mRNA。更為有趣的是,有些真核病毒的內含子或其中的一部分,對某一個基因來說是內含子,而對另一個基因卻是外顯子。如SV40和多瘤病毒(polyomavirus)的早期基因就是這樣。SV40的早期基因即大T和小t抗原的基因都是從5146開始反時針方向進行,大T抗原基因到2676位終止,而小t抗原到4624位即終止了,但是,從4900到4555之間一段346bp的片段是大T抗原基因的內含子,而該內含子中從4900-4624之間的DNA序列則是小t抗原的編碼基因。同樣,在多瘤病毒中,大T抗原基因中的內含子則是中T和t抗原的編碼基因。
牛乳頭瘤病毒基因組結構和功能
乳頭瘤病毒(papillomavirus)是感染人和動物皮膚、粘膜並引起乳頭狀瘤病變的一種DNA病毒,屬於乳多空泡病毒(papovavirus)科。根據病毒感染的宿主不同可以分為牛乳頭瘤病毒(BPV),人乳頭瘤病毒(HPV)等。目前已發現的乳頭瘤病毒基因組都具有相似的結構。下面以BPV為例說明乳頭瘤病毒的基因組結構及功能。BPVDNA全長7945bp,為閉環超螺旋結構,在宿主細胞中可以和組蛋白結合形成核小體。以BPVDNA中單一的HpaⅠ酶切位點第一鹼基G為1號位,按5'→3'的方向給鹼基編號定位。DNA序列分析表明,所有的開放讀框(ORF)都存在於一條DNA鏈上,基因之間有相互重疊。整個BPV基因組分為編碼區和非編碼區(NCR),編碼區又按其編碼蛋白質的功能不同,分為早期轉錄功能區(E區)和晚期轉錄功能區(L區)。 1.非編碼區(NCR)非編碼區又稱上游調控區(URR)或長控制區(LCR),位於晚期基因L1終止密碼子與早期基因E6第一個起始密碼子之間,長度在不同的乳頭瘤病毒中不一樣,在BPV中長約1.0kb。在NCR轉錄的啟動子序列,可以啟動早期基因的轉錄和表達,另外,在該區還有增強子序列,可以被早期基因產物E2蛋白激活,進一步促進早期基因AAC的表達,目前已搞清了BPVNCR區增強子的序列,該序列為TTGGCGGNNG和ATCGGTGCACCGAT迴文結構。從NCR的結構特點上可以看出其主要功能是調節BPV基因的表達。
2.早期轉錄功能區(或稱早期基因區,E區)BPV的E區含有八個開放讀框(ORF),分別為E6、E7、E8、E1、E2、E3、E4、E5,其中E6、E7、E1基因有部份重疊,E8完全在E1中,E3、E4全部包含在E2中,E5與E2部份重疊。E2ORF編碼的蛋白產物可以與NCR的增強子結合,而提高或降低早期基因的表達水平。另外,E2ORF與E1ORF協同可以維持乳頭瘤病毒DNA的遊離狀態而不整合到宿主細胞染色體上去。E6和E7ORFs編碼的蛋白質可能是致癌蛋白。E6和E7蛋白可以引起宿主向惡性轉化成為腫瘤細胞。關於E6、E7蛋白引起細胞轉化的機制,現階段尚不清楚,但有兩種解釋。在E6、E7蛋白的氨基酸序列中發現有Cys-x-x-Cys重複序列,目前認為該結構是細胞內核酸結合蛋白所具備的特異性結構,因而認為E6、E7蛋白是DNA結合蛋白,可以調節基因的活性,進一步影響宿主細胞的增殖和分化,使該過程失去控制而形成腫瘤;最近,在正常細胞中發現有兩種蛋白質分子量分別為53KD和106KD分別稱為p53和p106蛋白質。這兩種蛋白質缺失或失活往往引起細胞的惡性化。研究發現,乳頭瘤病毒的E7和E6蛋白分別可以和p53和p106蛋白質結合而使其失活,這也可能是E6和E7蛋白質導致細胞惡性化的一種機制。
3.晚期轉錄功能區(晚期基因區、L區):L區ORFs有兩個,即L1和L2ORF,編碼乳頭瘤病毒的外殼蛋白,其中L1蛋白是主要外殼蛋白,L2蛋白是次要外殼蛋白。
RNA噬菌體的基因組結構和功能
目前研究最清楚的大腸桿菌RNA噬菌體是MS2,R17,f2和Qβ。它們的基因組小,只有3600到4200個核苷酸,包含四個基因。MS2.R17和f2具有幾乎一樣的基因組結構。在四個基因中有兩個基因編碼噬菌體的結構蛋白:一個是A蛋白的基因,長1178個核苷酸。A蛋白(稱為成熟蛋白)的功能是使噬菌體能識別宿主,並使其RNA基因組能進入宿主菌,每個噬菌體一般只存在分子的A蛋白。另一個結構蛋白基因長399個核苷酸,編碼外殼蛋白以構成病毒顆粒,每個噬菌體有180個分子。基因組的其他部分編碼RNA複製酶和一個溶解蛋白,編碼溶解蛋白的基因與外殼蛋白和複製酶的基因有部分重疊,但讀框與外殼蛋白的讀框不一樣。在MS2、R17、f2基因組內有許多二級結構,RNA分子內鹼基的自我配對,可能對防止RNase降解有一定作用。另外,在編碼基因的5'和3'端各有一段非翻譯序列,該序列對穩定RNA分子也有一定作用。
另一種RNA噬菌體Qβ的基因組略大,與上述RNA噬菌體的基因組有以下不同;沒有獨立的溶解蛋白基因,但結構蛋白A2(或稱成熟蛋白,MaturaitonProtein)即具有溶解蛋白的功能,還編碼另一種外殼蛋白A1。
乙肝病毒基因組的結構特點和功能
乙肝病毒(HBV)的基因組DNA結構很奇特,是一環狀的部分雙螺旋結構,長約3.2kb。其中的2/3為雙螺旋結構,1/3為單鏈,這就是說,DNA中的兩條鏈不等長。長鏈的5'端與3'端無共價連接,而是與一種蛋白質共價相連。長鏈的5'端以250-300對鹼基互補結合。長鏈為負鏈,短鏈為正鏈。短鏈的長度視病毒而異,一般長約1.6-2.8kb,約為長鏈的2/3。短鏈之間的空隙可由病毒顆粒中的DNA聚合酶充填。乙肝病毒是目前已知的感染人類最小的雙鏈DNA病毒。為了能在細胞內獨立複製,病毒在很小的基因組中盡量容納大量的遺傳信息。因而HBV的基因組結構顯得特別精密濃縮,充分利用其遺傳物質。
重疊的基因序列比較多,HBV基因組中已確定的開放讀框有4個,分別編碼病毒的核殼(C)和包膜(S)蛋白,病毒複製酶(聚合酶)及一種似乎與病毒基因表達有關的蛋白質X。在S基因前面的兩個小ORFs與S基因ORF屬於同一個讀框,可以將ORFS通讀下去,編碼兩種S蛋白相關的抗原,這兩種抗原也存在於病毒顆粒的表面,這兩個抗原分別稱為前-S1(pre-S1)和前-S2(pre-S2)。同樣,在ORFC前面也有一短的ORF,稱為前-C(pre-C),編碼一較大的C蛋白相關抗原。所有這些ORF都在負鏈DNA(長鏈)上,其中S基因完全重疊於聚合酶基因中,X基因與聚合酶基因、C基因重疊,C基因與聚合酶也有重疊。最近,Miller等人在HBV基因組中又發現兩個ORF,即ORF-5和ORF-6,這兩個ORFs與X基因重疊,其中ORF6不是由負鏈DNA編碼的,而是由正鏈DNA編碼。這兩個ORF的功能目前尚不清楚。
調節序列位於基因內部,這也是HBV節約使用遺傳物質的一種方式。與HBV基團組複製有關的序列有:短鏈順向複製序列(DR1和DR2)和U5樣序列(因與反轉錄病毒末端的U5序列類似面得名)。DR1和U5位於前-CORF中,是合成DNA長鏈的起始部位,DR2位於聚合酶基因與X基因重疊處,是DNA短鏈合成的起始部位。
與HBV基因表達有關的信號序列有4種:啟動子,增強子,polyA附加信號,糖皮質激素敏感因子(GRE)。由於HBV基因組中的基因分別轉錄於3種HBVmRNA轉錄本上,因此,相應地在病毒基因組中每一轉錄本近5'端也至少應有3種RNA聚合酶Ⅱ啟動子,雖然這些啟動子的基因序列尚不知,但這些啟動子顯然存在於編碼蛋白質序列內。增強子(ENH)位於聚合酶基因中;polyA附加信號位於CORF中;而GRE位於SORF和聚合酶基因中。GRE是與激素受體結構的DNA片段,結合后能使某一已知基因轉錄水平增加。
GRE有許多增強子的特徵:是起順式作用的因子,在轉錄的兩個方向均有作用,在距其調節的基因不同距離處均可起作用。
從以上可以看出HBV基因組結構嚴密,組織高效,在已知的病毒中是罕見的。HBVDNA不但在結構上有其獨特的地方,而且其DNA複製過程也非常特別。當HBVDNA進入宿主細胞后,首先成為完整的閉環雙螺旋DNA,以負鏈為模板合成全長的“+”鏈RNA(稱為前基因組RNA)。該“+”鏈RNA被包裝在未成熟的核心樣顆粒中,同時還有DNA聚合酶和一種蛋白質也被包裝在顆粒中。在該顆粒中“+”鏈RNA作為模板由反轉錄酶催化合成“-”鏈DNA,具體機制尚不清楚,可能與腺病毒DNA的複製相似,因為在“-"鏈DNA的5'端也有共價結合的蛋白質。“+”鏈DNA的合成便以該負鏈DNA為模板和一段RNA為引物而聚合延伸,核心樣病毒顆粒在這過程中也成為成熟的病毒顆粒。這時,正鏈DNA仍沒有合成完畢,因而造成病毒基因組兩條DNA鏈長度不一樣。