SSR標記
以PCR為基礎的分子標記技術
SSR(Simple Sequence Repeats)標記是近年來發展起來的一種以特異引物PCR為基礎的分子標記技術,也稱為微衛星DNA(MicrosatelliteDNA),是一類由幾個核苷酸(一般為1~6個)為重複單位組成的長達幾十個核苷酸的串聯重複序列。每個SSR兩側的序列一般是相對保守的單拷貝序列。
生物的基因組中,特別是高等生物的基因組中含有大量的重複序列〔14〕,根據重複序列在基因組中的分佈形式可將其分為串聯重複序列和散布重複序列。
其中,串聯重複序列是由相關的重複單位首尾相連、成串排列而成的。
目前發現的串聯重複序列主要有兩類:
一類是由功能基因組成的(如rRNA和組蛋白基因);
另一類是由無功能的序列組成的。根據重複序列的重複單位的長度,可將串聯重複序列分為衛星DNA、微衛星DNA、小衛星DNA等〔3〕。微衛星DNA又叫簡單重複序列,指的是基因組中由1~6個核苷酸組成的基本單位重複多次構成的一段DNA,廣泛分佈於基因組的不同位置,長度一般在200bp以下。研究表明,微衛星在真核生物的基因組中的含量非常豐富,而且常常是隨機分佈於核DNA中〔15,38〕。在植物中通過對擬南芥〔7〕、玉米〔35〕、水稻〔11〕、小麥〔28,32,33〕等的研究表明微衛星在植物中也很豐富,均勻分佈於整個植物基因組中,但不同植物中微衛星出現的頻率變化是非常大的,如在主要的農作物中兩種最普遍的二核苷酸重複單位(AC)n和(GA)n在水稻、小麥、玉米、煙草中的數量分佈頻率是不同的。在小麥中估計有3000個(AC)n序列重複和約6000個(GA)n序列重複,兩個重複之間的距離平均分別為704kb、440kb〔32,33〕,而在水稻中,(AC)n序列重複約有1000個左右,(GA)n重複約有2000個,重複之間的平均距離分別為450kb、225kb〔41〕。另外在植物中也發現一些三核苷酸和四核苷酸的重複,其中最常見的是(AAG)n、(AAT)n〔15〕。在單子葉和雙子葉植物中SSR數量和分佈也有差異,平均分別為64.6kb和21.2kb中有一個SSR。研究還發現,單核苷酸及二核苷酸重複類型的SSR主要位於非編碼區,而有部分三核苷酸類型位於編碼區。另外在葉綠體基因組中,目前也報道了一些微衛星,以A/T序列重複為主〔3〕。
研究發現,微衛星中重複單位的數目存在高度變異,這些變異表現為微衛星數目的整倍性變異或重複單位序列中的序列有可能不完全相同,因而造成多個位點的多態性。如果能夠將這些變異揭示出來,就能發現不同的SSR在不同的種甚至不同個體間的多態性,基於這一想法,人們發展起了SSR標記。SSR標記又稱為sequence tagged microsatellite site,簡寫為STMS,是目前最常用的微衛星標記之一。由於基因組中某一特定的微衛星的側翼序列通常都是保守性較強的單一序列,因而可以將微衛星側翼的DNA片段克隆、測序,然後根據微衛星的側翼序列就可以人工合成引物進行PCR擴增,從而將單個微衛星位點擴增出來。由於單個微衛星位點重複單元在數量上的變異,個體的擴增產物在長度上的變化就產生長度的多態性,這一多態性稱為簡單序列重複長度多態性(SSLP),每一擴增位點就代表了這一位點的一對等位基因。由於SSR重複數目變化很大,所以SSR標記能揭示比RFLP高得多的多態性,這就是SSR標記的原理。
與其它分子標記相比,SSR標記具有以下優點:(1)數量豐富,覆蓋整個基因組,揭示的多態性高;(2)具有多等位基因的特性,提供的信息量高;(3)以孟德爾方式遺傳,呈共顯性;(4)每個位點由設計的引物順序決定,便於不同的實驗室相互交流合作開發引物。
因而目前該技術已廣泛用於遺傳圖譜的構建、目標基因的標定、指紋圖的繪製等研究中。但應看到,SSR標記的建立首先要對微衛星側翼序列進行克隆、測序、人工設計合成引物以及標記的定位、作圖等基礎性研究,因而其開發費用相當高,各個實驗室必須進行合作才能開發更多的標記。由於SSR標記具有較大的應用價值,且種屬特異性較強,目前在一些主要的農作物中SSR標記研究都進行了合作,共同進行STMS引物的開發。