數值分類法

數值分類法

數值分類法,是微生物鑒別方法—數值分類法。

目錄

簡介


數值分類法是根據數值分析,藉助計算機將擬分類的微生物按其性狀的相似程度歸類的方法。
(1)數值分類法的主要分類原則
該法主要的分類原則是:①分類時視每個性狀為同等重要,以避免分類者的主觀偏見,使結果比較客觀。②根據儘可能多的性狀分類,以揭示分類單位間的真實關係。③按性狀的相似度歸為等同分類單元。
(2)數值分類法的基本程序
數值分類法的基本程序如下:
①分類對象與性狀的選擇:數值分類時,分類對象可能是菌株,也可能是種或屬,所以稱每個分類對象為一個操作分類單位。很多場合下,OTU是指菌株。數值分類時,應根據工作目的認真地選擇菌株,其中須包括與該分類單元有關的分類單元的模式菌株。如有可能,新近分離的菌株與世界不 同地區的菌株也應包括在內。
為達到更客觀和精確區分的目的,選擇的性狀應儘可能多,通常不應少於50個,多者可達上百個甚至幾百個。一般地說,所選性狀數目越多,分類結果越可靠。所選性狀應是儘可能廣泛而又均勻地遍佈於所研究的微生物中,形態的、生理生化的、生態的、免疫的、遺傳的等性狀都可以。但要注意,無意義性狀和全同性狀不宜選用,相關性狀如運動性與鞭毛也不能同時選用。
②性狀編碼將觀察和測得的性狀用計算機所能識別和運算的符號記錄下來。以分類中用得最多的兩態性狀,如對某種碳源利用與否,有無某種酶,能否在45°生長等為例,陽性結果(能利用某種碳源,有某種酶,能在45°生長等)用“+”表示,陰性結果用“—”表示。如資料缺乏或可疑,可用“NC”表示。對於定量多態性狀或定性多態性狀採用加權遞增編碼法,將1個多態性狀轉化成多個3態性狀。將性狀編好碼后,把它們排列成順序號,形成一個性狀(原始數據)矩陣,然後輸入計算機。輸入計算機時分別用1和0表示,“NC”輸入計算機時用“3”代表。
③相似度係數的計算:相似度係數是被比較的OTU對偶間整體相似程度的度量,它是根據每一對性狀的相似程度計算出來的。計算相似度的方法很多,最簡單的方法是計算對偶間相似性狀的數目。
其計算公式如下: S=NS/(NS+ND)
上式中的NS表示比較的OTU對偶有相同性狀的數目,ND表示被比較的OTU對偶有不同性狀的數目。算出的相似度以百分數或比例表示。
④系統聚類(或等級聚類):根據相似度係數對OTU進行系統(或等級)聚類歸群,得到相似度矩陣,即S矩 陣。如對10個菌株進行數值分類,經過系統聚類可得到S矩陣,相似度為百分數,100表示每個OTU自己與自己相比。
⑤聚類結果的表示:從矩陣看不出這10個菌株間的相互關係,因此需要對矩陣進行重新處理,將相似度高的和低的分別列在一起,得到另一組矩陣。
然後再由此矩陣轉換成能顯示這10個菌株相互關係的樹狀譜。數值分類得到的是表觀群。實踐證明,表觀群是等同於分類單元的。大約是75%相似度的表觀群可視為同一種,比值達65%以上者可歸入同一屬。這樣的結論和傳統分類方法的結果通常是一致的。