模式類

模式類

模式類,主要是由於這個詞是Pattern Recognition翻譯來的,通俗一點講究就是機器識別,計算機識別,或機器自動識別

目錄

正文


模式識別(Pattern Recognition)這個詞對許多人來說很陌生,然而實際上人類卻在日常生活的每個環節,從事著模式識別的活動。可以說每個有正常思維的人,在他沒有入睡時都在進行模式識別的活動。坐公共汽車找汽車站,騎車判別可行進道路,對觀察到的現象作出判斷,對聽到的聲音作出反應,判斷東西的好與壞以及水果的成熟與否等等都是人們判斷是非,判別事物的過程。但是對模式識別這個詞就顯得陌生而難以理解了。確切地說,模式識別在這裡是針對讓計算機來判斷事物而提出的,如檢測病理切片中是否有癌細胞,文字識別,話語識別,圖像中物體識別等等。該學科研究的內容是使機器能做以前只能由人類才能做的事,具備人所具有的、對各種事物與現象進行分析、描述與判斷的部分能力。
模式識別這個詞大概很少聽說,Pattern這個詞翻譯成模式,就是要讓機器自動識別的事物,如一個具體數字,是印刷體還是手寫體。識別的結果就是給他分類,分到具體的數字類中。對數字來說,其結果可表示成它的相應代碼,如ASCII碼。對於一個智能交通系統來說,是要識別是否有汽車闖紅燈,闖紅燈的汽車車牌號碼等。要讓機器能識別、分類,需要研究識別的方法,這就是這門學科的任務。人類在觀察事物與作出判斷時,常常把所見到的具體事物與腦子裡對某個事物的“概念”聯繫起來,從而按這些概念對它們實行分類。人們能將所見到的具體的、外表各異、各具特色的汽車與腦子中已形成的“抽象”的汽車概念聯繫起來,並能明確地分辨汽車與拖拉機、坦克車等之間的不同之處,實現正確的分類。拿模式識別的術語來說,所見的具體事物是樣本,而它們所屬的事物類別,代表這些事物的“概念”是模式。也有另一種說法把所見到的事物稱為模式,而將它們的歸屬類別稱為模式類。因此模式這個詞,有時則代表類別事物的稱呼,而有時則強調具體事物,其具體含義依上下文關係而定,一般不會產生混淆。
與人辨別事物相比,機器識別事物的方法是很不同的,在目前也是很簡單與低級的,因此機器識別事物的能力還很差。這主要的原因是人們在學習與認識事物中會總結出規律,並把這些規律性的東西抽象成“概念”。人之所以能“抽象出概念”,關鍵能分析事物中哪些是本質,哪些是表面現象,或由偶然因素引起的。但機器目前的抽象能力是很差的。要讓機器準確地把握事物的本質,弄清分辨事物的關鍵,從而正確辨別事物,實質上是要使人能夠研究出好的方法,提出好的演演算法,從而構造出好的系統,使機器辨別事物的本領更強。
模式類與模式,或者模式與樣本在集合論中是子集與元素之間的關係。當用一定的度量來衡量兩個樣本,而找不出它們之間的差別時,它們在這種度量條件下屬於同一個等價類。這就是說它們屬於同一子集,是一個模式,或一個模式類。而不同的模式類之間應該是可以區分的,它們之間應有明確的界線。但是對實際樣本來說,有時又往往不能對它們進行確切的劃分,即在所使用的度量關係中,分屬不同的類別的樣本卻表現出相同的屬性,因而無法確鑿無誤地對它們進行區分。例如在癌症初期,癌細胞與正常細胞的界線是含糊的,除非醫術有了進一步發展,能找到更準確有效的分類方法。
讓機器辨別事物的最基本方法是計算,原則上講是對計算機要分析的事物與作為標準的稱之為“模板”的相似程度進行計算。譬如說腦子裡有沒有瘤,就要與標準的腦圖像以及有瘤圖像做比較,看跟哪個更相似。要識別一個具體數字,就要將它與從0到9的樣板做比較,看跟哪個模板最相似,或最接近。因此首先要能從度量中看出不同事物之間的差異,才能分辨當前要識別的事物(稱為測試樣本)跟哪類事物更接近。因此找到有效地度量不同類事物的差異的方法是最關鍵的。