圖像分類
圖像分類
圖像分類,根據各自在圖像信息中所反映的不同特徵,把不同類別的目標區分開來的圖像處理方法。它利用計算機對圖像進行定量分析,把圖像或圖像中的每個像元或區域劃歸為若干個類別中的某一種,以代替人的視覺判讀。
基於色彩特徵的索引技術
色彩是物體表面的一種視覺特性,每種物體都有其特有的色彩特徵,譬如人們說到綠色往往是和樹木或草原相關,談到藍色往往是和大海或藍天相關,同一類物體往拍幾有著相似的色彩特徵,因此我們可以根據色彩特徵來區分物體。用色彩特特徵進行圖像分類一可以追溯到Swain和Ballard提出的色彩直方圖的方法。由於色彩直方圖具有簡單且隨圖像的大小、旋轉變化不敏感等特點,得到了研究人員的廠泛關注,目前幾乎所有基於內容分類的圖像資料庫系統都把色彩分類方法作為分類的一個重要手段,並提出了許多改進方法,歸納起主要可以分為兩類:全局色彩特徵索引和局部色彩特徵索引。
基於紋理的圖像分類技術
在70年代早期,Haralick等人提出紋理特徵的灰度共生矩陣表示法(eo一oeeurrenee matrix representation),這個方法提取的是紋理的灰度級空間相關性(gray level Spatial dependenee),它首先基於象素之間的距離和方向建立灰度共生矩陣,再由這個矩陣提取有意義的統計量作為紋理特徵向量。基於一項人眼對紋理的視覺感知的心理研究,Tamuar等人提出可以模擬紋理視覺模型的6個紋理屬性,分別是粒度,對比度,方向性,線型,均勻性和粗糙度。QBIC系統和MARS系統就採用的是這種紋理表示方法。
在90年代初期,當小波變換的理論結構建一認起來之後,許多研究者開始研究
如何用小波變換表示紋理特徵。smiht和chang利用從小波子帶中提取的統計量(平均值和方差)作為紋理特徵。這個演演算法在112幅Brodatz紋理圖像中達到了90%的準確率。為了利用中間帶的特徵,Chang和Kuo開發出一種樹型結構的小波變化來進一步提高分類的準確性。還有一些研究者將小波變換和其他的變換結合起來以得到更好的性能,如Thygaarajna等人結合小波變換和共生矩陣,以兼顧基於統計的和基於變換的紋理分析演演算法的優點。
基於形狀的圖像分類技術
形狀是圖像的重要可視化內容之一在二維圖像空間中,形狀通常被認為是一條封閉的輪廓曲線所包圍的區域,所以對形狀的描述涉及到對輪廓邊界的描述以及對這個邊界所包圍區域的描述。目前的基於形狀分類方法大多圍繞著從形狀的輪廓特徵和形狀的區域特徵建立圖像索引。關於對形狀輪廓特徵的描述主要有:直線段描述、樣條擬合曲線、傅立葉描述子以及高斯參數曲線等等。
實際上更常用的辦法是採用區域特徵和邊界特徵相結合來進行形狀的相似分類。如Eakins等人提出了一組重畫規則並對形狀輪廓用線段和圓弧進行簡化表達,然後定義形狀的鄰接族和形族兩種分族函數對形狀進行分類。鄰接分族主要採用了形狀的邊界信息,而形狀形族主要採用了形狀區域信息。在形狀進行匹配時,除了每個族中形狀差異外,還比較每個族中質心和周長的差異,以及整個形狀的位置特徵矢量的差異,查詢判別距離是這些差異的加權和。
基於空間關係的圖像分類技術
在圖像信息系統中,依據圖像中對象及對象間的空間位置關係來區別圖像庫中的不同圖像是一個非常重要的方法。因此,如何存貯圖像對象及其中對象位置關係以方便圖像的分類,是圖像資料庫系統設計的一個重要問題。而且利用圖像中對象間的空間關係來區別圖像,符合人們識別圖像的習慣,所以許多研究人員從圖像中對象空間位置關係出發,著手對基於對象空間位置關係的分類方法進行了研究。早在1976年,Tanimoto提出了用像元方法來表示圖像中的實體,並提出了用像元來作為圖像對象索引。隨後被美國匹茲堡大學chang採納並提出用二維符號串(2D一String)的表示方法來進行圖像空間關係的分類,由於該方法簡單,並且對於部分圖像來說可以從ZD一String重構它們的符號圖,因此被許多人採用和改進,該方法的缺點是僅用對象的質心表示空間位置;其次是對於一些圖像來
說我們不能根據其ZD一string完個重構其符號圖;再則是上述的空間關係太簡單,實際中的空間關係要複雜得多。,針對這些問題許多人提出了改進力一法。Jungert根據圖像對象的最小包圍盒分別在:x軸方向和y軸上的投影區間之間的交疊關係來表示對象之間的空間關係,隨後Cllallg和Jungert等人又提出了廣義ZD一string(ZDG一String)的方法,將圖像對象進一步切分為更小的子對象來表示對象的空間關係,但是該方法不足之處是當圖像對象數日比較多且空間關係比較複雜時,需要切分的子對象的數目很多,存儲的開銷太大,針對此Lee和Hsu等人提出了ZDC一string的方一法,它們採用Anell提出的13種時態間隔關係並應用到空間投影區問上來表達空間關係。在x軸方向和y軸方向的組合關係共有169種,他提出了5種基本關係轉換法則,在此基礎上又提出了新的對象切分方法。採用
ZDC一string的方法比ZDG一string切分子對象的數目明顯減少。為了在空間關係中保留兩個對象的相對空間距離和對象的大小,Huang等人提出了ZDC書string的方法提高符號圖的重構精度,並使得對包含對象相對大小、距離的符號圖的推理成為可能。上述方法都涉及到將圖像對象進行劃分為子對象,且在用符號串重構對象時處理時間的開銷都比較大,為解決這些方法的不足,Lee等人又提出了ZDB一String的方法,它不要求對象進一步劃分,用對象的名稱來表示對象的起點和終點邊界。為了解決符號圖的重構問題,Chin一ChenCllang等人提出了面向相對坐標解決符號圖的重構問題,Chin一ChenChang等人提出了面向相對坐標符號串表示(RCOS串),它們用對象最小外接包圍盒的左下角坐標和右上角坐標來表示對象之間的空間關係.
對於對象之間的空間關係採用Allen提出的13種區間表示方法。實際上上述所有方法都不是和對象的方位無關,為此Huang等人又提出了RSString表示方法。雖然上述各種方法在對圖像對象空間信息的分類起到過一定作用,由於它們都是採用對象的最小外接矩形來表示一個對象空間位置,這對於矩形對象來說是比較合適的,但是當兩個對象是不規則形狀,且它們在空間關係上是分離時,它們的外接矩形卻存在著某種包含和交疊,結果出現對這些對象空間關係的錯誤表示。用上述空間關係進行圖像分類都是定性的分類方一法,將圖像的空間關係轉換為圖像相似性的定量度量是一個較為困難的事情。Nabil綜合ZD一String方法和二維平面中對象之間的點集拓撲關係。提出了ZD一PIR分類方法,兩個對象之間的相似與否就轉換為兩個圖像的ZD一PIR圖之間是否同構。ZD一PIR中只有圖像對象之間的空間拓撲關係具有旋轉不變性,在進行圖像分類的時候沒有考慮對象之間的相對距離。
圖像空間的分類方法—利用圖像的灰度,顏色,紋理,形狀,位置等底層特徵對圖像進行分類;例如:
利用灰度直方圖特徵對圖像進行分類;
利用紋理特徵對圖像進行分類;
採用紋理,邊緣和顏色直方圖混合特徵對圖像進行分類 ;
,,均採用SVM作為分類器.
圖像空間的分類方法的共同缺點是數據量大,計算複雜性高,但分類精度一般比較理想.
特徵空間的分類方法—首先將原圖像經過某種變換如K-L變換,小波變換等變換到特徵空間,然後在特徵空間提取圖像的高層特徵以實現圖像的分類。這類分類方法尤以紋理圖像分類和遙感圖像分類最多。以下是常見的紋理分類方法,基本上都用到了高波過濾器。
Support vector machine classifier Gabor filters and wavelet transform;
Multiple neural network classifiers Gabor filters;
Bayesian network classifier Gabor filters and Statistical features;
Support vector machine classifier Gabor filters
特徵空間的分類方法可降低數據維數,降低計算複雜性,但問題相關性較強,與特徵提取的方法和效果有很大關係.