對應分析法
對應分析法
對應分析(Correspondence analysis)也稱關聯分析、R-Q型因子分析,是近年新發展起來的一種多元相依變數統計分析技術,通過分析由定性變數構成的交互匯總表來揭示變數間的聯繫。
對應分析法可以揭示同一變數的各個類別之間的差異,以及不同變數各個類別之間的對應關係。主要應用在市場細分、產品定位、地質研究以及計算機工程等領域中。原因在於,它是一種視覺化的數據分析方法,它能夠將幾組看不出任何聯繫的數據,通過視覺上可以接受的定點陣圖展現出來。
對應分析是由法國人Benzenci於1970年提出的,起初在法國和日本最為流行,然後引入到美國。對應分析法是在R型和Q型因子分析的基礎上發展起來的一種多元統計分析方法,因此對應分析又稱為R-Q型因子分析。在因子分析中,如果研究的對象是樣品,則需採用Q型因子分析;如果研究的對象是變數,則需採用R型因子分析。但是,這兩種分析方法往往是相互對立的,必須分別對樣品和變數進行處理。因此,因子分析對於分析樣品的屬性和樣品之間的內在聯繫,就比較困難,因為樣品的屬性是變值,而樣品卻是固定的。於是就產生了對應分析法。對應分析就克服了上述缺點,它綜合了R型和Q型因子分析的優點,並將它們統一起來使得由R型的分析結果很容易得到Q型的分析結果,這就克服了Q型分析計算量大的困難;更重要的是可以把變數和樣品的載荷反映在相同的公因子軸上,這樣就把變數和樣品聯繫起來便於解釋和推斷。
對應分析的基本思想是將一個聯列表的行和列中各元素的比例結構以點的形式在較低維的空間中表示出來。它最大特點是能把眾多的樣品和眾多的變數同時作到同一張圖解上,將樣品的大類及其屬性在圖上直觀而又明了地表示出來,具有直觀性。另外,它還省去了因子選擇和因子軸旋轉等複雜的數學運算及中間過程,可以從因子載荷圖上對樣品進行直觀的分類,而且能夠指示分類的主要參數(主因子)以及分類的依據,是一種直觀、簡單、方便的多元統計方法。
對應分析法整個處理過程由兩部分組成:表格和關聯圖。對應分析法中的表格是一個二維的表格,由行和列組成。每一行代表事物的一個屬性,依次排開。列則代表不同的事物本身,它由樣本集合構成,排列順序並沒有特別的要求。在關聯圖上,各個樣本都濃縮為一個點集合,而樣本的屬性變數在圖上同樣也是以點集合的形式顯示出來。