混淆矩陣

表示精度評價的標準格式

混淆矩陣也稱誤差矩陣,是表示精度評價的一種標準格式,用n行n列的矩陣形式來表示。具體評價指標有總體精度、製圖精度、用戶精度等,這些精度指標從不同的側面反映了圖像分類的精度。在人工智慧中,混淆矩陣(confusion matrix)是可視化工具,特別用於監督學習,在無監督學習一般叫做匹配矩陣。在圖像精度評價中,主要用於比較分類結果和實際測得值,可以把分類結果的精度顯示在一個混淆矩陣裡面。混淆矩陣是通過將每個實測像元的位置和分類與分類圖像中的相應位置和分類相比較計算的。

簡介


混淆矩陣(Confusion Matrix):
混淆矩陣
混淆矩陣
混淆矩陣的每一列代表了預測類別,每一列的總數表示預測為該類別的數據的數目;每一行代表了數據的真實歸屬類別,每一行的數據總數表示該類別的數據實例的數目。每一列中的數值表示真實數據被預測為該類的數目:如下圖,第一行第一列中的43表示有43個實際歸屬第一類的實例被預測為第一類,同理,第一行第二列的2表示有2個實際歸屬為第一類的實例被錯誤預測為第二類。

舉例


如有150個樣本數據,預測為1,2,3類各為50個。分類結束后得到的混淆矩陣為:
預測
類1類2類3
實際類1432
類25451
類32349
每一行之和表示該類別的真實樣本數量,每一列之和表示被預測為該類別的樣本數量,
第一行說明有43個屬於第一類的樣本被正確預測為了第一類,有兩個屬於第一類的樣本被錯誤預測為了第二類。