抗差估計
抗差估計
抗差估計(Robust Estimation,有人譯成“穩健估計”),實際是在粗差不可避免的情況下,選擇適當的估計方法使未知量估值儘可能減免粗差的影響,得出正常模式下的最佳估值。
一個估計方法當其依為根據的模型與實際模型有微小差異時,其估計方法的性能只受到微小的影響,即估計方法具有一定的“穩定性”。因若不然,則針對理論模型假設下的估值之優良性不僅沒有實際意義,還可能導致使用者誤入歧途。這是估計方法抗差性意義的一個方面。
估計方法抗差性的另一個方面的意義是當觀測樣本中混入少量粗差(outlier)時,估計量的數值受其影響不大,即估計方法具有一定的“抗干擾性”。因若不然,則極少數的觀測粗差都可能導致估計量面目全非。
這種既能抵制模型偏差又能抗拒異常觀測擾動的估值方法稱為抗差估計法。從一定意義上說,上述抗差性的兩種含義是相通的。因為當數據受到粗差污染時,該數據可被視為來自另—·個總體,其分佈與原來模型所規定者不同。
抗差估計所追求的並非只具有抗差性,還應具有其它的良好性能。抗差估計的三個主要目標:
(1)在所假定的模型下,估值具有合理的優效性(最優或接近最優),
(2)在實際模型與假設的模型有微小差異時,其估值或統計方法(如估值的漸近方差或檢驗量的檢驗功效等)所受的影響也較小,
(3)在實際模型與假定模型有嚴重偏離時,其估值的性能仍能“過得去”或者說,不致使估值受到破壞性影響。
Hampel等提出了與之相類似的四個抗差估計目標:
(1)估值應最優地擬合於觀測樣本(數據群體),
(2)估值方法應能識別異常值,
(3)對於不平衡設計空間,估值方法應能識彆強影響觀測,
(4)估值方法應能處理與假設相關結構有偏離的數據。
在其它文獻中,還有許多抗差估計目標。如高漸近相對效率(relative efficiency)或高絕對效率(absolute;efficiency)等,但這些目標與前面提到的抗差目標相比要次要一些。
統計學家已經發展了各種不同的穩健估計統計方法。三種較基本的抗差估計類是:極大似然型估計(M估計)、順序統計量線性組合型估計類(L估計)和非參數型秩檢驗估計(R估計)。
抗差估計應具備兩大特點:一是它能消除和削弱粗差對參數估值的影響。二是它基本上具備經典估計的一些優良特性。前者是主要的,因為一個不可靠的估計量很難保證其估值是有效的。有兩種方式排除粗差對估值的干擾。一種是完全排除一部分可疑的觀測值。另一種只是對一些觀測值加以限制,削弱它們對估值影響的程度。後者在排除粗差方面比前者要緩和一些,其目的是避免損失一些還可以利用的信息。鑒別粗差的方法有多種,基本上都是根據余差絕對直的大小來判定。因此在處理粗差之前,要事先對觀測數據進行“前期”平差計算來獲得余差。為了通過余差正確地發現粗差,要求尋找一種抗差能力很強的平差模型。前期平差的目的是獲得可靠的余差,並不十分強調估值的效率。
有了抗差估計的數學模型還不夠,還要研究抗差估計的計算方法。實際上,在抗差估計的計算中,排除粗差和求有效估值不能絕然分開,因此抗差估計的計算是逐步趨近最佳解的迭代過程。
總之,抗差估計理論研究的最終目的是尋求一些具有實際意義的有效估計。