非參數統計法

非參數統計法

非參數統計法是當總體的具體分佈函數形式未知且假設是關於分佈本身而不是某些參數時,對這種類型的假設所做的推斷方法。該法利用所謂的次序統計量,就是按大小次序排列的樣本觀測數據。人們可以令x1為最小的樣本觀測值,x2是第二小的,如此繼續排下去,直到最大的xn。一個基本定理表明,平均說來樣本把總體分為n+1個相等的部分,即總體的1/(n+1)處於任意兩個相繼的次序統計量之間。基於此原理的有1904年斯皮爾曼的秩檢驗。

基本介紹


蘇聯數學家柯爾莫哥洛夫(А.Колмогоров)和斯米爾諾夫(В.Смирнов)在20世紀30年代的工作開闢了非參數統計的一個方面。他們的方法基於樣本X1,X2,…,Xn的經驗分佈函數Fn(x)。柯爾莫哥洛夫考察Fn(x)與理論分佈F(x)的最大偏差△n,當△n超過一定限度時,否定這個理論分佈F(x)。這就是柯爾莫哥洛夫檢驗。斯米爾諾夫則考慮由兩個分佈為F(x)和G(x)的總體中抽出的樣本X1,X2…,Xm和Y1,Y2,…,Yn,計算其經驗分佈Fm(x)和Gn(x)的最大偏差△mn,當△mn超過一定限度時,否定F和G相等這個假設。這就是斯米爾諾夫檢驗。非參數統計的特點是對總體分佈的假設要求的條件很寬。因而針對這種問題而構造的非參數統計方法往往有較好的穩健性。但因為非參數統計方法要照顧範圍很廣的分佈,某些情況下會導致效率的降低。由於非參數統計問題的複雜性,還沒有一個統一的理論。尚有很多工作要做。