置信區間
由樣本統計量構造的總參數區間
置信區間是指由樣本統計量所構造的總體參數的估計區間。在統計學中,一個概率樣本的置信區間(Confidenceinterval)是對這個樣本的某個總體參數的區間估計。置信區間展現的是這個參數的真實值有一定概率落在測量結果的周圍的程度。置信區間給出的是被測量參數的測量值的可信程度,即前面所要求的“一個概率”。
置信區間是一種常用的區間估計方法,所謂置信區間就是分別以統計量的置信上限和置信下限為上下界構成的區間。對於一組給定的樣本數據,其平均值為μ,標準偏差為σ,則其整體數據的平均值的100(1-α)%置信區間為(,),其中α為非置信水平在正態分佈內的覆蓋面積,即為對應的標準分數。
對於一組給定的數據,定義為觀測對象,W為所有可能的觀測結果,X為實際上的觀測值,那麼X實際上是一個定義在上,值域在W上的隨機變數。這時,置信區間的定義是一對函數u(.)以及v(.),也就是說,對於某個觀測值,其置信區間為。實際上,若真實值為w,那麼置信水平就是概率c:
其中和都是統計量(即可觀測的隨機變數),而置信區間因此也是一個隨機區間:(U,V)。
置信區間的計算公式取決於所用到的統計量。置信區間是在預先確定好的顯著性水平下計算出來的,顯著性水平通常稱為α(希臘字母alpha),如前所述,絕大多數情況會將α設為0.05。置信度為,或者。於是,如果,那麼置信度則是0.95或95%,后一種表示方式更為常用。置信區間的常用計算方法如下:
其中:α是顯著性水平(例:0.05或0.10)
Pr表示概率,是單詞probability的縮寫;
100%或指置信水平(例:95%或90%)
表達方式:——置信區間。
第一步:求一個樣本的均值
第二步:計算出抽樣誤差。
人們經過實踐,通常認為調查:
100個樣本的抽樣誤差為±10%;
500個樣本的抽樣誤差為±5%;
1200個樣本時的抽樣誤差為±3%;
第三步:用第一步求出的“樣本均值”加、減第二步計算的“抽樣誤差”,得出置信區間的兩個端點。
窄的置信區間比寬的置信區間能提供更多的有關總體參數的信息。
假設全班考試的平均分數為65分,則
置信區間 | 間隔 | 寬窄度 | 表達的意思 |
0-100分 | 100 | 寬 | 等於什麼也沒告訴你 |
30-80分 | 50 | 較窄 | 你能估出大概的平均分了(55分) |
60-70分 | 10 | 窄 | 你幾乎能判定全班的平均分了(65分) |
置信區間與置信水平、樣本量等因素均有關係,其中樣本量對置信區間的影響為:在置信水平固定的情況下,樣本量越多,置信區間越窄。其次,在樣本量相同的情況下,置信水平越高,置信區間越寬。實例分析如下:
置信區間與置信水平、樣本量的關係
實例分析:
樣本量 | 置信區間 | 間隔 | 寬窄度 |
100 | 50%-70% | 20 | 寬 |
800 | 56.2%-63.2% | 7 | 較窄 |
1,600 | 57.5%-63% | 5.5 | 較窄 |
3,200 | 58.5%-62% | 3.5 | 更窄 |
由上表得出:
1、在置信水平相同的情況下,樣本量越多,置信區間越窄。
2、置信區間變窄的速度不像樣本量增加的速度那麼快,也就是說並不是樣本量增加一倍,置信區間也變窄一半(實踐證明,樣本量要增加4倍,置信區間才能變窄一半),所以當樣本量達到一個量時(通常是1,200,如上例三個國家各抽了1,200個消費者),就不再增加樣本了。
置信區間=點估計±(關鍵值×點估計的標準差)
在其他因素不變的情況下,樣本量越多(大),置信區間越窄(小)。
2.置信水平對置信區間的影響:在樣本量相同的情況下,置信水平越高,置信區間越寬。
美國做了一項對總統工作滿意度的調查。在調查抽取的1,200人中,有60%的人讚揚了總統的工作,抽樣誤差為±3%,置信水平為95%;如果將抽樣誤差減少為±2.3%,置信水平降到為90%。則兩組數字的情況比較如下:
抽樣誤差 | 置信水平 | 置信區間 | 間隔 | 寬窄度 |
±3% | 95% | 6 | 寬 | |
±2.3% | 90% | 4.6 | 窄 |
由上表得出:
在樣本量相同的情況下(都是1,200人),置信水平越高(95%),置信區間越寬。