樣本方差

統計學術語

先求出總體各單位變數值與其算術平均數的離差的平方,然後再對此變數取平均數,就叫做樣本方差。樣本方差用來表示一列數的變異程度。樣本均值又叫樣本均數。即為樣本的均值。

均值是指在一組數據中所有數據之和再除以數據的個數。

簡介


先求出總體各單位變數值與其算術平均數的離差的平方,然後再對此變數取平均數,就叫做樣本方差。
在許多實際情況下,人口的真實差異事先是不知道的,必須以某種方式計算。當處理非常大的人口時,不可能對人口中的每個物體進行計數,因此必須對人口樣本進行計算。樣本方差也可以應用於從該分佈的樣本的連續分佈的方差的估計。

無偏性


我們從一個樣本取n個值,其中,並根據這個樣本估計方差。直接取樣本數據的方差給出平均偏差的平均值:
這裡,表示樣本均值。
由於 是隨機選擇的,所以 和 是隨機變數。他們的預期值可以通過從群體中的大小為n的所有可能樣本 的集合進行平均來評估。對於,有
因此 給出了基於因子 的人口方差的估計值。被稱為偏樣本方差。糾正該偏差之後形成無偏樣本方差:
估計值可以簡單地稱為樣本方差。同樣的證明也適用於從連續概率分佈中抽取的樣本。
例如,個樣本觀測值值為則樣本均值= ,樣本方差 。樣本方差是常用的統計量之一,是描述一組數據變異程度或分散程度大小的指標。
實際上,樣本方差可以理解成是對所給總體方差的一個無偏估計。。
的使用稱為貝塞爾校正(Bessel's correction),也用於樣本協方差和樣本標準偏差(方差平方根)。平方根是一個凹函數,因此引入負偏差(由Jensen不等式),這取決於分佈,因此校正樣本標準偏差(使用貝塞爾校正)有偏差。標準偏差的無偏估計是一個技術上涉及的問題,儘管對於使用術語的正態分佈,形成無偏估計。
無偏樣本方差是函數的U統計量,這意味著它是通過對群體的兩個樣本統計平均得到的。

分佈


作為隨機變數的函數,樣本方差本身就是一個隨機變數,研究其分佈是很自然的。在yi是來自正態分佈的獨立觀察的情況下,Cochran定理表明s服從卡方分佈:
所以可求;
如果獨立同分佈,但不一定是正態分佈,那麼
如果大數定律的條件對於平方觀測值同樣適用,則是的一致估計量。可以看出,估計的方差趨於零。在Kenney and Keeping(1951:164),Rose和Smith(2002:264)和Weisstein(n.d.)中給出了漸近等效的公式。
正態總體的樣本均值和樣本方差相互獨立。