共找到2條詞條名為變異係數的結果 展開

變異係數

概率分佈離散程度的歸一化量度

變異係數(Coefficient of Variation):當需要比較兩組數據離散程度大小的時候,如果兩組數據的測量尺度相差太大,或者數據量綱的不同,直接使用標準差來進行比較不合適,此時就應當消除測量尺度和量綱的影響,而變異係數可以做到這一點,它是原始數據標準差與原始數據平均數的比。CV沒有量綱,這樣就可以進行客觀比較了。事實上,可以認為變異係數和極差、標準差和方差一樣,都是反映數據離散程度的絕對值。其數據大小不僅受變數值離散程度的影響,而且還受變數值平均水平大小的影響。

定義


在概率論和統計學中,變異係數,又稱“離散係數”(英文:coefficient of variation),是概率分佈離散程度的一個歸一化量度,其定義為標準差與平均值之比:
變異係數(coefficient of variation)只在平均值不為零時有定義,而且一般適用於平均值大於零的情況。變異係數也被稱為標準離差率或單位風險。
變異係數只對由比率標量計算出來的數值有意義。舉例來說,對於一個氣溫的分佈,使用開爾文或攝氏度來計算的話並不會改變標準差的值,但是溫度的平均值會改變,因此使用不同的溫標的話得出的變異係數是不同的。也就是說,使用區間標量得到的變異係數是沒有意義的。

基本含義


一般來說,變數值平均水平高,其離散程度的測度值越大,反之越小。
變異係數是衡量資料中各觀測值變異程度的另一個統計量。當進行兩個或多個資料變異程度的比較時,如果度量單位與平均數相同,可以直接利用標準差來比較。如果單位和(或)平均數不同時,比較其變異程度就不能採用標準差,而需採用標準差與平均數的比值(相對值)來比較。標準差與平均數的比值稱為變異係數,記為。變異係數可以消除單位和(或)平均數不同對兩個或多個資料變異程度比較的影響。
變異係數的計算公式為:
在進行數據統計分析時,如果變異係數大於15%,則要考慮該數據可能不正常,應該剔除。

舉例


已知某良種豬場長白成年母豬平均體重為190kg,標準差為10.5kg,而大約克成年母豬平均體重為196kg,標準差為8.5kg,試問兩個品種的成年母豬,那一個體重變異程度大。
此例觀測值雖然都是體重,單位相同,但它們的平均數不相同,只能用變異係數來比較其變異程度的大小。
由於,長白成年母豬體重的變異係數:
大約克成年母豬體重的變異係數:
所以,長白成年母豬體重的變異程度大於大約克成年母豬。
注意,變異係數的大小,同時受平均數和標準差兩個統計量的影響,因而在利用變異係數表示資料的變異程度時,最好將平均數和標準差也列出。

公式


(標準偏差SD、平均值MN)

優缺點


優點

比起標準差來,變異係數的好處是不需要參照數據的平均值。變異係數是一個無量綱量,因此在比較兩組量綱不同或均值不同的數據時,應該用變異係數而不是標準差來作為比較的參考。

缺陷

● ● 當平均值接近於0的時候,微小的擾動也會對變異係數產生巨大影響,因此造成精確度不足。
● ● 變異係數無法發展出類似於均值的置信區間的工具。

應用


變異係數在概率論的許多分支中都有應用,比如說在更新理論、排隊理論和可靠性理論中。在這些理論中,指數分佈通常比正態分佈更為常見。
由於指數分佈的標準差等於其平均值,所以它的變異係數等於一。變異係數小於一的分佈,比如愛爾朗分佈稱為低差別的,而變異係數大於一的分佈,如超指數分佈則被稱為高差別的。