重尾分佈

重尾分佈

概率論中,重尾分佈(Heavy-tailed distribution)是一種概率分佈模型,它的尾部比指數分佈還要厚。在許多情況下,右邊尾部的部分比較受到重視,但左邊尾部比較厚,或是兩邊尾部都比較厚的狀況,也被認為是一種重尾分佈。

定義


重尾分佈又可以分為兩個子類型,分別是長尾分佈(long-tailed distributions)以及次指數分佈(subexponential distributions)。
在一個累積分佈函數中,一個隨機變數X 的分佈狀況,在以下狀況時,被稱為是一個重尾分佈。假設:
如果以尾部分佈函數的方式來呈現時,
最後可以被寫成:
這相當於一個動差生成函數, ,對所有的 來說,都是無限的。重尾分佈的左尾,與雙尾分佈,定義相同 。

解釋


重尾分佈意味著可以更大的概率獲得很大的值. 因此與弱隨機性相反,重尾分佈一般表示病態,增加的各種結果被確定為具有重尾分佈,包括收入分佈、財務報告、保險支出、網頁的參考鏈接等。重尾分佈的一個特殊的子集是冪律,其意味著概率密度函數是一個冪。 一個技術難題是,不是所有的矩存在於這些分佈,這一般意味著它們使用分位數和其它順序統計學。這也就是說,中心極限定理不再成立。但是對於諸如均值,即穩定分佈的線性組合,我們獲得一個新的標準極限分佈
設X是一個隨機變數, 為它的分佈函數,如果當 時 稱X的分佈為重尾分佈,又稱冪律分佈
一般來說,服從重尾分佈的隨機變數X具有較大甚至是無窮大方差,而且當 時,X的均值也是無窮的。隨機變數X會以不可忽略的概率取到非常大的數值,即:大量的小抽樣取值和少量的大抽樣取值並存。

分類


1.長尾分佈
在一個累積分佈函數中,一個隨機變數X的分佈,出現以下狀況時,被稱為是一個長尾分佈。假設對所有 :
這相等於
對一個右尾部形成長尾分佈的狀況,我們可以做一個直觀的解釋:假如一個長尾分佈的尾部數量超過某個很高的水準,它超過另一個更高水準的機率會接近於一。也就是說,如果你發現狀況很糟,它可能會比你想像的還要糟。
長尾分佈是重尾分佈中的一個特例。所有的長尾分佈都是重尾分佈,但反之則不然,也就是說,我們可以找出某一個重尾分佈,它不是長尾分佈。

次指數分佈


次指數分佈是以概率分佈的折積定義出來的。兩個獨立、不同的隨機變數的共同分佈函數 ,它自己的折積定義為,使用勒貝格-史台傑斯積分(Lebesgue–Stieltjes integration) 定義為:
n-fold折積的 也以同樣方式定義。其尾端分佈函數定義為{。
當以下式子成立,概率分佈函數在正的中線上,被定義為次指數分佈:
這也意味著,對所有來說: