超幾何分佈

統計學上的離散概率分佈

超幾何分佈是專業術語,拼音為chāo jǐ hé fēn bù,是統計學上一種離散概率分佈。它描述了從有限N個物件(其中包含M個指定種類的物件)中抽出n個物件,成功抽出該指定種類的物件的次數(不放回)。稱為超幾何分佈,是因為其形式與“超幾何函數”的級數展式的係數有關。超幾何分佈中的參數是M,N,n,上述超幾何分佈記作X~H(n,M,N) 。

定義


產品抽樣檢查中經常遇到一類實際問題,假定在N件產品中有M件不合格品,即不合格率
在產品中隨機抽n件做檢查,發現k件不合格品的概率為,k=0,1,2...min{n,M}。
亦可寫作(與上式不同的是M可為任意實數,而C表示的組合數M為非負整數
為古典概型的組合形式,a為下限,b為上限,此時我們稱隨機變數X服從超幾何分佈(hypergeometric distribution)。
需要注意的是:
(1)超幾何分佈的模型是不放回抽樣。
(2)超幾何分佈中的參數是M,N,n,上述超幾何分佈記作X~H(n,M,N)。

應用


示例

已經知道某個事件的發生概率,判斷從中取出一個小樣本,該事件以某一個機率出現的概率問題。
例:在一個口袋中裝有30個球,其中有10個紅球,其餘為白球,這些球除顏色外完全相同。遊戲者一次從中摸出5個球。摸到至少4個紅球就中一等獎,那麼獲一等獎的概率是多少?
解:由題意可見此問題歸結為超幾何分佈模型。
其中N = 30. D = 10. n = 5.
P(一等獎) = P(X=4) + P(X=5)
由公式 ,k=0,1,2,...得:
P(一等獎) =

期望

定理:對超幾何分佈X~H(n,M,N) ,隨機變數X的數學期望.
引理一:(1);(2)
引理二:(1);(2)
引理證明:它們均可用恆等式兩邊的展開式中含項的係數相等證明。僅以(2)中的情形證明如下:
的展開式中含項的係數為(注意)
定理證明:當M=N=1時,X的分佈列P(X=0)=1,且有n=1,可得此時欲證成立、
當M=1,N2時,X的分佈列為:
所以(引理一(2))
下證M2時也成立,又分兩種情形:
(1)又當nN-M時,X的分佈列見超幾何分佈的定義有
(2)又當n>N-M時,X的分佈列見超幾何分佈的定義有
因此定理獲證

方差

對X~H(n,M,N) , .
證明:
(此公式利用定義式簡單展開即得)
(提取,變形)
(拆項,變形)
(拆開∑,就是分組求和)
(化簡即得)
超幾何分佈和二項分佈的聯繫
(1)在超幾何分佈中,當 時, (二項分佈中的p)。
(2)當時,超幾何分佈的數學期望
(3)當時,超幾何分佈的方差(二項分佈的方差)。
(4)當時,超幾何分佈近似為二項分佈。

函數代碼


超幾何分佈計算函數
function HYPGEOMDIST(kkk,n,MM,NN)
for k=kkk to n
AA=1
BBA=1
BBB=1
lll=n
for i= 0 to k-1
BBA=BBA*(MM-i)/(NN-i)
next
for j= k to n
BBB=BBB*(NN-MM-j+k)/(NN-j)
next
BBs=BBB*BBA
if lll-k>k then
x=K
Else x=lll-k
end if
for i=1 to x
lll=lll-1
next
HYPGEOMDIST=HYPGEOMDIST+BBS
next
end function
response.write HYPGEOMDIST(200,2200,1000,17000)
%>