離散變數

變數值可按順序列舉的整數變數

變數按其數值表現是否連續,分為連續變數和離散變數。離散變數指變數值可以按一定順序一一列舉,通常以整數位取值的變數。如職工人數、工廠數、機器台數等。有些性質上屬於連續變數的現象也按整數取值,即可以把它們當做離散變數來看待。例如年齡、評定成績等雖屬連續變數,但一般按整數計算,按離散變數來處理。離散變數的數值用計數的方法取得。

基礎知識


基本介紹

為了表達上的簡潔和方便,用變數表示隨機事件的所有可能的結果,稱為隨機變數。隨機變數的取值與對應的概率值之間的對應關係稱為概率分佈。變數就是可變的數量標誌。變數值就是變數的具體表現,也就是可變數量標誌的數值表現。例如,職工人數是一個變數;某工廠有工人852人,另一個工廠有工人743人,第三個工廠有工人802人,等等,這是工人這個變數的具體數值,也就是變數值。用統計符號表示,X是工人的變數,其變數值為。必須注意變數和變數值的區別。例如,有工人30人、40人、50人、60人等四個值,要求其平均數。這時,不能說是四個“變數”的平均,因為這裡只有“工人”這一個變數,並沒有四個變數;所以要平均的是這個變數的四個數值,即四個變數值。
變數按其數值表現是否連續,分為連續變數和離散變數。連續變數的數值是連接不斷的,相鄰兩值之間可作無限分割,例如,身高、體重、年齡等都是連續變數。年齡一般雖按整數計算,但如嚴格按出生時間起算,是可以細算到許多位小數的。連續變數的數值要用測量或計算的方法取得。離散變數的各變數值之間都是以整數斷開的,如人數、工廠數、機器台數等,都只能按整數計算。離散變數的數值只能用計數的方法取得。

定義

可取值能一個個列出來的變數稱為離散變數,可取值能充滿一個區間的變數稱為連續變數。10名患者痊癒人數 及擲幣結果 是離散變數。正常人體溫的測定值 是連續變數。
10名患者,服用甲葯痊癒人數,服用乙葯痊癒人數也是,可見,僅有隨機變數的可取值無法全面反映藥效,還必須考慮取每一個值的概率。
定義1:設離散變數。事件 的概率稱X的概率函數,即
概率函數的對應值表稱概率函數表。圖像稱概率函數圖。概率函數及函數表、圖。都能反映離散變數與概率的對應關係,統稱離散變數的概率分佈,實際問題中簡稱為離散總體。
複雜事件 是基本事件的並事件其概率 稱為離散變數X的累積概率。
定理1若 為離散變數X的概率函數,則累積概率為概率函數之和,即
證明:由互斥事件加法定理可證。
定理1表示,在x為橫軸.p(x)為縱軸的概率函數圖中。累積概率 表示從 到 之間函數線的長度之和。
複雜事件 就是必然事件。從而得到。離散變數的全部函數線長度之和為1。
定義2 事件 的概率稱為隨機變數X的分佈函數。即
由定理1可知。離散變數X的分佈函數 是一種累積概率。等於 及其左邊函數線長度之和。即

離散變數的概率分佈


離散變數的概率分佈,常用的有二項分佈泊松(Poisson)分佈。其餘的還有兩點分佈、幾何分佈、超幾何分佈等概率分佈。

二項分佈

二項分佈是基於貝努里(Bernoulli)試驗的分佈。貝努里試驗是一種重要的概率模型。是歷史上最早研究的概率論模型之一。有下面兩個特點的試驗稱為貝努里試驗。即
(1) 對立性:每次試驗的結果只可能是A或;
(2) 獨立重複性:每次試驗的結果互不影響。且
擲幣(擲正與擲反)、射擊(擊中與不中)、動物試驗(存活與死亡)、藥物療效(有效與無效)、化驗結果(陽性與陰性)等。都是在重複進行貝努里試驗。
定義3 若隨機變數X的概率函數為
則稱X服從參數為n,p的二項分佈。記為或。

泊松分佈

若在大量的貝努里試驗中,很小,則稱這種概率模型為稀有事件概率模型。生三胞胎次數、患癌症人數、自然死亡人數、水中的大腸桿菌數、大氣粉塵數、顯微鏡下微粒個數、放射粒子個數、大量產品中的次品數、搖獎中的一等獎等,都是稀有事件概率模型。
若隨機變數X的概率函數為
則稱X服從參數為的泊松分佈,記為或。
實際問題中,貝努里試驗在時,可認為是泊松總體,事件A出現的次數。在已知時取,在不全知時取=平均數/單元。
泊松分佈的概率函數圖在較小時是偏向一側的,隨著增大,概率函數圖逐漸對稱。

離散變數的其他分佈

這裡,介紹離散變數的二點分佈、幾何分佈、超幾何分佈。
定義4:設離散變數X的概率函數為
則稱X服從參數為的二點分佈。
定義5:設離散變數X的概率函數為
則稱X服從參數為P的幾何分佈。
定義6:設離散變數X的概率函數為
則稱X服從超幾何分佈。