隨機變數

隨機現象中各種結果的實值函數

隨機變數(random variable)表示隨機現象(在一定條件下,並不總是出現相同結果的現象稱為隨機現象)中各種結果的實值函數(一切可能的樣本點)。例如某一時間內公共汽車站等車乘客人數,電話交換台在一定時間內收到的呼叫次數等,都是隨機變數的實例。隨機變數與模糊變數的不確定性的本質差別在於,後者的測定結果仍具有不確定性,即模糊性。隨機事件不論與數量是否直接有關,都可以數量化,即都能用數量化的方式表達。隨機事件數量化的好處是可以用數學分析的方法來研究隨機現象。例如某一時間內公共汽車站等車乘客人數,電話交換台在一定時間內收到的呼叫次數,燈泡的壽命等等,都是隨機變數的實例。

詳細分析


表示方法

隨機試驗結果的量的表示。例如擲一顆骰子出現的點數,電話交換台在一定時間內收到的呼叫次數,隨機抽查的一個人的身高,懸浮在液體中的微粒沿某一方向的位移,等等,都是隨機變數的實例。
一個隨機試驗的可能結果(稱為基本事件)的全體組成一個基本空間Ω(見概率)。隨機變數x是定義於Ω上的函數,即對每一基本事件,有一數值與之對應。以擲一顆骰子的隨機試驗為例,它的所有可能結果見,共6個,分別記作這時,,而出現的點數這個隨機變數x,就是Ω上的函數,。又如設是要進行抽查的n個人的全體,那麼隨意抽查其中一人的身高和體重,就構成兩個隨機變數x和Y,它們分別是Ω上的函數:”,,。一般說來,一個隨機變數所取的值可以是離散的(如擲一顆骰子的點數只取1到6的整數,電話台收到的呼叫次數只取非負整數),也可以充滿一個數值區間,或整個實數軸(如液體中懸浮的微粒沿某一方向的位移)。

研究方法

在研究隨機變數的性質時,確定和計算它取某個數值或落入某個數值區間內的概率是特別重要的。因此,隨機變數取某個數值或落入某個數值區間這樣的基本事件的集合,應當屬於所考慮的事件域。根據這樣的直觀想法,利用概率論公理化的語言,取實數值的隨機變數的數學定義可確切地表述如下:概率空間上的隨機變數x是定義於Ω上的實值可測函數,即對任意, 為實數,且對任意實數x,使的一切ω組成的Ω的子集是事件,也即是F中的元素。事件 常簡記作,並稱函數為x的分佈函數。
設x,Y是概率空間(Ω,F,p)上的兩個隨機變數,如果除去一個零概率事件外, 與相同,則稱以概率1成立,也記作或(α.s.意即幾乎必然)。
有些隨機現象需要同時用多個隨機變數來描述。例如對地面目標射擊,彈著點的位置需要兩個坐標才能確定,因此研究它要同時考慮兩個隨機變數,一般稱同一概率空間 上的n個隨機變數構成的n維向量為n維隨機向量。隨機變數可以看作一維隨機向量。稱n元的函數為X的(聯合)分佈函數。又如果(x,x)為二維隨機向量,則稱為復隨機變數。
隨機變數的獨立性 獨立性是概率論所獨有的一個重要概念。設 是n個隨機變數,如果對任何n個實數 都有 即它們的聯合分佈函數 等於它們各自的分佈函數的乘積,即則稱 是獨立的。這一定義可以直接推廣到每一是隨機向量的情形。獨立性的直觀意義是: 中的任何一個取值的概率規律,並不隨其中的其他隨機變數取什麼值而改變。在實際問題中通常用它來表徵多個獨立操作的隨機試驗結果或多種有獨立來源的隨機因素的概率特性,因此它對於概率統計的應用是十分重要的。
從隨機變數(或向量) 的獨立性還可以推出:設B是x取值的空間中的任意波萊爾集,,則有設 是獨立的,則它們中的任意個都是獨立的。但逆之即使其中任何個是獨立的,也不保證 是獨立的。又如果是n個連續函數或初等函數(或更一般的波萊爾可測函數),則從 的獨立性可推出也獨立。如果隨機變數(隨機向量)序列 中任何有限個都獨立,則稱之為獨立隨機變數(隨機向量)序列。
關於隨機變數的矩、特徵函數、母函數及半不變數,分別見數學期望方差、矩及概率分佈

概念


在做實驗時,常常是相對於試驗結果本身而言,我們主要還是對結果的某些函數感興趣。例如,在擲骰子時,我們常常關心的是兩顆骰子的點和數,而並不真正關心其實際結果,就是說,我們關心的也許是其點和數為7,而並不關心其實際結果是否是(1,6)或(2,5)或(3,4)或(4,3)或(5,2)或(6,1)。我們關注的這些量,或者更形式的說,這些定義在樣本空間上的實值函數,稱為隨機變數。
因為隨機變數的值是由試驗結果決定的,所以我們可以給隨機變數的可能值指定概率。

基本類型


簡單地說,隨機變數是指隨機事件的數量表現。例如一批註入某種毒物的動物,在一定時間內死亡的只數;某地若干名男性健康成人中,每人血紅蛋白量的測定值;等等。另有一些現象並不直接表現為數量,例如人口的男女性別、試驗結果的陽性或陰性等,但我們可以規定男性為1,女性為0,則非數量標誌也可以用數量來表示。這些例子中所提到的量,儘管它們的具體內容是各式各樣的,但從數學觀點來看,它們表現了同一種情況,這就是每個變數都可以隨機地取得不同的數值,而在進行試驗或測量之前,我們要預言這個變數將取得某個確定的數值是不可能的。
按照隨機變數可能取得的值,可以把它們分為兩種基本類型:
離散型
離散型(discrete)隨機變數即在一定區間內變數取值為有限個或可數個。例如某地區某年人口的出生數、死亡數,某葯治療某病病人的有效數、無效數等。離散型隨機變數通常依據概率質量函數分類,主要分為:伯努利隨機變數、二項隨機變數、幾何隨機變數和泊松隨機變數。
連續型
連續型(continuous)隨機變數即在一定區間內變數取值有無限個,或數值無法一一列舉出來。例如某地區男性健康成人的身長值、體重值,一批傳染性肝炎患者的血清轉氨酶測定值等。有幾個重要的連續隨機變數常常出現在概率論中,如:均勻隨機變數、指數隨機變數、伽馬隨機變數和正態隨機變數。

期望


離散情形
如果X是離散隨機變數,具有概率質量函數,那麼X的期望值定義為。換句話說,X的期望是X可能取的值的加權平均,每個值被X取此值的概率所加權。
連續情形
我們也可以定義連續隨機變數的期望值。如果X是具有概率密度函數f(x)的連續隨機變數,那麼X的期望就定義為。換句話說,在 上均勻分佈的隨機變數的期望值正是區間的中點。

性質


隨機變數在不同的條件下由於偶然因素影響,可能取各種隨機變數不同的值,故其具有不確定性和隨機性,但這些取值落在某個範圍的概率是一定的,此種變數稱為隨機變數。隨機變數可以是離散型的,也可以是連續型的。如分析測試中的測定值就是一個以概率取值的隨機變數,被測定量的取值可能在某一範圍內隨機變化,具體取什麼值在測定之前是無法確定的,但測定的結果是確定的,多次重複測定所得到的測定值具有統計規律性。隨機變數與模糊變數的不確定性的本質差別在於,後者的測定結果仍具有不確定性,即模糊性。