概率論

數學分支

概率論是研究隨機現象數量規律的數學分支。隨機現象是相對於決定性現象而言的。在一定條件下必然發生某一結果的現象稱為決定性現象。例如在標準大氣壓下,純水加熱到100℃時水必然會沸騰等。隨機現象則是指在基本條件不變的情況下,每一次試驗或觀察前,不能肯定會出現哪種結果,呈現出偶然性。例如,擲一硬幣,可能出現正面或反面。隨機現象的實現和對它的觀察稱為隨機試驗。隨機試驗的每一可能結果稱為一個基本事件,一個或一組基本事件統稱隨機事件,或簡稱事件。典型的隨機試驗有擲骰子、扔硬幣、抽撲克牌以及輪盤遊戲等。

事件的概率是衡量該事件發生的可能性的量度。雖然在一次隨機試驗中某個事件的發生是帶有偶然性的,但那些可在相同條件下大量重複的隨機試驗卻往往呈現出明顯的數量規律。

發展過程


起源

概率論是一門研究事情發生的可能性的學問,但是最初概率論的起源與賭博問題有關。16世紀,義大利的學者吉羅拉莫·卡爾達諾(Girolamo Cardano)開始研究擲骰子等賭博中的一些簡單問題。
概率與統計的一些概念和簡單的方法,早期主要用於賭博和人口統計模型。隨著人類的社會實踐,人們需要了解各種不確定現象中隱含的必然規律性,並用數學方法研究各種結果出現的可能性大小,從而產生了概率論,並使之逐步發展成一門嚴謹的學科。概率與統計的方法日益滲透到各個領域,並廣泛應用於自然科學、經濟學、醫學、金融保險甚至人文科學中。

發展

隨著18、19世紀科學的發展,人們注意到在某些生物、物理和社會現象與機會遊戲之間有某種相似性,從而由機會遊戲起源的概率論被應用到這些領域中;同時這也大大推動了概率論本身的發展。使概率論成為數學的一個分支的奠基人是瑞士數學家伯努利,他建立了概率論中第一個極限定理,即伯努利大數定律,闡明了事件的頻率穩定於它的概率。隨後棣莫弗和拉普拉斯又導出了第 二個基本極限定理(中心極限定理)的原始形式。拉普拉斯在系統總結前人工作的基礎上寫出了《分析的概率理論》,明確給出了概率的古典定義,並在概率論中引入了更有力的分析工具,將概率論推向一個新的發展階段。19世紀末,俄國數學家切比雪夫、馬爾可夫、李亞普諾夫等人用分析方法建立了大數定律及中心極限定理的一般形式,科學地解釋了為什麼實際中遇到的許多隨機變數近似服從正態分佈。20世紀初受物理學的刺激,人們開始研究隨機過程。這方面柯爾莫哥洛夫維納、馬爾可夫、辛欽、萊維及費勒等人作了傑出的貢獻。

定義


傳統概率

傳統概率又叫拉普拉斯概率,因為其定義是由法國數學家拉普拉斯提出的。如果一個隨機試驗所包含的單位事件是有限的,且每個單位事件發生的可能性均相等,則這個隨機試驗叫做拉普拉斯試驗。在拉普拉斯試驗中,事件A在事件空間S中的概率P(A)為:
例如,在一次同時擲一個硬幣和一個骰子的隨機試驗中,假設事件A為獲得國徽面且點數大於4,那麼事件A的概率應該有如下計算方法:S={(國徽,1點),(數字,1點),(國徽,2點),(數字,2點),(國徽,3點),(數字,3點),(國徽,4點),(數字,4點),(國徽,5點),(數字,5點),(國徽,6點),(數字,6點)},A={(國徽,5點),(國徽,6點)},按照拉普拉斯定義,A的概率為,注意到在拉普拉斯試驗中存在著若干的疑問,在現實中是否存在著這樣一個試驗,其單位事件的概率具有精確的相同的概率值,因為人們不知道,硬幣以及骰子是否"完美",即骰子製造的是否均勻,其重心是否位於正中心,以及輪盤是否傾向於某一個數字等等。儘管如此,傳統概率在實踐中被廣泛應用於確定事件的概率值,其理論根據是:如果沒有足夠的論據來證明一個事件的概率大於另一個事件的概率,那麼可以認為這兩個事件的概率值相等。如果仔細觀察這個定義會發現拉普拉斯用概率解釋了概率,定義中用了"相同的可能性"(原文是égalementpossible)一詞,其實指的就是"相同的概率"。這個定義也並沒有說出,到底什麼是概率,以及如何用數字來確定概率。在現實生活中也有一系列問題,無論如何不能用傳統概率定義來解釋,比如,人壽保險公司無法確定一個50歲的人在下一年將死去的概率等。

公理化定義

如何定義概率,如何把概率論建立在嚴格的邏輯基礎上,是概率理論發展的困難所在,對這一問題的探索一直持續了3個世紀。20世紀初完成的勒貝格測度與積分理論及隨後發展的抽象測度和積分理論,為概率公理體系的建立奠定了基礎。在這種背景下,蘇聯數學家柯爾莫哥洛夫1933年在他的《概率論基礎》一書中第一次給出了概率的測度論的定義和一套嚴密的公理體系。他的公理化方法成為現代概率論的基礎,使概率論成為嚴謹的數學分支,對概率論的迅速發展起了積極的作用。
以下是公理化定義:
設隨機實驗E的樣本空間為Ω。若按照某種方法,對E的每一事件A賦予一個實數P(A),且滿足以下公理:
(1)非負性:;
(2)規範性:;
(3)可列(完全)可加性:對於兩兩互不相容的可列無窮多個事件A1,A2,……,An,……,有,則稱實數P(A)為事件A的概率。

統計定義

設隨機事件A在n次重複試驗中發生的次數為nA,若當試驗次數n很大時,頻率nA/n穩定地在某一數值p的附近擺動,且隨著試驗次數n的增加,其擺動的幅度越來越小,則稱數p為隨機事件A的概率,記為P(A)=p。

事件

事件包括單位事件、事件空間、隨機事件等。
在一次隨機試驗中可能發生的唯一的,且相互之間獨立的結果被稱為單位事件,用e表示。在隨機試驗中可能發生的所有單位事件的集合稱為事件空間,用S來表示。例如在一次擲骰子的隨機試驗中,如果用獲得的點數來表示單位事件,那麼一共可能出現6個單位事件,則事件空間可以表示為S={1,2,3,4,5,6}。上面的事件空間是由可數有限單位事件組成,事實上還存在著由可數無限以及不可數單位事件組成的事件空間,比如在一次直到獲得國徽面朝上的隨機擲硬幣試驗中,其事件空間由可數無限單位事件組成,表示為:S={國,數國,數數國,數數數國,數數數數國,···},注意到在這個例子中"數數數國"是單位事件。將兩根筷子隨意扔向桌面,其靜止后所形成的交角假設為α,這個隨機試驗的事件空間的組成可以表示為。
隨機事件是事件空間S的子集,它由事件空間S中的單位元素構成,用大寫字母A,B,C...表示。例如在擲兩個骰子的隨機試驗中,設隨機事件A="獲得的點數和大於10",則A可以由下面3個單位事件組成:A={(5,6),(6,5),(6,6)}。如果在隨機試驗中事件空間中的所有可能的單位事件都發生,這個事件被稱為必然事件,表示為;相應的如果事件空間里不包含任何一個單位事件,則稱之為不可能事件,表示為。
事件的計算
因為事件在一定程度上是以集合的含義定義的,因此可以把集合計算方法直接應用於事件的計算,也就是說,在計算過程中,可以把事件當作集合來對待。
A的補集
不屬於A的事件發生
聯集A∪B
或者A或者B或者A,B同時發生
交集A∩B
事件A,B同時發生
差集A\B
不屬於B的A事件發生)
空集A∩B=∅A,B事件不同時發生
子集B⊆A
如A發生,則B也一定發生
在輪盤遊戲中假設A代表事件“球落在紅色區域”,B代表事件"球落在黑色區域",C代表事件"球落在綠色區域",因為事件A和B沒有共同的單位事件,因此可表示為概率。
注意到事件A和B並不是互補的關係,因為在整個事件空間S中還有一個單位事件C,其即不是紅色也不是黑色,而是綠色,因此A,B的補集應該分別表示如下:以及。
條件概率
一事件A在一事件B確定發生後會發生的概率稱為B給之A的條件概率;其數值為(當 時)。若B給之A的條件概率和A的概率相同時,則稱A和B為獨立事件。且A和B的此一關係為對稱的,這可以由一同價敘述:“當A和B為獨立事件時,”看出。

相關事例

人們普遍認為,對將要發生的機率的一種不好的感覺,或者說不安全感(俗稱“點背”)是實際存在的。下面列出的幾個例子可以形象闡述人們有時對機率存在的錯誤的認識:
(1)六合彩:在六合彩(49選6)中,一共有13983816種可能性,普遍認為,如果每周都買一個不相同的號,最晚可以在(周)=268919年後獲得頭等獎。事實上這種理解是錯誤的,因為每次中獎的機率是相等的,中獎的可能性並不會因為時間的推移而變大。
(2)生日悖論:在一個足球場上有23個人(2×11個運動員和1個裁判員),不可思議的是,在這23人當中至少有兩個人的生日是在同一天的機率要大於50%。
(3)輪盤遊戲:在遊戲中玩家普遍認為,在連續出現多次紅色后,出現黑色的機率會越來越大。這種判斷也是錯誤的,即出現黑色的機率每次是相等的,因為球本身並沒有“記憶”,它不會意識到以前都發生了什麼,其機率始終是。
(4)三門問題:在電視台舉辦的猜隱藏在門後面的汽車的遊戲節目中,在參賽者的對面有三扇關閉的門,其中只有一扇門的後面有一輛汽車,其它兩扇門后是山羊。遊戲規則是,參賽者先選擇一扇他認為其後面有汽車的門,但是這扇門仍保持關閉狀態,緊接著主持人打開沒有被參賽者選擇的另外兩扇門中後面有山羊的一扇門,這時主持人問參賽者,要不要改變主意,選擇另一扇門,以使得贏得汽車的機率更大一些?
正確結果是,如果參賽者改變初衷,他的中獎概率將變成。因為打開山羊門的那一剎那,本來的選擇結果已經從幾率變到了幾率,如果改變初衷此時將是中獎的幾率。
有三種可能的情況,全部都有相等的可能性()︰參賽者挑山羊一號,主持人挑山羊二號。轉換將贏得汽車。參賽者挑山羊二號,主持人挑山羊一號。轉換將贏得汽車。參賽者挑汽車,主持人挑兩頭山羊的任何一頭。轉換將失敗。在頭兩種情況,參賽者可以通過轉換選擇而贏得汽車。第三種情況是唯一一種參賽者通過保持原來選擇而贏的情況。因為三種情況中有兩種是通過轉換選擇而贏的,所以通過轉換選擇而贏的概率是。

計算


需要提及的是下面將要介紹的9個計算概率的定理與上面已經提及的事件的計算沒有關係,所有關於概率的定理均由概率的3個公理得來,同時適用於包括拉普拉斯概率和統計概率在內的所有概率理論。

定理1

又稱互補法則。
與A互補事件的概率始終是。
第一次旋轉紅色不出現的概率是,按照乘法法則,第二次也不出現紅色的概率是,因此在這裡互補概率就是指在兩次連續旋轉中至少有一次是紅色的概率,為

定理2

不可能事件的概率為零。
證明: Q和S是互補事件,按照公理2有,再根據上面的定理1得到

定理3

如果A1...An事件不能同時發生(為互斥事件),而且若干事件A1,A2,...An∈S每兩兩之間是空集關係,那麼這些所有事件集合的概率等於單個事件的概率的和。
例如,在一次擲骰子中,得到5點或者6點的概率是:

定理4

如果事件A,B是差集關係,則有

定理5

任意事件加法法則:
對於事件空間S中的任意兩個事件A和B,有如下定理:概率

定理6

乘法法則:
事件A,B同時發生的概率是: ,前提為事件A,B有一定關聯。

定理7

無關事件乘法法則:
兩個不相關聯的事件A,B同時發生的概率是:注意到這個定理實際上是定理6(乘法法則)的特殊情況,如果事件A,B沒有聯繫,則有P(A|B)=P(A),以及P(B|A)=P(B)。觀察一下輪盤遊戲中兩次連續的旋轉過程,P(A)代表第一次出現紅色的概率,P(B)代表第二次出現紅色的概率,可以看出,A與B沒有關聯,利用上面提到的公式,連續兩次出現紅色的概率為:
忽視這一定理是造成許多玩家失敗的根源,普遍認為,經過連續出現若干次紅色后,黑色出現的概率會越來越大,事實上兩種顏色每次出現的概率是相等的,之前出現的紅色與之後出現的黑色之間沒有任何聯繫,因為球本身並沒有"記憶",它並不"知道"以前都發生了什麼。
所以,連續10次至少有1次出現紅色的概率為。

統計概率


統計概率是建立在頻率理論基礎上的,分別由英國邏輯學家約翰(John Venn,1834-1923)和奧地利數學家理查德(Richard VonMises,1883-1953)提出,他們認為,獲得一個事件的概率值的唯一方法是通過對該事件進行100次,1000次或者甚至10000次的前後相互獨立的n次隨機試驗,針對每次試驗均記錄下絕對頻率值和相對頻率值hn(A),隨著試驗次數n的增加,會出現如下事實,即相對頻率值會趨於穩定,它在一個特定的值上下浮動,也即是說存在著一個極限值P(A),相對頻率值趨向於這個極限值。
這個極限值被稱為統計概率,表示為: 。
例如,若想知道在一次擲骰子的隨機試驗中獲得6點的概率值可以對其進行3000次前後獨立的扔擲試驗,在每一次試驗後記錄下出現6點的次數,然後通過計算相對頻率值可以得到趨向於某一個數的統計概率值。
扔擲數獲得6點的絕對頻率獲得6點的相對頻率
111.00000
210.50000
310.33333
410.25000
520.40000
1020.20000
2050.25000
100120.12000
200390.19500
300460.15333
400720.18000
500760.15200
6001020.17000
7001200.17143
10001700.17000
20003430.17150
30005600.16867
上面提到的這個有關相對頻率的經驗值又被稱為大數定律,是頻率理論學家定義概率論的基礎。然而沒有人可以將骰子無限地扔下去,因此在實踐中也就無法有力的證明大數定律,許多來自數學理論的論證至今也沒有取得成功。儘管如此,統計概率在今天的實踐中具有重要意義,它是數理統計的基礎。

完全概率


n個事件H1,H2,...Hn互相間獨立,且共同組成整個事件空間S,即,而且。這時A的概率可以表示為
例如,一個隨機試驗工具由一個骰子和一個柜子中的三個抽屜組成,抽屜1里有14個白球和6個黑球,抽屜2里有2個白球和8個黑球,抽屜3里有3個白球和7個黑球,試驗規則是首先擲骰子,如果獲得小於4點,則抽屜1被選擇,如果獲得4點或者5點,則抽屜2被選擇,其他情況選擇抽屜3。然後在選擇的抽屜里隨機抽出一個球,最後抽出的這個球是白球的概率是:
P(白)=P(白|抽1)·P(抽1)+P(白|抽2)·P(抽2)+P(白|抽3)·P(抽3)
=(14/20)·(3/6)+(2/10)·(2/6)+(3/10)·(1/6)
=28/60=0.4667
從例子中可看出,完全概率特別適合於分析具有多層結構的隨機試驗的情況。

貝葉斯定理


貝葉斯定理由英國數學家貝葉斯(Thomas Bayes,1702-1761)發展,用來描述兩個條件概率之間的關係,比如P(A|B)和P(B|A)。按照定理6的乘法法則, ,可以立刻導出貝葉斯定理:如上公式也可變形為例如: 。
一座別墅在過去的20年裡一共發生過2次被盜,別墅的主人有一條狗,狗平均每周晚上叫3次,在盜賊入侵時狗叫的概率被估計為0.9,問題是:在狗叫的時候發生入侵的概率是多少?
人們假設A事件為狗在晚上叫,B為盜賊入侵,則, , ,按照公式很容易得出結果: 。
另一個例子,現分別有A,B兩個容器,在容器A分別有7個紅球和3個白球,在容器B里有1個紅球和9個白球,現已知從這兩個容器里任意抽出了一個球,且是紅球,問這個紅球是來自容器A的概率是多少?
假設已經抽出紅球為事件B,從容器A里抽出球為事件A,則有: , , ,按照公式,則有: 。
雖然概率論最早產生於17世紀,然而其公理體系卻在20世紀的20至30年代才建立起來並得到迅速發展,在過去的半個世紀里概率論在越來越多的新興領域顯示了它的應用性和實用性,例如:物理、化學、生物、醫學、心理學、社會學、政治學、教育學,經濟學以及幾乎所有的工程學等領域。
特別值得一提的是,概率論是今天數理統計的基礎,其結果常被用做問卷調查的分析資料,而且也用於對經濟前景進行預測。