貝葉斯定律
18世紀貝葉斯提出的定律
18世紀,英國學者貝葉斯(1702~1761)曾提出計算條件概率的公式用來解決如下一類問題:假設H[,1],H[,2]…互斥且構成一個完全事件,已知它們的概率P(H[,i],i=1,2,…,現觀察到某事件A與H[,1],H[,2]…相伴隨而出現,且已知條件概率P(A/H[,i]),求P(H[,i]/A)。這就是貝葉斯定律。
P(H[,i]/A)=P(H[,i])P(A/H[,i])/[P(H[,1])P(A/H[,1])+P(H[,2])P(A/H[,2])…]
這就是著名的“貝葉斯定理”,一些文獻中把P(H[,1])、P(H[,2])稱為基礎概率,P(A/H[,1])為擊中率,P(A/H[,2])為誤報率[1]。現舉一個心理學研究中常被引用的例子來說明:
參加常規檢查的40歲的婦女患乳腺癌的概率是1%。如果一個婦女有乳腺癌,則她有80%的概率將接受早期胸部腫瘤X射線檢查。如果一個婦女沒有患乳腺癌,也有9.6%的概率將接受早期胸部腫瘤X射線測定法檢查。在這一年齡群的常規檢查中某婦女接受了早期胸部腫瘤X射線測定法檢查。問她實際患乳腺癌的概率是多大?
設H[,1]=乳腺癌,H[,2]=非乳腺癌,A=早期胸部腫瘤X射線檢查(以下簡稱“X射線檢查”),已知P(H[,1])=1%,P(H[,2])=99%,P(A/H[,1])=80%,P(A/H[,2])=9.6%,求P(H[,1]/A)。根據貝葉斯定理,P(H[,1]/A)=(1%)(80%)/[(1%)(80%)+(99%)(9.6%)]=0.078
基礎概率忽略現象的發現與爭論
Kahneman和Tversky開闢了概率推理這一重要的研究領域。他們在20世紀70年代初期的研究首先發現,人們的直覺概率推理並不遵循貝葉斯原理,表現在判斷中往往忽略問題中的基礎概率信息,而主要根據擊中率信息作出判斷。他們一個經典性的研究[3]是:告知被試100人中有70人是律師,30人是工程師,從中隨機選出一人,當把該人的個性特徵描述得象工程師時,被試判斷該人為工程師的概率接近0.90。顯然被試忽略了工程師的基礎概率只有30%。後來他們還採用多種問題驗證基礎概率忽略現象[4],如讓被試解決如下計程車問題:一個城市85%的計程車屬於綠車公司,15%屬於藍車公司,現有一計程車捲入肇事逃逸事件,根據一目擊者確認,肇事車屬於藍車公司,目擊者的可靠性為80%。問肇事車是藍車的概率是多少。結果大多數被試判斷為80%,但如果考慮基礎概率則應是41%。
這一研究結果引發了20世紀70年代以來的大量研究。有研究支持其結論,如Eddy用前述乳腺癌問題讓內科醫生判斷,結果95%的人判斷介於70%~80%,遠高於7.8%[2]。Casscells等人的研究結果表明,即使哈佛醫學院的工作人員對解決如乳腺癌和與之相類似的問題都出現同樣的偏差[5]。
但也有研究發現,在許多條件下,被試對基礎概率的反應是敏感的。例如,如果問題的措辭強調要理解基礎概率與判斷的相關性[6]或強調事件是隨機抽樣的[7],則基礎概率忽略現象就會減少或消除。另一個引人注意的是Gigerenzer和Hoffrage1995年的研究,他們強調概率信息形式對概率判斷的影響。採用15個類似前述乳腺癌的文本問題進行了實驗,問題的概率信息用兩種形式呈現,一種沿用標準概率形式(百分數);一種用自然數表示的頻率形式,如“1000名婦女中有10名患有乳腺癌,在患有乳腺癌的婦女中8名婦女接受早期胸部X射線測定法檢查,在沒有患乳腺癌的990名婦女中有95名接受早期胸部X射線測定法檢查”。結果在頻率形式條件下,接近50%的判斷符合貝葉斯演演算法,而在標準概率條件下只有20%的判斷符合貝葉斯演演算法[8]。
而另一些研究者對此也提出異議,有人認為他們在改變信息形式的操作中,同時也改變了其他的變數。如Lewis和Keren[9]提出這種概率信息的改變使原來的一般性問題變成了當前單個情境的具體問題,因而問題變得容易,被試判斷的改善不能說明他們的計算與貝葉斯計算一致。另外Fiedler認為[10],他們進行頻率形式的操作為所有數據提供了一個共同的參照尺度——即所有數據都是相對於總體(1000名婦女)而言的,依靠它所有的數據變得容易比較。很明顯,接受X射線檢查並患乳腺癌的婦女的數量(8)與接受X射線檢查並無乳腺癌的婦女的數量(95)相比或與接受X射線檢查的婦女總數(103)相比都是非常小的。相反,在標準概率條件下,沒有共同的參照尺度,表面上擊中率(80%)遠高於誤報率(9.6%),但它們是相對於大小不同的亞樣本,而不是相對於總體,不能在同一尺度上進行數量比較。於是他們用4個問題進行了2(數據比較尺度:共同尺度/非共同尺度)×2(數據形式:標準概率/頻率)的被試間設計,實驗結果表明:不管採用哪一種數據形式,被試在非共同參照尺度條件下,判斷準確性都低,在共同參照尺度下,判斷準確性高。所以判斷準確性與數據形式無關。
可見,人們在概率判斷中忽略基礎概率是不是一種普遍現象,不同的研究之間存在較大分歧。這將促使研究者們採用各種方法對人們的概率判斷推理過程進行更深入的探討。
貝葉斯推理問題的研究範式
為了探討上述問題,人們採用了不同的研究範式。從已有的研究看,貝葉斯推理的研究範式主要有兩種,一種是文本範式,一種是經驗範式。
文本範式是實驗中的問題以文本的形式直接提供各事件的基礎概率和擊中率、誤報率等信息,讓被試對某一出現的事件作出概率大小的判斷。如前述的乳腺癌問題,工程師問題,計程車問題等的研究就是採用這一範式。
然而,在實際生活中,人們進行概率判斷需要從自己經歷過的事件中搜集信息,而不是像文本範式那樣被動得到這些信息。經驗範式便克服了文本範式的這一缺陷。經驗範式就是在實驗中讓被試通過經歷事件過程,主動搜集信息來獲得基礎概率、擊中率和誤報率等各種情況的信息,然後作出概率判斷。
例如,Lovett和Schunn為了探討基礎概率信息和特殊信息對被試解決問題策略的影響,利用建築棒任務(BuildingStickTask,BST)進行了實驗設計。對於一個給定的BST問題來說,計算機屏幕下方提供3條不同長度(長、中、短)的建築棒並在上方顯示一條一定長度的目標棒,要求被試用建築棒通過加法(中棒+短棒)策略或減法(長-中或短棒)策略製造目標棒。被試只能憑視覺估計每條棒的長度,迫使他們不能用代數方法而只能用策略嘗試來解決問題。基礎概率是兩種策略解決問題的基本成功率;特殊信息是建築棒與目標棒的接近類型對選擇策略的暗示性和所選策略成功的預見性:長棒接近目標棒則暗示使用減法策略,中棒接近目標棒則暗示使用加法策略,如果暗示性策略成功表明該策略具有預見性,否則為非預見性。問題設計時,在200個任務中控制兩種策略基本成功率(偏向:一策略高(如70%),另一策略低(如30%);無偏向:兩策略各50%)和暗示性策略對成功預見性的比例(有預見性:暗示性和非暗示性策略成功率分別為80%和20%;無預見性:暗示性和非暗示性策略成功率各50%)。研究者對被試在嘗試上述任務前後分別用10個建築棒任務進行了測試,發現被試在嘗試前主要根據特殊信息選擇策略,在嘗試後主要依據兩種策略的基本成功率信息選擇策略。說明人們在嘗試200個任務后對嘗試中的基礎概率信息的反映是敏感的。
經驗範式的優點在於,實驗操作過程非常接近人們在日常生活中獲得概率信息以作出判斷的情況,較為真實地反映了人們實際的表徵信息和作出概率判斷的過程。所以許多研究者採用了這一範式。
但研究範式的變化並沒有能消除前述的爭論,在不同的研究範式下都存在人們對基礎概率信息的忽略或敏感現象,並出現了各種對基礎概率信息忽略或敏感現象進行解釋的理論。