貝葉斯分析
貝葉斯分析
貝葉斯推斷的基本方法是將關於未知參數的先驗信息與樣本信息綜合,再根據貝葉斯定理,得出后驗信息,然後根據后驗信息去推斷未知參數
(一)客觀貝葉斯分析(objective Bayesian analysis)
將貝葉斯分析當做主觀的理論是一種普遍的觀點,但這無論在歷史上,還是在實際中都不是非常準確的。第一個貝葉斯學家,貝葉斯學派的創始人托馬斯·貝斯和拉普萊斯進行貝葉斯分析時,對未知參數使用常數先驗分佈。事實上,在統計學的發展中,這種被稱為“逆概率”(inverse probability)的方法在19世紀非常具有代表性,而且對19世紀初的統計學產生了巨大的影響。對使用常數先驗分佈的批評,使得傑弗里斯(Jeffreys)對貝葉斯理論進行了具有非常重大意義的改進。伯傑(Berger,1999)認為,大多數貝葉斯應用研究學者都受過拉普萊斯一傑弗里斯(Laplace-Jefferys)貝葉斯分析客觀學派的影響,當然在具體應用上也可能會對其進行現代意義下的改進。
許多貝葉斯學者的目的是想給自己貼上“客觀貝葉斯”的標籤,這種將經典統計分析方法當做真正客觀的觀點是不正確的。對此,伯傑(1999)認為,雖然在哲學層面上同意上述觀點,但他覺得這裡還包含很多實踐和社會學中的原因,使得人們不得已使用這個標籤。他強調,統計學家們應該克服那種用一些吸引人的名字來對自己所做的工作大加讚賞的不良習慣。
客觀貝葉斯學派的主要內容是使用無信息先驗分佈(noninformativeor default prior distribution)。其中大多數又是使用傑弗里斯先驗分佈。最大嫡先驗分佈(maximumentropy priors)是另一種常用的無信息先驗分佈(雖然客觀貝葉斯學派也常常使用一些待分析總體的已知信息,如均值或方差等)。在最近的統計文獻中經常強調的是參照先驗分佈(reference priors)(Bernardo 1979;Yang and Bergen 1997),這種先驗分佈無論從貝葉斯的觀點,還是從非貝葉斯的觀點進行評判,都取得了顯著的成功。
客觀貝葉斯學派研究的另一個完全不同的領域是研究對“默認”模型(defaultmodel)的選擇和假設檢驗。這個領域有著許多成功的進展(Berger,1999),而且,當對一些問題優先選擇默認模型時,還有許多值得進一步探討的問題。
經常使用非正常先驗分佈(improper priordistribution)也是客觀貝葉斯學派面臨的主要問題,這不能滿足貝葉斯分析所要求的一致性(coherency)。同樣,一個選擇不適當的非正常先驗分佈可能會導致一個非正常的后驗分佈,這就要求貝葉斯分析過程中特別要對此類問題加以重視,以避免上述問題的產生。同樣,客觀貝葉斯學派也經常從非貝葉斯的角度進行分析,而且得出的結果也非常有效。
(二)主觀貝葉斯分析(subjective Bayesian analysis )
雖然在傳統貝葉斯學者的眼裡看起來比較“新潮”,但是,主觀貝葉斯分析已被當今許多貝葉斯分析研究人員普遍接受,他們認為這是貝葉斯統計理論的“靈魂”(soul)。不可否認,這在哲學意義上非常具有說服力。一些統計學家可能會提出異議並加以反對,他們認為當需要主觀信息(模型和主觀先驗分佈)的加入時,就必須對這些主觀信息完全並且精確地加以確定。這種“完全精確地確定”的不足之處是這種方法在應用上的局限性(Statistician,1998)。
有很多問題,使用主觀貝葉斯先驗分佈信息是非常必要的,而且也容易被其他人所接受。對這些問題使用主觀貝葉斯分析可以獲得令人驚奇的結論。即使當研究某些問題時,如使用完全的主觀分析不可行,那麼同時使用部分的主觀先驗信息和部分的客觀先驗信息對問題進行分析,這種明智的選擇經常可以取得很好的結果(Andrews,Berger and Smith,1993)。
(三)穩健貝葉斯分析(robust Bayesian analysis )
穩健貝葉斯分析研究者認為,不可能對模型和先驗分佈進行完全的主觀設定,即使在最簡單的情況下,完全主觀設定也必須包含一個無窮數。穩健貝葉斯的思想是構建模型與先驗分佈的集合,所有分析在這個集合框架內進行,當對未知參數進行多次推導(elicitation )之後,這個集合仍然可以反映此未知參數的基本性質。
關於穩健貝葉斯分析基礎的爭論是引人注目的(Kadane,1984;Walley,1991),關於穩健貝葉斯分析最新進展的文獻可參見伯傑(Bergen1985,1994,1996)的研究。通常的穩健貝葉斯分析的實際運用需要相應的軟體。
(四)頻率貝葉斯分析(frequentist Bayesian analysis )
統計學存在許多不斷爭議的學科基礎—這種情況還會持續多久,現在很難想像。假設必須建立一個統一的統計學學科基礎,它應該是什麼呢?今天,越來越多的統計學家不得不面對將貝葉斯思想和頻率思想相互混合成為一個統一體的統計學學科基礎的事實。
伯傑從三個方面談了他個人的觀點。第一,統計學的語言(language of statistics)應該是貝葉斯的語言。統計學是對不確定性進行測度的科學。50多年的實踐表明(當然不是令人信服的嚴格論證):在討論不確定性時統一的語言就是貝葉斯語言。另外,貝葉斯語言在很多情況下不會產生歧義,比經典統計語言更容易理解。貝葉斯語言既可對主觀的統計學進行分析,又可以對客觀的統計學進行分析。第二,從方法論角度來看,對參數問題的求解,貝葉斯分析具有明顯的方法論上的優勢。當然,頻率的概念也是非常有用的,特別是在確定一個好的客觀貝葉斯過程方面。第三,從頻率學派的觀點看來,基礎統一應該是必然的。我們早就認識到貝葉斯方法是“最優”的非條件頻率方法(Berger,1985),現在從條件頻率方法的角度,也產生了許多表明以上結論正確的依據。
(五)擬(准)貝葉斯分析(quasi Bayesian analysis )
有一種目前不斷在文獻中出現的貝葉斯分析類型,它既不屬於“純”貝葉斯分析,也不同於非貝葉斯分析。在這種類型中,各種各樣的先驗分佈的選取具有許多特別的形式,包括選擇不完全確定的先驗分佈(vague proper priors);選擇先驗分佈似然函數的範圍進行“擴展”(span);對參數不斷進行調整,從而選擇合適的先驗分佈使得結論看起來非常完美。伯傑稱之為擬(准)貝葉斯分析,因為雖然它包含了貝葉斯的思想,但它並沒有完全遵守主觀貝葉斯或客觀貝葉斯在論證過程中的規範要求。
擬(准)貝葉斯方法,伴隨著MCMC方法的發展,已經被證明是一種非常有效的方法,這種方法可以在使用過程中,不斷產生新的數據和知識。雖然擬(准)貝葉斯方法還存在許多不足,但擬(准)貝葉斯方法非常容易創造出一些全新的分析過程,這種分析過程可以非常靈活地對數據進行分析,這種分析過程應該加以鼓勵。對這種分析方法的評判,不必要按照貝葉斯內在的標準去衡量,而應使用其他外在的標準去判別(例如敏感性、模擬精度等)。
-----------學文