貝氏網路

貝氏網路

貝氏網路(Bayesian network),又稱信任網路(belief network)或是有向非循環圖形模型(directed acyclic graphical model),是一種機率圖型模型,藉由有向非循環圖形(directed acyclic graphs, or DAGs )中得知一組隨機變數X1,X2,...,Xn及其n組條件機率分配(conditional probability distributions, or CPDs)性質。舉例而言,貝氏網路可用來表示疾病和其相關癥狀間的機率關係;假若已知某種癥狀下,貝氏網路就可用來計算各種可能罹患的疾病之發生機率。

簡介


在一般情況下,貝氏網路的有向非循環圖形中的節點表示隨機變數,他們可以是可觀察到的變數,抑或是潛在變數、未知參數等。連接兩個節點的箭頭代表此兩個隨機變數是具有因果關係或是非條件獨立的;而節點中變數間若沒有箭頭相互連接一起的情況就稱其隨機變數彼此間為條件獨立。若兩個節點間以一個單箭頭連接在一起,表示其中一個節點是“因(parents)”,另一個是“果(descendants or children)”,兩節點就會產生一個條件機率值。比方說,我們以Xi表示第i個節點,而Xi的“因”以Pi表示,Xi的“果”以Ci表示;圖一就是一種典型的貝氏網路結構圖,依照先前的定義,我們就可以輕易的從圖一可以得知
大部分的情況下,貝氏網路適用在節點的性質是屬於離散型的情況下,且依照此條件機率寫出條件機率表(conditional probability table, or CPT),此條件機率表的每一列(row)列出所有可能發生的Pi,每一行(column)列出所有可能發生的Xi,且任一列的機率總和必為1。寫出條件機率表后就很容易將事情給條理化,且輕易地得知此貝氏網路結構圖中各節點間之因果關係;但是條件機率表也有其缺點:若是節點Xi是由很多的“因”所造成的“果”,如此條件機率表就會變得在計算上既複雜又使用不便。

數學定義


令表示一個有向非循環圖形(DAG),且令為其有向非循環圖形中的某一節點i所代表之隨機變數,若節點X的聯合機率分配可以表示成:
則稱X為相對於一有向非循環圖形G 的貝氏網路,其中pa(i)表示節點i之“因”。對任意的隨機變數,其聯合分配可由各自的局部條件機率分配相乘而得出:
依照上式,我們可以將一貝氏網路的聯合機率分配寫成:
對每個相對於Xi的“因”變數Xj 而言)
上面兩個表示式差別在於條件機率的部分,在貝氏網路中,若已知其“因”變數下,某些節點會與其“因”變數條件獨立,只有與“因”變數有關的節點才會有條件機率的存在。
例子一(已知機率)
假設有兩種事件會造成草地潮濕(以’G’表示之):洒水器(以’S’表示之)與下雨(以’R’表示之);且假設有無下雨亦會是造成洒水器是否運轉的直接因素(亦即若有下雨則洒水器在大部份的情況下就不會再運轉),則此貝氏網路的結構圖可以表示成如圖二的型式。所有三個變數皆只有兩種可能值:T( true) 或 F( false)。則此聯合機率分配可以表示成。