獵鹿博弈

獵鹿博弈

獵鹿博弈(Stag Hunt Game, SHG)又稱獵鹿模型(Stag Hunt Model)、獵人的帕累托效率、安全博弈(Assurance Game)、協調博弈(Coordination Game),對應於信任困境(Trust Dilemma)。其源自法國啟蒙思想家盧梭(Jean-Jacques Rousseau)的著作《論人類不平等的起源和基礎》中的一個故事。兩個人出去打獵,獵物為鹿和兔,他們互不知道對方選擇的獵物。如果選擇鹿,則需要另一人也選擇鹿,產生合作才能成功狩獵。而選擇兔為獵物,不需要合作也能成功,但是獵兔的收益要小於獵鹿。

區別於囚徒困境(Prisoner's Dilemma, PD),SHG有兩種純策略納什均衡:全合作或全背叛,而在PD中,儘管全合作是帕累托最優,但只有全背叛才能達到納什均衡

概念


獵鹿博弈又稱 獵鹿模型(Stag Hunt Model)、獵人的帕累托效率,源自啟蒙思想家盧梭的著作《論人類不平等的起源和基礎》中的一個故事。
古代的村莊有兩個獵人。當地的獵物主要有兩種:鹿和兔子。如果一個獵人單兵優作戰,一天最多只能打到4隻兔子。只有兩個一起去才能獵獲一隻鹿。從填飽肚子的角度來說,4隻兔子能保證一個人4天不挨餓,而一隻鹿卻能讓兩個人吃上10天。這樣兩個人的行為決策可以形成兩個博弈結局:分別打兔子,每人得4;合作,每人得10。這樣獵鹿博弈有兩個納什均衡點,那就是:要麼分別打兔子,每人吃飽4天;要麼合作,每人吃飽10天。
這裡不妨假設兩個獵人叫A和B。我們引入一種矩陣式的對兩人博弈的描述方法,見下圖:
獵鹿博弈.jpg
獵鹿博弈.jpg
在這個矩陣圖中,每一個格子都代表一種博弈的結果。具體說來,在左上角的格子表示,獵人A和B都抓兔子,結果是獵人A和B都能吃飽4天;在左下角的格子表示,獵人A抓兔子,獵人B打鹿,結果是獵人A可以吃飽4天,B則一無所獲;在右上角,獵人A打鹿,獵人B抓兔子,結果是獵人A一無所獲,獵人B可以吃飽4天;在右下角,獵人A和B合作抓捕鹿,結果是兩人平分獵物,都可以吃飽10天。顯然,兩個人合作獵鹿的好處比各自打兔子的好處要大得多,但是要求兩個獵人的能力和貢獻相等。如果一個獵人的能力強、貢獻大,他就會要求得到較大的一份,這可能會讓另一個獵人覺得利益受損而不願意合作。“合則雙贏”的道理大家都懂,在實際中很難合作的原因就在於此。合作要求博弈雙方學會與對手共贏,充分照顧到合作者的利益。

合作哲學


在獵鹿博弈中,根據納什均衡的定義,應用博弈論中的“嚴格劣勢刪除法”可以得到該博弈有兩個納什均衡點,那就是:要麼分別打兔子,每人吃飽4天;要麼合作,每人吃飽10天。
兩個納什均衡,就是兩個可能的結局。兩種結局到底哪一個最終發生,這無法用納什均衡本身來確定。比較[10,10]和[4,4]兩個納什均衡,明顯的事實是,兩人一起去獵鹿比各自去抓兔子可以讓每個人多吃6天。按照經濟學的說法,合作獵鹿的納什均衡比分頭抓打兔子的納什均衡具有帕累托優勢。與[4,4]相比,[10,10]不僅有整體福利改進,而且每個人都得到福利改進。換一種更加嚴密的說法就是,[10,10]與[4,4]相比,其中一方收益增大,而其它各方的境況都不受損害。這就是[10,10]對於[4,4]具有帕累托優勢的含義。
在經濟學中,帕累托效率準則是:經濟的效率體現於配置社會資源以改善人們的境況,主要看資源是否已經被充分利用。如果資源已經被充分利用,要想再改善我就必須損害你或別的什麼人,要想再改善你就必須損害另外某個人,一句話,要想再改善任何人都必須損害別的人了,這時候就說一個經濟已經實現了帕累托效率。相反,如果還可以在不損害別人的情況下改善任何人,就認為經濟資源尚未充分利用,就不能說已經達到帕累托效率。
目前在世界上比比皆是的企業強強聯合就很接近於獵鹿博弈的帕累托改善,跨國汽車公司的聯合、日本兩大銀行的聯合等等均屬此列,這種強強聯合造成的結果是資金雄厚、生產技術先進、在世界上佔有的競爭地位更優越,發揮的影響更顯赫。總之,他們將蛋糕做得更大,雙方的效益也就越高。比如寶山鋼鐵公司與上海鋼鐵集團強強聯合也好,最重要的就是將蛋糕做大。在寶鋼與上鋼的強強聯合中,寶鋼有著資金、效益、管理水平、規模等各方面的優勢,上鋼也有著生產技術與經驗的優勢。兩個公司實施強強聯合,充分發揮各方的優勢,發掘更多更大的潛力,形成一個更大更有力的拳頭,將蛋糕做得比原先兩個蛋糕之和還要大。
獵鹿博弈的討論,我們的思路實際只停留在考慮整體效率最高這個角度,而沒有考慮蛋糕做大之後的分配。獵鹿博弈是假設獵人雙方平均分配獵物。
不妨做這樣一種假設,獵人A比獵人B狩獵的能力水平要略高一籌,但B獵人卻是酋長的之子,擁有較高的分配權。可以設想,A獵人與B獵人合作獵鹿之後的分配不是兩人平分成果,而是A獵人僅分到了夠吃2天的鹿肉,B獵人卻分到了夠吃18天的鹿肉。在這種情況下,整體效率雖然提高,但卻不是帕累托改善,因為整體的改善反而傷害到獵人A的利益。我們假想,具有特權的獵人B會通過各種手段方法讓獵人A乖乖就範。但是獵人A的狩獵熱情遭到傷害,這必然會導致整體效率的下降。進一步推測,如果不是兩個人進行狩獵,而是多人狩獵博弈,根據分配可以分成既得利益集團與弱勢群體。