蜈蚣博弈

蜈蚣博弈

蜈蚣博弈是由羅森塞爾(Rosenthal)提出的。它是這樣一個博弈:兩個參與者A、B輪流進行策略選擇,可供選擇的策略有“合作”和“背叛”(“不合作”)兩種。

支付給定


假定A先選,然後是B,接著是A,如此交替進行。A、B之間的博弈次數為有限次,比如100次。假定這個博弈各自的支付給定如下:
合作 合作 合作 合作...合作 合作
A B A B …… AB (100,100)
合作 合作 合作 合作...合作 背叛
A B A B …… AB (98,101)
現在的問題是:A、B是如何進行策略選擇的?
這個博弈因形狀像一隻蜈蚣,而被命名成“蜈蚣博弈”。

舉例


這個博弈的奇特之處是:當A決策時,他考慮博弈的最後一步即第100步;B在“合作”和“背叛”之間作出選擇時,因“合作”給B帶來100的收益,而“不合作”帶來101的收益,根據理性人的假定,B會選擇“背叛”。但是,要經過第99步才到第100步,在99步,A考慮到B在100步時會選擇“背叛” ——此時A的收益是98,小於B合作時的100,那麼在第99步時,他的最優策略是“背叛”——因為“背叛”的收益99大於“合作”的收益98……如此推論下去,最後的結論是:在第一步A將選擇“不合作”,此時各自的收益為1,遠遠小於大家都採取“合作”策略時的收益:A:100,B:100-99。

悖論


根據倒推法,結果是令人悲傷的。從邏輯推理來看,倒推法是嚴密的,但結論是違反直覺的。直覺告訴我們,一開始就採取不合作的策略獲取的收益只能為1,而採取合作性策略有可能獲取的收益為100。當然,A一開始採取合作性策略的收益有可能為0,但1或者0與100相比實在是太小了。直覺告訴我們採取合作策略是好的。而從邏輯的角度看,一開始A應取不合作的策略。我們不禁要問:是倒推法錯了,還是直覺錯了?這就是蜈蚣博弈的悖論。
什麼是悖論?悖論(paradox)來源於希臘語,para意即“超越”,doxos的意思是“相信”。Paradox的意思是:本來可以相信的東西不能相信,而有的東西看起來不可信但是反而是正確的。悖論指由肯定它真,就推出它假,由肯定它假,就推出它真的一類命題。在歷史上有許多悖論。如“阿基里斯趕不上烏龜”的芝諾悖論,“一個克里特人說‘所有克里特人都說謊’”的說謊者悖論,“一個理髮師說:‘我給所有不給自己理髮的人理髮’”的理髮師悖論或羅素悖論,等等。這些悖論在歷史上對於邏輯和數學的發展起了巨大的作用。
對於蜈蚣悖論,許多博弈專家都在尋求它的解答。在西方有研究博弈論的專家做過實驗,目前通過實驗驗證集體的交互行為已成時尚,正如博弈論專家英國的賓莫(Ken Binmore)所言,諾貝爾獎也無疑在考慮這方面的先驅者,實驗發現,不會出現一開始選擇“不合作”策略而雙方獲得收益1的情況。雙方會自動選擇合作性策略,從而走向合作。這種做法違反倒推法,但實際上雙方這樣做,要好於一開始A就採取不合作的策略。
倒推法似乎是不正確的。然而,我們會發現,即使雙方開始能走向合作,即雙方均採取合作策略,這種合作也不會堅持到最後一步。理性的人出於自身利益的考慮,肯定在某一步採取不合作策略。倒推法肯定在某一步要起作用。只要倒推法在起作用,合作便不能進行下去。
這個悖論在現實中的對應情形是,參與者不會在開始時確定他的策略為“不合作”,但他難以確定在何處採取“不合作”策略。
倒推法是分析完全且完美信息下的動態博弈的有用工具,我們分析言語博弈中“威脅”或“承諾”是否可信時,已給出了一個倒推法例子。我們看到,倒推法符合我們的直覺。然而,通過上面的蜈蚣博弈的悖論,我們將看到倒推法存在致命的缺陷。