重複博弈

重複博弈

重複博弈是同樣結構的博弈重複進行多次的過程。動態博弈的一種特殊形式。其中每次博弈都被稱為“階段博弈”。在重複博弈的情況下,企業在選擇策略的時候不僅需要考慮當前的對局,而且還需考慮當前選擇的策略對於以後的對局將產生怎樣的影響。

簡介


顧名思義,重複博弈(repeated game)是指同樣結構的博弈重複許多次,其中的每次博弈稱為“階段博弈”(stage games)。重複博弈是動態博弈中的重要內容,它可以是完全信息的重複博弈,也可以是不完全信息的重複博弈。重複博弈是指同樣結構的博弈重複許多次。當博弈只進行一次時,每個參與人都只關心一次性的支付;如果博弈是重複多次的,參與人可能會為了長遠利益而犧牲眼前的利益,從而選擇不同的均衡策略。因此,重複博弈的次數會影響到博弈均衡的結果。
在重複博弈中,每次博弈的條件、規則和內容都是相同的,但由於有一個長期利益的存在,因此各博弈方在當前階段的博弈中要考慮到不能引起其它博弈方在後面階段的對抗、報復或惡性競爭,即不能像在一次性靜態博弈中那樣毫不顧及其它博弈方的利益。有時,一方做出一種合作的姿態,可能使其它博弈方在今後階段採取合作的態度,從而實現共同的長期利益。
下面給出兩個重要定義:
定義1:可信性是指動態博弈中先行動的博弈方是否該相信後行動的博弈方會採取對自己有利或不利的行為。
定義2:如果動態博弈中各博弈方的策略在動態博弈本身和所有子博弈中都構成均衡,則稱該策略組合具有子博弈完美性。
在重複博弈中,可信性同樣是非常重要的,也即子博弈完美性仍是判斷均衡是否穩定可靠的重要依據,又由於長期利益對短期行為的制約作用,因此有一些在一次性博弈中不可行的威脅或諾言在重複博弈中會變為可信的,從而使博弈的均衡結果出現更多的可能性。

特徵


重複博弈具有三個基本特徵:
A、重複博弈的階段,博弈之間沒有“物質”上的聯繫,即前一個階段博弈並不改變后一個階段的博弈的結構;
B、在重複博弈的每一個階段,所有參與人都觀測到該博弈過去的歷史;
C、參與人的總收益是所有階段博弈的收益的貼現值之和或加權平均數。

影響因素


影響重複博弈均衡結果的主要因素是博弈重複的次數和信息的完備性。在重複博弈中,參與人存在著短期利益和長遠利益的均衡,有可能為了長遠利益犧牲短期利益而選擇不同的均衡策略。重複博弈的這個結果,為現實中的許多合作行為和社會規範提供了解釋。信息的完備性之所以影響均衡結果,是因為如果每一個參與人的特徵不為其他參與人所知時,該參與人就很有可能積極建立一個好聲譽,以換取長遠利益。根據重複博弈的重複次數,可以將其分為有限次重複博弈和無限次重複博弈。

分類


無限次

下面用一個關於產品定價博弈的例子分析重複博弈。
產品定價博弈
廠商B
低價高價
廠商A低價
高價12,1220,4
4,2015,15
是兩個廠商A和B定價的支付矩陣,從中可以看出:在一次性博弈中中,廠商A和廠商B都存在上策,上策均衡是雙方都定低價。
從參與人行為看,由於博弈可以重複無數次,博弈雙方為了長期利益有時間進行試探性出價。在第一次博弈時出高價以尋求競爭對手的合作,一旦對局人為了短期利益採取不合作行為,那麼就會建立該對局人是不可信任的信念,在下一次的博弈中都採取不合作的低價行為,使對局人的長期利益受損。
可見,廠商B在第一次博弈中由於不合作策略得到的高收益會在以後博弈中因A的報復性策略而抵消,甚至在重複博弈若干次后出現損失。
假如廠商A開始制定的高價策略,從支付矩陣得到廠商B若也定高價,其每次博弈的支付分別為(15,15,15...);若廠商B制定低價,則在第一次博弈中獲得高收益,但是隨後會由於廠商A的低價行為而使其受損,各次博弈的支付分別為(20,12,12...)。廠商A的這種策略被稱為“以牙還牙”策略,這種策略是A在初始選擇合作,如果B合作,那麼A也會一直合作下去;若B在某一次博弈中選擇不合作,那麼A在以後博弈中都採取不合作策略。“以牙還牙”策略意味著任何一個參與人的一次性不合作將會引起永遠的不合作。所有參與人為了長期利益,使得無限次重複的非合作博弈產生合作解。

有限次

假定重複有限的N次,這意味著所有參與人都能預測到最後一次(第N次)的收益。在第N次博弈中,各參與人都知道對方的“以牙還牙”,但是他也知道如果在這次博弈中自己選擇低價的上策,將使自己受益而其他參與人受損,且也不會留給對方報復的機會(博弈到第N次結束)。所有參與人都明白這一點,因此在最後一次博弈中將都採取低價策略,這與一次博弈的上策均衡結果相同。
在現實中,市場競爭者很難弄清重複博弈的結構。廠商很難預期自己在什麼時候會結束經營,也不清楚與對手的競爭何時是第N次博弈。因此,只要競爭時期足夠長,競爭的雙方都預期未來還要進行很多次博弈,那麼,競爭的結構就可能近似於無限次重複博弈,使得廠商在競爭中出現相互合作的局面。

序列博弈

在實踐中,博弈者在選擇行動時可能有先後順序或某些對局者可能率先採取行動,這種博弈被稱為序列博弈。
1.先行者優勢:廠商生產甜味餅乾的收益10要高於生產脆味餅乾的收益8。假定兩個廠商同時獨立的做出生產決定,他們都願意推出甜味餅乾——結果是兩家收益都受損
廠商2
脆甜
廠商1脆
甜—3,—38,10
10,8—3,—3
可見,在序列博弈中,先行者可能佔據一定的有利地位,這就是先行者優勢。廠商1為獲得更大收益,會選擇推出甜味餅乾,使得廠商2隻能選擇收益較低卻是最優的策略——推出脆味餅乾。
2.博弈的擴展形式:常用博弈的擴展形式來分析序列博弈,它用決策樹的形式表示可能的行動,並在各枝的結束處給出各行動的支付。
脆-3,-3
脆廠商2
廠商1(2)甜8,10
(1)脆10,8
甜廠商2
(3)甜3,-3
博弈的擴展形式的解一般用逆推法推導,由最後的收益逆向歸納,倒推到初始節點1處做出最後決策。