非合作博弈論
非合作博弈論
也就是說一策略組合中,所有的參與者面臨這樣的一種情況,當其他人改變策略時,他此時的策略是最好的。也就是說,此時如果他改變策略,他的支付將會降低。
你在一個屋子裡,屋裡有很多人。這時候,屋裡突然失火,火勢很大,無法撲滅。此時你的目的就是逃生。你的面前有兩個門,左門和右門,你必須在它們之間選擇。但問題是,其他人也要爭搶這兩個門出逃。如果你選擇的門是很多人選擇的,那麼你將因人多擁擠、沖不出去而燒死;相反,如果你選擇的是較少人選擇的,那麼你將逃生。這裡我們不考慮道德因素,你將如何選擇?——這就是博弈論!
你的選擇必須考慮其他人的選擇,而其他人的選擇也考慮你的選擇。你的結果(博弈論稱之為支付pay off),不僅取決於你的行動選擇(博弈論稱之為策略選擇),同時取決於他人的策略選擇。你和這群人構成一個博弈(game)。
博弈論對人的基本假定是:人是理性的(rational)。所謂理性的人是指他在具體策略選擇時的目的是使自己的利益最大化,博弈論研究的是理性的人之間如何進行策略選擇的。
中國人對博弈論有天生的了解。正如中國人常說的“事事洞明皆學問,人情練達即文章”,即是說人與人之間的關係、社會交往均是學問。而中國很多“做人”的道理,道出了如何在人與人的博弈中獲取成功。羅貫中的《三國演義》在今天看來就是一部博弈論教材!無論是兵書如《孫子兵法》、《三十六計》,還是現代流行的所謂“厚黑學”,都是關於如何贏得與人交往的勝利的,或者說如何獲取成功的.
博奕論中流傳最廣的是一個叫做“囚徒困境”的故事。說的是兩個囚犯的故事。這兩個囚徒一起做壞事,結果被警察發現抓了起來,分別關在兩個獨立的不能互通信息的牢房裡進行審訊。在這種情形下,兩個囚犯都可以做出自己的選擇:或者供出他的同夥(即與警察合作,從而背叛他的同夥),或者保持沉默(也就是與他的同夥合作,而不是與警察合作)。如果他們中的一個人背叛,即告發他的同夥,那麼他就可以被無罪釋放。而他的同夥就會被判10年。如果雙方都與警方合作共同招認,則各被判5年。如果雙方均不承認有罪,因警察找不到其他證據來證明他們以前的違法證據,則各判3個月。這兩個小偷將如何選擇。如圖示:
乙\甲 抵賴 坦白
抵賴 判3個月 乙:10年
甲:釋放
坦白 甲:10年 各5年
乙:釋放
他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長的刑期。只有當他們都首先替對方著想時,或者相互合謀(串供)時,才可以得到最短時間的監禁的結果。但是由於兩人處於隔離的情況下無法串供。這樣兩人都選擇坦白的策略以及因此被判5年的結局就被稱為“納什均衡”,也叫非合作均衡。
“納什均衡”首先對亞當·斯密的“看不見的手”的原理提出挑戰。按照斯密的理論,在市場經濟中,每一個人都從利己的目的出發,而最終全社會達到利他的效果。不妨讓我們重溫一下這位經濟學聖人在《國富論》中的名言:“通過追求(個人的)自身利益,他常常會比其實際上想做的那樣更有效地促進社會利益。”從“納什均衡”我們引出了“看不見的手”的原理的一個悖論:從利己目的出發,結果損人不利己,既不利己也不利他。兩個囚徒的命運就是如此。
從“納什均衡”中我們還可以悟出一條真理:合作是有利的“利己策略”。但它必須符合以下規律:按照你願意別人對你的方式來對別人,但只有他們也按同樣方式行事才行。也就是中國人說的“己所不欲勿施於人”。