外交決策學

在國際政治中，行為體的互動都是有明確的對外政策目的的行為。行為體能否實現自己的目的，取決於能否制定並實施適當的對外政策。與這樣一種現實的需要相適應，在過去的50年中，有關外交決策（foreign policy decision making－FPDM）的研究在西方國家特別是美國逐漸發展起來，並最終成為國際政治研究中一個重要學科。這門學科的主旨，就是研究決策者與所處環境之間在不同層次上的互動過程和互動內容。進行這個領域的研究，對於國際政治研究來說是不可缺少的。

1簡介 2由來 3相關概念綜述政策

決策 4傳統現實主義綜述現實主義對外交政策的研究外交決策－理性人的選擇

應用 5博弈論概念研究綜合

突破應用

簡介

經過數十年的發展，外交決策學領域逐漸形成三個理論框架：即以博弈論為主要方法的理性選擇模式、以系統論和控制論為方法的官僚組織模式和基於心理分析法的認知心理模式。這三種模式可以說構成了外交決策理論的骨幹，它們分別探討了外交政策形成的推理過程、組織過程和認知過程，研究對象分屬國家層次、組織層次（middle-range）和個人層次。其中，第一種模式和以其為基礎的博弈論被國際關係學界視為主流理論，影響也最大，被稱為“正式模式”或“正式假設”（formal model or formal assumption）。

由來

外交決策學是決策科學發展的產物。18世紀工業革命之後，西方國家逐漸出現大型工業企業，有了大量管理實踐和決策實踐的存在，使管理理論和決策理論的出現成為可能。系統化的管理理論即管理科學在20世紀初才出現，而作為其分支的決策理論則是在上世紀50年代才開始在管理學界流行。決策科學的興起與西蒙（Herbert Alexander Simon）等人的倡導有關，西蒙本人也因其對經濟組織內的決策程序進行了開創性研究，而獲得1978年諾貝爾經濟學獎。②上世紀50年代，隨著研究方法和資料處理手段的更新和進步，決策科學迅速被引入其他學科，包括外交政策研究。

傳統現實主義

綜述

在國際關係中，行為體互動的主要表現就是對外政策的制定與實施。無論是古代歐洲的城邦國家和中國的春秋戰國，還是威斯特伐利亞和約之後所產生的主權國家，都需要某種形式的對外政策和對外政策研究。第一次世界大戰之後，國際政治作為一門學科正式產生，外交政策分析一直伴隨著這個學科的發展。不過，直到20世紀50年代，對外交政策的研究還只是政策分析（policy analysis），並不是決策分析（decision analysis），儘管政策分析會涉及到決策問題。

現實主義對外交政策的研究

二戰之後，以摩根索為代表的一批學者首次建立了國際政治學科中的一個比較完整的理論體系——現實主義，並迅速佔據主導地位。這個理論體系的一個重要部分就是現實主義的外交政策學。王逸舟在《西方國際政治學：歷史與理論》一書中歸納了七個方面的內容，指出“從20世紀中葉的美國外交政策學，到今天多數西方國家的對外政策，貫穿著一條‘利益－權力－平衡’的粗大線條。”現實主義認為，國際政治是權力政治（power politics），國家對權力的追求源自人的本性和國際社會的無政府狀態。現實主義的外交政策學是圍繞這一國家動機理論展開的。

摩根索認為，外交是國家權力的組成部分。它的任務是：第一，根據已擁有的、潛在的實力確定國家的目標；第二，評估別國的目標及其為實現這些目標已擁有的潛力和實力；第三，確定雙方的目標在何種程度上可以兼容；第四，決定和實施適合於實現國家目標的手段。基辛格指出，合法秩序的基礎不一定是正義，其基本原則是遊戲規則為大國所接受，將國際社會變成一個阿隆（Aron）所說的“同質系統”（homogeneous system）。因為，在一個異質系統（heterogeneous system）中，革命性力量會挑戰現存國際社會並以軍備競賽取代外交手段。基於對19世紀大國間沒有發生重大戰爭原因的探索和對兩次世界大戰教訓的分析，基辛格認為20世紀後期外交政策研究的一個明確而又核心的任務，就是以史為鑒，運用外交手段重塑一個較少衝突的國際社會，用一個跨越不同文化、意識形態、歷史經歷和國家制度的共同語言去定義國際秩序的本質（Kissinger 1969）。

在現實主義範式中，一個基本的觀點就是國家是理性的行為者（rational actor）。“在謀求權力與安全的時候，國家採取的是有目的的政策，或者說出於主觀期望是按照功利原則或理性規範行事。”現實主義認為，國際政治學所研究的就是在無政府的國際體系中，國家作為主要行為體追求權力與安全的過程。這個過程是理性的，即用有目的的政策爭取自身環境的最優和自身利益與權力的最大化。現實主義的這一理性行為假說，成為外交決策學自誕生以來，影響最大、應用最廣泛、學者最多的理性選擇學派的基礎。

按照現實主義觀點，外交政策的目標和手段是以國家利益為出發點和歸宿的。國家利益一旦確定，決策就是對特定國際環境下的目標和手段的準確計算。一個政治制度為了在不斷變化的環境中生存和發展，必須符合特定的功能性要求（functional requisites），外交政策只是政治制度適應環境或控制環境的一種機制。換句話說，政治制度有利益（功能性要求），外交政策的目的是保障這種利益的工具。問題在於，這些政治制度的利益究竟是什麼，什麼樣的行動才能滿足這些利益。

然而，國家或政治制度不會自己表達自己的需要，所以判定追求什麼樣的外交目標和選擇什麼樣的手段是一個主觀過程。國家領導人和公眾認為國家需要什麼與各自的經驗和價值選擇有關。而且，相同的決策對不同社會群體的影響是不同的，會造成一些人得大於失，另一些人失大於得。很多情況下，人們無法在考慮國家整體利益時，完全擺脫個人和團體利益的影響，得失分配的鬥爭所體現的正是政治活動的意義。

我們可以看到，現實主義研究的是外交的政策動機、內容和結果，使用的是經驗主義的歷史和哲學的方法分析外交政策的“質”。傳統現實主義分析外交政策的著眼點是國際體系中的權力平衡（balance of power）－體系驅動（system driven）和大國的外交及文化傳統－國家驅動（state-driven）。一方面，現實主義作為國際政治的主流理論把外交政策放在宏觀的政治歷史背景下進行研究，為外交決策研究提供了世界觀基礎；另一方面，現實主義與後來出現的外交決策學在研究方法和對象上不同。前者是用歷史主義（經驗主義）的方法在宏觀上把握國際體系中的國家外交政策的動機和內容；後者是用科學主義的方法分析個人和組織決定外交政策的過程。

上世紀50年代末，自然科學在多個學科的突破性進展，資訊理論、系統論、控制論、博弈論、環境工程等新的學科和成果紛紛面世。面對日趨複雜的世界和一個“革命”的時代，社會科學開始向自然科學靠攏，將“硬”的科學手段運用到“軟”的研究領域中。國際政治學界出現了“行為主義”或“科學主義”學派，強調國際關係理論的科學性（可以觀察、計量和重複），向傳統現實主義的研究方法提出了挑戰。國際政治學科中的外交決策理論正是在這個背景下誕生的，它打破了國際關係和政治學之間的界限，更加註重微觀領域的研究。

外交決策－理性人的選擇

理性選擇模式（rational choice model）的哲學基礎是現實主義，出發點是國家中心學說以及國家利益、自助和無政府狀態等觀念。正如約瑟夫·奈所說，這一假設是基於“以國家為中心的現實主義”（state-centric rea-lism）。摩根索在現實主義六原則中的第一條中指出：“(要理解外交政策)我們需要把自己置於政治家的地位，設身處地地去考慮他們在特定環境下所遇到的各種外交難題，我們要問自己，政治家可能面臨哪些可供選擇的途徑，以及在這種既定環境下，政治家可能會選擇哪一個理性的解決途徑。只有將理性的假設與實際的事實及其後果放在一起作檢驗，才能賦予國際政治事實以意義，才會使一種政治理論成為可能。”但是，理性選擇理論不是從哲學或歷史的宏觀視角而是從思維視角對決策者進行抽象的微觀研究，採用的完全是行為主義的方法，運用的是經濟學中的博弈理論，研究對象是決策過程而不是政策本身。英語中理性（rational）一詞來自拉丁語ratio，其含義與理智（reason）一詞十分相似，是理智推理的應用。理性的定義通常是對目的與手段之間關係的描述。帕森斯（Talcott Parsons）教授在《社會行為的結構》一書中說：“理性行為意味著對條件允許的目標進行追求，其手段被經驗科學證明屬於可選範圍和在本質上最適合於對這個目的的追求”。理性是一種辨別和推理，是對偏好（preference）進行排序並做出選擇的能力。理性決策並不意味著選擇滿意的政策目標和手段，而是“從不夠好的選擇中挑出比較好的”。西方文化有著理性分析的“智者”（homo sapiens）傳統。例如，《舊約聖經·以斯帖記》中王后以斯帖（Esther）挫敗大臣哈曼（Haman）滅絕猶太人的故事，就是博弈論學者說明人類早期理性行為的一個範例。弗蘭克爾（Joseph Frankel）指出，理性概念在西方有著深刻的文化烙印和歐洲中心主義色彩，在一些西方人的潛意識裡，西方文明所孕育出的理性原則具有普遍指導意義。從語法上看，理性一詞（rationality）是不可數名詞，這就排除了其他理性系統存在的可能，與西方人不同的其他地區民族的思維習慣和推理方式都被認為是非理性。人類文化學者的努力已經使越來越多的西方人知道價值觀的文化相對性，但並未使他們理解大腦推理過程的文化相對性。

應用

理性模式的應用，使外交決策十分易於理解。如維巴（Sidney Verba）所說：“如果決策者是理性的，知道理性規則的觀察者就能夠在自己的頭腦中重現決策過程；同時，如果觀察者了解決策人的目的所在，還能夠在預知其然的同時知其所以然。”顯然，只要確定了理性行為模式的規則，那麼決策者和決策過程都是簡單易懂的。

按照理性選擇模式，外交政策都是目標明確且十分理智的一些人深思熟慮的結果。他們系統分析各種可能的政策選擇，以實現國家的目標。在這種分析方法中，代表不同國家的決策者像桌球（billiard ball）一樣相互作用，環境和對決策過程的控制成為決定對外政策的關鍵。其中有三個主要概念：決策（decision）、決策者(decision-maker)和決策過程(decision-making process)。決策者在決策過程的一開始就有一個或一組明確目標，列出可能的行動方向，並根據對付出（costs）和收益（gains）的比較和權衡（trade-off）來評價與每一個政策選擇相對應的結果，最終確定相對收益最大的政策。實際上，理性決策模式的核心不在於誰去做決定，而是決策本身是一個分析和選擇的過程（a process of analysis）。

一般來說，外交決策是在考慮了多個行動方向之後做出的。在理論上，決策者應考慮在邏輯上成立的所有選擇；但在實踐中，決策者只能考慮幾種可能的選擇。在外交決策系統中，即使是十分智慧的人，他所能處理的變數數目也是有限的。因此，決策中常常出現把複雜問題簡單化的情況，或是出現計算和判斷性錯誤的情況。與普通人一樣，在緊張、疲勞、疾病等狀態下，外交決策者處理問題的能力也會下降。

理性與正確是兩回事，決策過程只要是經過理性選擇就很難說它是非理性的。只有當決策者經過分析看到最有利選擇，但出於個人反常心理而做出了其他選擇時，決策才是非理性的。實際上，在評估決策時，分析者對理性概念的應用十分不同。一些人從手段選擇的質量出發，認為理性選擇的要旨在於確定最合適於實現目的的手段。另一些人則強調決策程序的質量，注重對信息的處理和評估，並且更多地將理性選擇過程與政策後果相聯繫。

博弈論

概念

博弈論（game theory)——理性選擇模式的方法論

“博弈”（game）一詞在英文中的基本意思是遊戲、比賽，故而也有人將博弈論譯成遊戲理論。在遊戲、比賽中，儘管身體因素很重要，但當參賽各方的身體條件相差無幾時，計謀在比賽中就成為至關重要的因素了。甚至在實力不如對手的情況下，通過適當策略的運用，最終也能取勝。眾所周知的田忌賽馬的故事就是證明。可見，遊戲的背後是謀略之爭。中文博弈的意思是弈棋，下棋本身是遊戲的一種，但更強調理性推理或謀略的運用，因此將game theory譯為博弈論比遊戲理論更貼切、更傳神。

博弈論是對於相互依存狀況中行為體互動規律的研究，是以人的理性思維為前提的。相互依存是指博弈中任何一個局中人受到其他局中人行為的影響；反過來，他的行為也影響到其他局中人。由於局中人的相互依存性，博弈中一個理性的決策必定建立在預測其他局中人的反應之上。進行博弈時，一個局中人是將自己置身於其他局中人的位置，通過預測其他局中人將選擇的行動來計算自己的獲益函數（payoff function），並最終決定自己最理想的行動。

研究

在20世紀50年代以前，對外交決策的研究多是採用歸納分類法（induction and typology）。研究者對歷史上個人、機構和國家的決策行為進行描述，從現有事例和經驗數據中尋找規律或模式，使用的是一種經驗主義的方法。以18世紀以來在自然科學領域得到廣泛應用的假設推理法（hypothetic-deductive）為背景，博弈論在20世紀20年代開始成為數學研究的一個領域。1944年，美國學者紐曼（John von Neumann）和摩根斯坦（Oskar Morgenstern）發表《博弈論和經濟行為》，率先將博弈論應用於社會科學，為經濟學特別是微觀經濟學提供了解釋和預測個人和家庭經濟行為的方法。獲諾貝爾經濟學獎的納什（John F.Nash，Jr.）在1952年建立的關於非合作博弈中的均衡理論（Nash Equilibrium，1950/1951），為博弈論在國際關係領域的應用開闢了道路（納什均衡：給定你的策略，我的策略是我最好的策略；給定我的策略，你的策略是你的最好策略。這裡“最好策略”指在所有的可能策略中，沒有其他任何策略能帶來比該策略更大的利益。）。1954年，美國政治科學雜誌發表了第一篇有關博弈論的文章《考察權力在國會委員會系統中分配的一種方法》。

綜合

20世紀50年代以後，國際關係理論學者在博弈論中綜合了心理學、統計學和社會學的一些方法，並系統地應用於國際關係特別是外交決策領域。其中主要代表著作有：謝林（Thomas C.Schelling）的《衝突策略》、拉伯潑特（Anatol Rapoport）和查馬（Albert M.Chammah）的《囚徒困境：對衝突與合作的研究》、博蘭姆斯（Steven J.Brams）的《超級大國的遊戲：博弈論在超級大國衝突研究中的應用》、摩羅（James Morrow）的《政治科學中的博弈論》。關於博弈論，還特別應提及卡爾·多伊奇的《國際關係之分析》和莫頓·卡普蘭的《國際政治的系統和過程》兩本名著。與以前外交政策分析中的歷史歸納法不同，博弈論是用一組假設在邏輯上將各種選擇聯繫起來，進而推理出政策結果，是邏輯推理的方法。所以，用博弈論分析外交決策的原理是：假設——推理（演繹）——結果（決策）。在西方，博弈理論已被頻繁地應用於外交政策、軍備競賽、和平與戰爭等重大國際問題的研究。正如基歐漢（Robert O.Keohane）在論述理性選擇概念時所說：“我們不需要去研究領導人究竟在想什麼，我們可以僅僅通過在辦公室中進行‘思想實驗’，就可能獲得必要的信息。”博弈論就是一種對思維過程的數理實驗。傳統博弈理論在20世紀50、60年代曾經風行一時，出現多種多樣的博弈模型，但基本形式有零和（zero-sum）博弈和非零和（non-zero-sum）博弈兩種，參與者或兩方或多方。零和博弈又稱為“誰是懦夫”博弈，指參與者的正負收益相加為零，或一方所失就是他方所得，屬於純衝突型博弈；非零和博弈是指雙方或各方得失不等，或者共同受益，或者共同受損，在這種博弈中合作成為可能。零和博弈只能用於最簡單的衝突狀態，情況稍微複雜一點就失去應用價值。在非零和博弈（例如囚徒困境）中，由於參與者運用理性推理方法可能選擇相互背叛而放棄共同受益的結果，因此存在著事實上的非理性選擇。從60年代後期開始，政治學科的博弈論學者們認識到，問題出在博弈參與方只有一次選擇機會，無法與對手的反應進行互動，在運用了收益矩陣（payoff matrix）之後，情況更是如此。

突破

1971年，霍華德（Nigel Howard）發表《理性的悖論》，取得了重複博弈理論的突破。隨後，這一理論又得到了許多其他學者的發展和改造。在重複博弈中，博弈者最初選擇的是一種行為準則，允許隨後根據情況和收益做出調整。其基本原則已不再是傳統博弈論中己方的利益最大化，而是將著眼點放在結果的性質，特別是結果的穩定性上。研究者考慮的不是一方對自己最大利益的追求，而是兩方或多方尋找減少不確定性和解決衝突的均衡點（equilibrium）。在一次囚徒困境博弈中，雙方都背叛是納什均衡點（Nash Equilibrium Point），即佔優勢的戰略；但在重複的博弈中，背叛行為的短期收益會被緊隨其後的遠期相互懲罰的代價所超過。霍華德運用現實世界中的認知現象（學習），將囚徒困境改造成一種互動遊戲，運用這種戰略后，最終通過合作而共同獲益也屬納什均衡。採用這種戰略的博弈者在一開始就採取合作戰略，然後不管其對手如何應對，都堅持對背叛行為進行報復，對合作行為給與回報。當兩個博弈者都使用“一報還一報”（tit-for-tat）戰略時，國際合作就能實現。

應用

一般來說，決策者在決策時容易忽視對手的選擇與偏好；重複博弈由於有認知學的幫助，會強迫決策者考慮對方的觀點，這對通過討價還價贏得較好和較穩定的結果至關重要。重複博弈所建造的決策背景，可以使決策者的思維前後一致和比較全面。另一方面，我們也應該看到，現實世界並不具有完全的可重複性，因此即使是可重複的博弈也不能概括所有國際關係現象。對於經濟貿易、環境、科技等交往來說，國家的反應能力較為迅速和有效，而對於武裝衝突、軍備控制而言，要麼是不可重複的，要麼國家的反應比較遲緩。

以現實主義為思想基礎的理性選擇模式及其對博弈論的應用，被國際關係學界視為研究外交決策的主流理論，影響也最大。與此同時，另一些學者認為，政治並不僅僅意味著理論計算，人們的理性思維總是被許多因素限制著。例如，缺乏信息就會嚴重阻礙人們的策略思考，此外還存在資源有限、交流不暢、缺乏複雜計算能力等問題。在實踐中，理性選擇模式無法深入剖析在國際關係中存在的許多“非理性”決策，使人深感理性的局限。於是，不少學者從國內政治的組織管理層次和決策者個人的心理認知層次上進行更廣泛研究和探索，從而進一步推動了外交決策學的發展。

①一些美國大學政治系講授博弈理論的課程被稱為“政治學中的正式模式”（formal model in political science）。理性選擇也被認作是“政治理論基礎”，見：Peter C. Ordeshook, A Political Theory Primer, Routledge: Chapman and Hall Inc.,1992。

② 赫博特·亞歷山大·西蒙（1916～2001），曾任美國卡耐基·米隆大學經濟學教授，主要著作有：《管理行為：對管理組織決策過程的研究》（H. A. Simon, Administrative Behavior: A Study of Decision 2 Making Processes in Administrative Organization, New York: Macmillan Co.,1947.）。

外交決策學