微分對策
微分對策
微分對策是研究兩個或多個決策人的控制作用同時施加於一個由微分方程描述的運動系統時實現各自最優目標的對策過程的理論。
目錄
微分對策的最優策略所應滿足的必要條件,可象最優控制理論中的極大值原理那樣導出。微分對策實質上是一種雙(多)方的最優控制問題,而通常的最優控制問題可看成是單人微分對策。微分對策還可推廣到由差分方程描述的離散時間動態系統,因而常常更廣義地稱為動態對策。微分對策的研究始於20世紀40年代。R.艾薩克斯在1965年對完全對抗的二人零和對策問題的研究,奠定了微分對策理論的基礎。微分對策已應用于軍事、公安、工業控制、航天航空、環境保護、海洋捕撈、經濟管理和市場競爭等方面。微分對策所提供的數學模型還可能應用於更多的方面。例如,在微分對策中,應用突變論的概念可導致對不連續性和奇異性進行分類研究。此外,還可探討當約束條件、控制策略或合作關係處於模糊情況時(見模糊控制)的微分對策問題。在對策問題中,決策人都以對方的行為模型作為自己決策的依據,因此微分對策的研究與心理學、人工智慧、行為科學等學科都有密切的關係。
構成要素和分類 構成各類微分對策的要素可歸結為:①參與對策的各方(決策人)具有不同的利益。②決策人根據自己擁有的信息作決策。③按照對策規則,決策人的地位可能不同。④對策的結局由諸決策人的控制作用共同決定。對應這些要素的不同情況,可將微分對策作各種形式的分類。按照對策人的數目分類,如n人微分對策,n可取為2、3、…。按照結局分類,如結局的得失在連續範圍內變化的問題稱定量(程度)微分對策,結局取“贏”或“輸”二者居一的問題稱定性(種類)微分對策。也可按照決策人利益的性質分類,如決策人的利益為對抗時稱零和微分對策(即各方得失總和為零),決策人有競爭又有合作時稱非零和微分對策(如上下級之間,共同壟斷同一市場的幾個公司之間)。按照決策人間合作程度,又有組隊最優、納什平衡、帕雷托最優和協商策略等多種形式。在上下級多人決策問題中,通常要求上級決策人先宣布自己的策略,下級按照自身利益作出響應。這種策略如能使下級的行動符合上級的目標,這類微分對策便稱為上下級對策(斯塔克爾貝格對策)或激勵對策。此外,依對策問題中動態系統類型,還有偏微分對策(動態系統用偏微分方程描述)和隨機微分對策(存在隨機的干擾或觀測誤差的微分對策)。在微分對策中,決策人擁有信息的多寡,對決策的自由度和結局的優劣有明顯的影響。定量地分析這些影響,並對用於信息採集和傳輸(或破壞對方的採集與傳輸)的費用與可能取得的收益進行權衡的問題,稱為信息分配和信息結構問題。
二人零和微分對策 這是研究最多和應用較廣的一種微分對策,其動態過程可用以下狀態方程(見狀態空間法)描述:
微分對策
微分對策
①在定量微分對策的提法中,追方選擇u使J盡量小,而躲方選擇v使J盡量大,因此問題的解u*、v*應滿足
J(u*,v)≤J(u*,v*)≤J(u,v*)
微分對策
微分對策
微分對策
這裡μ 為正值常數乘子。各式中的x(t)是與鞍點策略(u*,v*)相對應的最優軌線。在應用雙方極值原理來解決具體的微分對策問題時,除了最優控制理論中所遇到的共同性難點(如解兩點邊值問題)以外,還會由於min和max運算而引入許多間斷性、奇異曲面等問題。奇異曲面的研究非常重要,它關係到問題的求解是否完整。在微分對策中可以出現一些具有新性質的奇異曲面,它們比單方最優控制問題中的奇異曲面要複雜得多。對於奇異曲面,尚未建立起系統的理論和計算方法。
②在定性微分對策的提法中,只考慮某種結局能否實現的問題(如擊中或捕獲),可用x(t)能否達到目標集Ψ(x)≤0來描述。追方選擇u(t)力圖實現此目標,而躲方選擇v(t)力圖避免此目標。若雙方控制能力具有一定均勢,則x處於某一區域內時可以捕獲而在另一區域時能夠逃逸。這兩個區域稱為捕獲區和逃逸區,它們的分界面稱為界柵(或壁壘)。微分對策為追逃問題提供了在競爭環境中較為深刻實用的數學模型。在空空導彈的設計中,最優控制和微分對策都被應用於制導規律的研究。微分對策對目標加速度估值誤差不敏感,比最優控制更適用於設計攔截機動目標的導彈。
參考書目
T.Basar and G.J.Olsder, Dynamic Non-cooperative Game Theory, Academic Press, New York, 1982.