隨機控制理論
隨機控制理論
控制理論中把隨機過程理論與最優控制理論結合起來研究隨機系統的分支。隨機系統指含有內部隨機參數、外部隨機干擾和觀測雜訊等隨機變數的系統。隨機變數不能用已知的時間函數描述,而只能了解它的某些統計特性。
目錄
自動控制系統分為確定性系統和不確定性系統兩類,前者可以通過觀測來確定系統的狀態,後者則不能。隨機系統是不確定性系統的一種,其不確定性是由隨機性引起的。嚴格地說,任何實際的系統都含有隨機因素,但在很多情況下可以忽略這些因素。當這些因素不能忽略時,按確定性控制理論設計的控制系統的行為就會偏離預定的設計要求,而產生隨機偏差量。飛機或導彈在飛行中遇到的陣風,在空間環境中衛星姿態和軌道測量系統中的測量雜訊,各種電子裝置中的雜訊,生產過程中的種種隨機波動等,都是隨機干擾和隨機變數的典型例子。隨機控制系統的應用很廣,涉及航天、航空、航海、軍事上的火力控制系統,工業過程式控制制,經濟模型的控制,乃至生物醫學等。
隨機控制理論研究的課題包括隨機系統的結構特性和運動特性(如動態特性、能控性、能觀測性、穩定性)的分析,隨機系統狀態的估計,以及隨機控制系統的綜合(即根據期望性能指標設計控制器)。隨機系統中含有隨機變數,所以在研究中需要使用隨機過程的基本概念和概率統計方法。嚴格實現隨機最優控制是很困難的。對於線性二次型高斯(LQG)隨機過程式控制制問題,包括它的特例最小方差控制問題,可以應用分離原理把隨機最優控制問題分解成狀態估計問題和確定性最優控制問題,最終能得到全局最優的結果。但對於一般的隨機控制問題應用分離原理只能得到次優的結果。
隨機狀態模型 隨機系統在連續時間情形下的動態過程,常可用隨機微分方程
描述。式中為離散時間變數,為獨立白色雜訊序列。兩種情況下系統的輸出方程都為:
式中為輸出通道中的隨機干擾,假定為白色雜訊。
隨機最優控制 使隨機控制系統的某個性能指標泛函取極小值的控制稱為隨機最優控制。由於存在隨機因素,這種性能指標泛函需要表示為統計平均(求數學期望)的形式:
或
式中的均值即數學期望。使性能指標J為極小的最優控制常可取為開環和反饋控制兩種形式。如果控制過程中決定所依據的只是設計時過程特性和隨機變數的信息,沒有進一步的測量和更新,這種控制策略就稱為是開環的。若在決定t時刻的控制作用時可以直接利用τ時刻的實時測量值則稱控制具有反饋形式,其中要求,這是因果性或物理可實現性所要求的。按照利用實時信息的充分程度,又可把反饋形式的控制策略分為兩種情形。當只利用這些信息來控制狀態變數,而沒有通過實時觀測來估計和改進各隨機變數的統計特性並修改控制策略時,這種策略稱為是被動反饋式(簡稱反饋式)的。若控制策略兼有上述“控制”和“估計”兩種功能並具有自行修正的能力,則稱為閉環策略(或主動反饋策略)。這種“反饋”和“閉環”的差別是不確定性控制問題所特有的。A.A.費爾德包姆最先指出閉環隨機最優控制策略的這種雙重功能,並稱之為二重最優控制。閉環(或二重)最優策略可達到在已有信息條件下的最好品質或全局最優解。同時它還具有不斷按照實時測量改進對不確定性的認識並修正策略的功能,也稱為隨機自適應最優控制。閉環最優控制的求解很困難,通常只能根據最優解的定性性質來構造次優解。只對某些特殊問題才可能給出定量解法。
隨機最優控制有兩個重要的性質。由於存在不確定性,控制作用常寧可取得弱一些,保守一些。這稱為謹慎控制。另一方面為更好和更快地進行估計,必須不斷激發系統中各種運動模式,為此需要加入一些試探作用。試探作用的大小,則根據增加的誤差、直接費用和所帶來的好處等因素加以折衷權衡進行選擇。謹慎和試探已成為設計隨機控制策略的兩個重要原則。
LQG問題 線性 (Linear)二次型 (quadratic)高斯(Gaussian)隨機過程式控制制問題是用途最廣的且可以用分離原理設計全局最優控制系統的一類問題。對於離散時間的情況,受控對象用如下線性差分方程來描述:
隨機控制理論
隨機控制理論
性能指標取為二次型的形式:
式中上標T表示向量的轉置,裝置雜訊w(t)和量測雜訊為高斯隨機過程。並且假定控制 可依據t時刻及以前的觀測數據來確定。按照分離原理,隨機最優控制的結構具有圖中的形式。它由狀態估值器給出狀態x 的估計值憫,再由憫按線性狀態反饋律憫確定控制量u。這裡狀態反饋矩陣L是在不考慮隨機干擾和時的確定性最優控制問題的解:
而滿足黎卡提方程
和邊界條件。狀態估計一般用卡爾曼濾波器來實現。整個控制結構可用微型或小型計算機來實現。
參考書目
阿斯特勒姆著,潘裕煥譯:《隨機控制理論導論》,科學出版社,北京,1983。(K.J.Astr╂m, Introduction to Stochastic Control Theory,Academic Press, New York,1970.)