隨機過程統計

隨機過程統計

隨機過程統計,根據觀測對隨機過程進行統計推斷的理論與方法。

目錄

正文


根據觀測對隨機過程進行統計推斷的理論與方法。把觀測所獲得的數據記為或,它是從一個隨機過程抽得的樣本。為了得到描述這一隨機過程變化的統計規律,必須對它的分佈(見概率分佈)或某些特徵作出推斷。例如檢驗它是否為某種特殊的隨機過程,估計其分佈中的某些參數等等。這些都屬於隨機過程的統計問題。
早在數理統計學發展的初期,人們就已對隨時間推進的觀測結果運用各種統計分析方法來研究,例如,根據天文資料尋找其變化的隱蔽周期。但當時的研究還只是限於相互獨立觀測的情形。20世紀30年代,由於描述社會或市場上某些經濟指標變化的需要,必須對不獨立的觀測結果進行分析。例如,考慮如何尋找一個自回歸模型 來近似地擬合數據 ,但仍限於討論離散時間觀測的情形。40年代以後,一方面由於無線電技術中信號檢測與信號參數估計的需要,提出了許多有關連續觀測隨機過程的統計問題。另一方面,隨機過程理論的迅速發展,也為研究上述問題提供了手段。1951年U.格里南德明確提出了隨機過程的統計推斷這一課題,並指出數理統計中的最大似然估計(見點估計)、似然比檢驗(見假設檢驗)等方法原則上也可用於隨機過程的統計推斷,但一個關鍵問題是,要給出隨機過程的不同概率分佈之間相互絕對連續與奇異的條件,以及求出概率分佈間的密度。由於過程統計的需要,這一問題在以後引起了相當大的重視和大量的工作,對於各類重要的過程,如正態過程(見隨機過程)、獨立增量過程、擴散過程(見馬爾可夫過程)、點過程乃至一般的半鞅(見鞅),都先後討論了這一問題。在分佈間具有密度的條件下,就可直接沿用數理統計的做法,這已成為過程統計中很重要的一方面。另外,過程統計也仿照數理統計中處理線性統計模型的方法。例如,可以假定觀測結果表為非隨機變化項和一個寬平穩過程之和,利用其二階或四階矩特徵,可對過程本身的均值(見數學期望)及協方差(見矩)作出統計推斷。由於這類統計方法要求較寬,便於應用,所以發展迅速且應用廣泛。
依賴於密度的統計方法 設為隨機過程、是x 樣本空間上的可能概率分佈族,θ是未知參數。對於兩個概率分佈、, 如果概率為0的事件,其概率必為0,則稱 關於是絕對連續的;如果存在概率為0而概率為1的事件,則稱與是相互奇異的。對隨機過程來說, 中的不同概率分佈之間往往並不相互絕對連續,有時甚至是相互奇異的。因此,首先必須討論pθ之間的絕對連續性與奇異性問題。而後在絕對連續的情形,可以取某個為標準,根據測度論的拉東-尼科迪姆定理,求得其他概率分佈關於的密度(又叫做似然比)。在這個基礎上,數理統計中的最大似然估計法,似然比檢驗法、貝葉斯推斷等,都可直接用於隨機過程的統計推斷,而一些大樣本統計問題也可歸結為隨機過程的極限定理來處理。
關於隨機過程概率分佈間的絕對連續性與奇異性及其密度的問題,可利用鞅收斂定理證明如下的一般結果:若隨機連續的過程在樣本空間上的可能概率分佈為與,為中的可列稠集。對x作有限次觀測,其相應的有限維分佈為 , 。若 關於絕對連續,則極限按都以概率1存在,且關於絕對連續的充分必要條件是,這時有;與奇異的充分必要條件是,或等價地。對各類具體過程,還要用過程本身的特徵,把這一結果具體化。
對於正態過程,其分佈間的絕對連續性問題的討論開始最早。1958年J.哈耶克和J.費爾德曼獨立地證明了:對具有不同協方差函數和均值函數的正態過程,其概率分佈之間或者相互絕對連續,或者相互奇異,並用不同方式給出了各自成立的條件。特別,若為相互獨立的正態隨機變數序列,在、下,的概率分佈分別為、,則
與 相互絕對連續的充分必要條件是 、同時為零或同時不為零,且
這時
以後,還對許多具體的正態過程,給出了它們的概率分佈相互絕對連續時其均值函數和協方差函數所應滿足的條件及其密度的泛函形式。在信號檢測理論中,就是直接運用這些結果,獲得檢驗信號有無的方法和信號參數的各種估計量的。
對於馬爾可夫鏈(見馬爾可夫過程),往往可以利用轉移概率或Q 矩陣直接寫出其分佈密度及似然函數。這時, 對於轉移概率、Q矩陣或概率分佈中的未知參數,就可運用最大似然估計法或似然比檢驗進行推斷。例如設為生滅過程,,分別表示其生滅強度。若以分別表示x在中生殖和死亡的總數,記 則觀測到樣本 后,其似然函數
由此容易得出 的最大似然估計分別為 利用的漸近性質,還可以得出的相合性及其漸近分佈。類似的做法還可用於更一般的點過程。
對於狀態連續的馬爾可夫過程,討論得較多的是由隨機微分方程 規定的擴散方程,其中W為布朗運動。例如,設過程分別滿足方程;表示的概率分佈。若滿足方程存在惟一解的條件,且以概率1成立則與相互絕對連續,且
,
上式右端第一項為關於半鞅的隨機積分。利用這一結果,可以解決下列過程的參數估計問題:若pθ表示的解的分佈,則
因此,和為 θ的充分統計量,而便是θ的最大似然估計。進而還可以推出的相合性與漸近正態性。
關於過程概率分佈間的絕對連續性問題,對獨立增量過程也有較完善的討論。70年代后,鞅論方法已用於對這一問題的討論,且對半鞅也給出了概率分佈間絕對連續的條件及密度的泛函形式。這些都為過程統計的發展開闢了道路。
不依賴於密度的統計方法 在許多實際問題的模型中,常把被觀測的隨機過程記為,其中非隨機項反映的趨勢變化或周期變化部分,αυ,θ是未知參數,均值為零的隨機過程往往表示觀測受到的干擾和誤差。在這類模型中,往往只須對的部分統計特徵進行推斷。採用的方法可以不必求出概率分佈間的密度,僅須對X的二階矩或前四階矩附加某些要求,一般是假定x的二階或前四階矩為平穩的。
對Z的統計分析常考慮下列問題:回歸係數的估計,均值函數中其他參數θ(例如隱蔽周期)的估計,x的統計特徵(包括協方差函數、譜密度等)的估計及有限參數模型擬合等(見時間序列分析)。
過程統計從其任務來看,本質上與數理統計是一致的。但過程統計處理的不獨立隨機變數的統計問題遠較獨立隨機變數的相應問題來得複雜。過程統計的各種方法及其論證,更多地用到隨機過程論的許多成果。隨著隨機過程應用領域的擴大和理論研究的深入,各種過程統計方法也愈廣泛地被採用,其理論也將日趨完善。
參考書目
I.V.Basawa and B.L.S.Prakasa Rao,Statistical lnference for Stochastic Processes, Academic Press, New York,1980.
U. Grenander, Abstract lnference,John Wiley & Sons,New York, 1981.