地統計學

地統計學

地統計學,是指以具有空間分佈特點的區域化變數理論為基礎,研究自然現象的空間變異與空間結構的一門學科。它是針對像礦產、資源、生物群落、地貌等有著特定的地域分佈特徵而發展的統計學。由於最先在地學領域應用,故稱地統計學。地統計學的主要理論是統計學家馬特龍創立的,經過不斷完善和改進,目前已成為具有堅實理論基礎和實用價值的數學工具

簡介


它針對像礦產、資源、生物群落、地貌等有著特定的地域分佈特徵而發展的統計學。由於最先在地學領域應用,故稱為地統計學。地統計學的主要理論是法統計學家G.Matheron 創立的,經過不斷完善和改進,目前已成為具有堅實理論基礎和實用價值的數學工具。
地統計學的應用範圍十分廣泛,不僅可以研究空間分佈數據的結構性和隨機性、空間相關性和依賴性、空間格局與變異,還可以對空間數據進行最優無偏內插,以及模擬空間數據的離散性及波動性。地統計學由分析空間變異與結構的變異函數及其參數和空間局部估計的Kriging(克里格)插值法兩個主要部分組成,目前已在地球物理、地質、生態、土壤等領域應用。氣象領域的應用目前還不多見,主要使用Kriging法進行降水、溫度等要素的最優內插的研究及氣候對農業影響方面的研究。

地統計模擬


模擬概念
模擬在廣義上是指使用模型複製現實的過程。在地統計中,模擬是隨機函數(表面)的實現,其與生成該模擬的樣本數據擁有相同的地統計要素(使用均值方差和半變異函數來度量)。更具體地說,高斯地統計模擬 (GGS) 適用於連續數據,並假設數據或數據的變換具有正態(高斯)分佈。GGS 所依託的主要假設是數據是靜態的 - 均值、方差和空間結構(半變異函數)在數據空間域上不發生改變。GGS 的另一個主要假設是建模的隨機函數為多元高斯隨機函數。
克里金法相比,GGS 具有優勢。由於克里金法是基於數據的局部平均值的,因此,其可生成平滑的輸出。另一方面,GGS 生成的局部變異性的製圖表達比較好,因為 GGS 將克里金法中丟失的局部變異性重新添加到了其生成的表面中。對於由 GGS 實現添加到特定位置的預測值中的變異性,其平均值為零,這樣,很多 GGS 實現的平均值會趨向於克里金預測。下圖對此概念進行了說明。各種實現以一組堆疊輸出圖層的形式表示出來,並且特定坐標位置的值服從高斯分佈,其平均值等於該位置的克里金估計值,而擴散程度則由該位置上的克里金法方差給出。
提取值到表工具可以用來為上圖中的圖形生成數據,在對 GGS 生成的輸出進行后處理時該工具也很有用。
對 GGS 的使用在地統計實際操作中日益呈現出一種趨勢,它不是追求獲得每個未採樣位置的最佳無偏預測結果(正如克里金法所體現的),而是強調對決策分析和風險分析的不確定性的特證描述,這樣更適合於呈現數據中的全局趨勢 (Deutsch and Journel 1998, Goovaerts 1997)。模擬還會克服克里金估計值中的條件偏差帶來的問題(高值區域預測值通常偏低,而低值區域預測值通常偏高)。
對於所研究屬性的空間分佈,地統計模擬可為其生成多個具有同等可能性的製圖表達。可基於這些製圖表達來測量未採樣位置的不確定性,這些未採樣位置在空間上被一起選取,而不是逐個被選取(如同通過克里金法方差進行測量一樣)。此外,克里金法方差通常獨立於數據值,且通常不能用作估計精度的測量值。另一方面,可以通過使用多個模擬實現(該實現用呈正態分佈的輸入數據通過簡單克里金模型進行構建,即,數據呈正態分佈或已使用常態得分變換或其他類型的變換對數據進行了變換)為未採樣位置的估計值構建分佈來測量估計精度。對於使用估計數據值的風險評估和決策分析而言,這些不確定性的分佈很關鍵。
GGS 假設數據呈正態分佈,但在實際中,很少會出現這種情況。對數據執行常態得分變換,使得數據符合標準正態分佈(均值 = 0,方差 = 1)。然後對此正態分佈數據進行模擬,並對結果做反向變換,以便以原始單位獲得模擬輸出。對正態分佈數據使用簡單克里金法時,該克里金法所提供的克里金估計值和方差可完全定義研究區域中每個位置的條件分佈。這樣,您可以在只知道每個位置的這兩個參數的情況下繪製隨機函數(未知採樣表面)的模擬實現,這也是GGS 基於簡單克里金模型和正態分佈數據的原因。
“高斯地統計模擬”工具支持兩種類型的模擬:
1、條件模擬遵循數據值(除非克里金模型中包含測量誤差)。由於模擬會在格網像元中心生成值,因此,如果此值與採樣點的位置不完全對應,則採樣位置的測量值與模擬值可能會不同。條件模擬也將以平均方式(即,在很多實現上平均)複製數據的均值、方差和半變異函數。模擬表面看起來很像克里金預測地圖,但其將顯示更多的空間變異性。
2、非條件模擬不遵循數據值,但會以平均方式複製數據的均值、方差和半變異函數。模擬表面所顯示的空間結構類似於克里金地圖,但輸入數據中存在高值或低值的地方不一定會出現高值和低值。