空間內插

空間內插

在已觀測點的區域內估算未觀測點的數據的過程稱為內插;在已觀測點的區域外估算未觀測點的數據的過程稱為外推。空間數據的內插和外推在GIS中使用十分普遍。

目錄

正文


數字高程模型(DEM),也稱數字地形模型(DTM),是一種對空間起伏變化的連續表示方法。
空間數據的插值
用各種方法採集的空間數據往往是按用戶自己的要求獲取的採樣觀測值,亦既數據集合是由感興趣的區域內的隨機點或規則網點上的觀測值組成的。但有時用戶卻需要獲取未觀測點上的數據,而已觀測點上的數據的空間分佈使我們有可能從已知點的數據推算出未知點的數據值。
一般情況下,空間位置越靠近的點越有可能獲得與實際值相似的數據,而空間位置越遠的點則獲得與實際值相似的數據的可能性越小。下面介紹一些常用的內插方法。
1、邊界內插
使用邊界內插法時,首先要假定任何重要的變化都發生在區域的邊界上,邊界內的變化則是均勻的、同質的。
圖4-6-1
邊界內插的方法之一是泰森多邊形法。泰森多邊形法的基本原理是,未知點的最佳值由最鄰近的觀測值產生。如圖4-6-1所示。
泰森多邊形的生成演演算法見§5.7。
2、趨勢面分析
趨勢面分析是一種多項式回歸分析技術。多項式回歸的基本思想是用多項式表示線或面,按最小二乘法原理對數據點進行擬合,擬合時假定數據點的空間坐標X、Y為獨立變數,而表示特徵值的Z坐標為因變數。
當數據為一維時,可用回歸線近似表示為:
其中,a0、a1為多項式的係數。當n個採樣點方差和為最小時,則認為線性回歸方程與被擬合曲線達到了最佳配准,如圖4-6-2左圖所示,即:
圖4-6-2
當數據以更為複雜的方式變化時,如圖4-6-2右圖所示。在這種情況下,需要用到二次或高次多項式:
在GIS中,數據往往是二維的,在這種情況下,需要用到二元二次或高次多項式:
(二次曲面)
多項式的次數並非越高越好,超過3次的多元多項式往往會導致奇異解,因此,通常使用二次多項式
趨勢面是一種平滑函數,難以正好通過原始數據點,除非數據點數和多項式的係數的個數正好相同。這就是說,多重回歸中的殘差屬正常分佈的獨立誤差,而且趨勢面擬合產生的偏差幾乎都具有一定程度的空間非相關性。
3、局部內插
在GIS中,實際的連續空間表面很難用一種數學多項式來描述,因此,往往使用局部內插技術,即利用局部範圍內的已知採樣點的數據內插出未知點的數據。常用的有線性內插、雙線性多項式內插、雙三次多項式(樣條函數)內插。
(1)、線性內插
線性內插的多項式函數為:
只要將內插點周圍的3個數據點的數據值帶入多項式,即可解算出係數a0、a1、a2 。
(2)、雙線性多項式內插
雙線性多項式內插的多項式函數為:
只要將內插點周圍的4個數據點的數據值帶入多項式,即可解算出係數a0、a1、a2、a3 。
圖4-6-3
如果數據是按正方形格網點布置的(如圖4-6-3),則可用簡單的公式即可計算出內存點的數據值。
設正方形的四個角點為A、B、C、D,其相應的特徵值為ZA、ZB、ZC、ZD,P點相對於A點的坐標為dX、dY,則插值點的特徵值Z為:
(3)、雙三次多項式(樣條函數)內插
雙三次多項式是一種樣條函數。樣條函數是一種分段函數,對於n次多項式,在邊界處其n-1階導數連續。因此,樣條函數每次只用少量的數據點,故內插速度很快;樣條函數通過所有的數據點,故可用於精確的內插,可以保留微地貌特徵;樣條函數的n-1階導數連續,故可用於平滑處理。
雙三次多項式內插的多項式函數為:
將內插點周圍的16個點的數據帶入多項式,可計算出所有的係數。
在未知點X處內插變數Z的值時,最常用的方法之一是在局部範圍(或稱窗口)內計算個數據點的平均值。既:
對於二維平面的移動平均法也可用相同的公式,但位置Xi應被坐標矢量Xi代替。
窗口的大小對內插的結果有決定性的影響。小窗口將增強近距離數據的影響;大窗口將增強遠距離數據的影響,減小近距離數據的影響。
當觀測點的相互位置越近,其數據的相似性越強;當觀測點的相互位置越遠,其數據的相似性越低。因此,在應用移動平均法時,根據採樣點到內插點的距離加權計算是很自然的。這就是加權移動平均法,即:
其中,λi是採樣點i對應的權值,常取的形式有:
加權平均內插的結果隨使用的函數及其參數、採樣點的分佈、窗口的大小等的不同而變化。通常使用的採樣點數為6—8點。對於不規則分佈的採樣點需要不斷地改變窗口的大小、形狀和方向,以獲取一定數量的採樣點。