立體視覺
立體視覺
立體視覺是雙眼觀察景物能分辨物體遠近形態的感覺。
立體視覺是計算機視覺領域的一個重要課題,它的目的在於重構場景的三維幾何信息。立體視覺的研究具有重要的應用價值,其應用包括移動機器人的自主導航系統,航空及遙感測量,工業自動化系統等。
假如被測試者的立體視功能正常,就能迅速而正確地找出這幅圖案,以此確定其立體視敏度為多少秒,正常為100s,此檢測的優點是不需戴非凡眼鏡,能很快地查出被檢者有無立體視覺。
異常結果:眼球震動,斜視,對眼,看東西歪頭眯眼,沒有立體感,眼手協調差。
需要檢查的人群:立體視覺缺失(立體盲)。
不合宜人群:沒有特殊說明。
檢查前禁忌:發現這種現象,切忌拖延。
檢查時要求:注意定向方向。
通常可用:(1) 同視機檢查:可檢查雙眼視功能,包括同時視、融像、立體視三級視功能。檢查立體視覺時需用立體視畫片。可根據同視機檢查說明進行,得出結果后加以判定。
(2) 立體視覺檢查器:由三塊厚薄不同的測驗板組成,每塊板印有四幅隨意網路結構圖案,其中一幅圖案的中間是凸出來的(從另一面看是凹進去的)。
相關疾病
副腫瘤性斜視性眼肌陣攣-肌陣攣,嬰幼兒型內斜視,微小度數斜視,反向斜視,急性共同性斜視,周期性內斜視,固定性斜視,原發性共同性內斜視,原發性非調節性內斜視,間歇性外斜視。
斜視性弱視,斜視。
一般而言,立體視覺的研究有如下三類方法:
(1) 直接利用測距器(如激光測距儀)獲得程距(range data)信息,建立三維描述的方法;
(2) 僅利用一幅圖象所提供的信息推斷三維形狀的方法;
(3) 利用不同視點上的,也許是不同時間拍攝的,兩幅或更多幅圖象提供的信息重構三維結構的方法。
第一類方法,也就是程距法 (range data method),根據已知的深度圖,用數值逼近的方法重建表面信息,根據模型建立場景中的物體描述,實現圖象理解功能。這是一種主動方式的立體視覺方法,其深度圖是由測距器(range finders)獲得的,如結構光(structured light)、激光測距器(laser range finders) 等其他主動感測技術 (active sensing techniques)。這類方法適用於嚴格控制下的環境(tightlycontrolled domains),如工業自動化的應用方面。
第二類方法,依據光學成象的透視原理及統計假設,根據場景中灰度變化導出物體輪廓及表面,由影到形(shape from shading),從而推斷場景中的物體。線條圖的理解就是這樣的一個典型問題,曾經引起了普遍的重視而成為計算機視覺研究領域的一個焦點,由此產生了各種各樣的線條標註法。這種方法的結果是定性的,不能確定位置等定量信息,該方法由於受到單一圖象所能提供信息的局限性,存在難以克服的困難。
第三類方法,利用多幅圖象來恢復三維信息的方法,它是被動方式的。根據圖象獲取方式的區別又可以劃分成普通立體視覺和通常所稱的光流(optical flow)兩大類。普通立體視覺研究的是由兩攝像機同時拍攝下的兩幅圖象,而光流法中研究的是單個攝像機沿任一軌道運動時順序拍下的兩幅或更多幅圖象。前者可以看作後者的一個特例,它們具有相同的幾何構形,研究方法具有共同點。雙目立體視覺是它的一個特例。
立體視覺的研究由如下幾部分組成:
(1) 圖象獲取 (image acquisition),
用作立體視覺研究的圖象的獲取方法是多種多樣的,在時間、視點、方向上有很大的變動範圍,直接受所應用領域的影響。立體視覺的研究主要集中在三個應用領域中,即自動測繪中的航空圖片的解釋,自主車的導引及避障,人類立體視覺的功能模擬。不同的應用領域涉及不同類的景物,就場景特徵的區別來分,可以劃分成兩大類,一類是含有文明特徵(cultural features)的景物,如建築、道路等; 另一類是含有自然特徵的景物和表面(natural objects and surfaces),如山、水、平原及樹木等。不同類的景物的圖象處理方法大不相同,各有其特殊性。
總之,與圖象獲取相關的主要因素可歸納如下:
(a) 場景領域 (scene domain),
(b) 計時 (timing),
(c) 時間(照明和陰影)(time of day (lighting and presence ofshadows)),
(d) 成像形態(包括特殊的遮蓋)(photometry (including special coverage)),
(e) 解析度 (resolution),
(f) 視野 (FIELD OF VIEW),
(g) 攝像機的相對位置 (relative camera positioning)。
場景的複雜程度受如下因素的影響:
(a) 遮掩 (occlusion),
(b) 人工物體(直的邊界,平的表面) (man-made objects (straight edge, flat surfaces)),
(c) 均勻的紋理區域 (smoothlytextured areas),
(d) 含有重複結構的區域 (areas containing repetitive structure)。
(2) 攝像機模型 (camera modeling),
攝像機模型就是對立體攝像機組的重要的幾何與物理特徵的表示形式,它作為一個計算模型,根據對應點的視差信息,用於計算對應點所代表的空間點的位置。攝像機模型除了提供圖象上對應點空間與實際場景空間之間的映射關係外,還可以用於約束尋找對應點時的搜索空間,從而降低匹配演演算法的複雜性,減小誤匹配率。
(3) 特徵抽取 (feature acquisition),
幾乎是同一灰度的沒有特徵的區域是難以找到可靠匹配的,因而,絕大部分計算機視覺中的工作都包括某種形式的特徵抽取過程,而且特徵抽取的具體形式與匹配策略緊密相關。在立體視覺的研究中,特徵抽取過程就是提取匹配基元的過程。
(4) 圖象匹配 (image matching),
圖象匹配是立體視覺系統的核心,是建立圖象間的對應從而計算視差的過程,是極為重要的。
(5) 深度計算 (distance(depth) determination),
立體視覺的關鍵在於圖象匹配,一旦精確的對應點建立起來,距離的計算相對而言只是一個簡單的三角計算而已。然而,深度計算過程也遇到了顯著的困難,尤其是當對應點具有某種程度的非精確性或不可靠性時。粗略地說,距離計算的誤差與匹配的偏差成正比,而與攝像機組的基線長成反比。加大基線長可以減少誤差,但是這又增大了視差範圍和待匹配特徵間的差別,從而使匹配問題複雜化了。為了解決這一問題出現了各種匹配策略,如由粗到精策略,松馳法等。
在很多情況下,匹配精度通常是一個象素。但是,實際上區域相關法和特徵匹配法都可以獲得更好的精度。區域相關法要達到半個象素的精度需要對相關面進行內插。儘管有些特徵抽取方法可以得到比一個象素精度更好的特徵,但這直接依賴於所使用的運算元類型,不存在普遍可用的方法。
另一種提高精度的方法是採用一個象素精度的演演算法,但是利用多幅圖象的匹配,通過多組匹配的統計平均結果獲得較高精度的估計。每組匹配結果對於最後深度估計的貢獻可以根據該匹配結果的可靠性或精度加權處理。
總之,提高深度計算精度的途徑有三條,各自涉及了一些附加的計算量:
(a) 半像素精度估計 (subpixel estimation),
(b) 加長基線長 (increased stereo baseline),
(c) 幾幅圖的統計平均 (statistical averaging over several views)。
(6) 內插 (interpolation)。
在立體視覺的應用領域中,一般都需要一個稠密的深度圖。基於特徵匹配的演演算法得到的僅是一個稀疏而且分佈並不均勻的深度圖。在這種意義下,基於區域相關匹配的演演算法更適合於獲得稠密的深度圖,但是該方法在那些幾乎沒有信息(灰度均勻)的區域上的匹配往往不可靠。因此,兩類方法都離不開某種意義的內插過程。最為直接的將稀疏深度圖內插成稠密的深度圖的方法是將稀疏深度圖看作為連續深度圖的一個採樣,用一般的內插方法(如樣條逼近)來近似該連續深度圖。當稀疏深度圖足以反映深度的重要變化時,該方法可能是合適的。如起伏地貌的航空立體照片的處理中用這種方式的內插也許是比較合適的。但是這種方法在許多應用領域中,尤其是在有遮掩邊界的圖象的領域中,就不適用了。
Grimson 指出可匹配特徵的遺漏程度反映了待內插表面變化程度的相應限度,在這種基礎上,他提出了一個內插過程。換一角度來看,根據單幅圖象的“由影到形”的技術,用已經匹配上的特徵來建立輪廓條件和光滑的交接表面可以確保內插的有效性。這些方法結合起來,可以使內插過程達到合乎要求的目標。內插的另一種途徑是在已有的幾何模型與稀疏深度圖之間建立映射關係,這是模型匹配過程。一般而言,要進行模型匹配,預先應將稀疏深度圖進行聚類,形成若干子集,各自相應於一種特殊結構。然後找每一類的最佳對應模型,該模型為這種特殊結構(物體)提供參數和內插函數。如 Gennery用這種方法來發現立體對圖片中的橢圓結構,Moravec 用於為自主車探測地面。