圖像檢索

圖像檢索

圖像檢索,從20世紀70年代開始,有關圖像檢索的研究就已開始,當時主要是基於文本的圖像檢索技術(Text-based Image Retrieval,簡稱TBIR),利用文本描述的方式描述圖像的特徵,如繪畫作品的作者、年代、流派、尺寸等。到90年代以後,出現了對圖像的內容語義,如圖像的顏色、紋理、布局等進行分析和檢索的圖像檢索技術,即基於內容的圖像檢索(Content-based Image Retrieval,簡稱CBIR)技術。CBIR屬於基於內容檢索(Content-based Retrieval,簡稱CBR)的一種,CBR中還包括對動態視頻、音頻等其它形式多媒體信息的檢索技術。

名詞簡介


檢索,論基圖檢索基容圖檢索,包括:戶需求析轉化,形檢索索引據庫提;另,收集圖資源,提取征,析標引,建圖索引據庫;根據似算,計算戶提索引據庫錄似,提取足閾值錄,按照似降序式輸。
步提檢索準確,系統合反饋技術收集戶檢索反饋息,顯突,逐步求精圖檢索程,檢索程需斷戶交互。

文本術語


基圖檢索沿傳統檢索技術,避圖視化元素析,圖稱、圖尺寸、壓縮類型、、標引圖,般鍵詞形式提查詢圖,根據級錄形式瀏覽查找類圖, 近,術語描述藝術、藝術史、建築及化,推級錄,描述圖概念、屬、類型刊號。)圖態圖、照片、圖標、背景、藝術剪輯圖、插圖、壁紙、、套圖級類,設量類。圖化,檔案管、圖管采式組織管圖。圖頁題、圖件稱、圖密切環繞容、圖鏈址圖析依據,根據析推斷圖征。

內容簡介


基於內容的圖像檢索根據圖像、圖像的內容語義以及上下文聯繫進行查找,以圖像語義特徵為線索從圖像資料庫中檢出具有相似特性的其它圖像。因為圖像的規模一般要大於純粹的文本信息,因此,基於內容的圖像檢索在檢索的速度和效率上要求更高。目前已有不少應用於實踐環境的基於內容圖像檢索系統,如由IBM公司開發的最早商業化QBIC系統,以及由哥倫比亞大學研發的WebSeek系統、麻省理工學院研發的Photobook系統等。通過基於內容的技術檢索Web圖像,首先需要從Web中剝離圖像,組成圖像集,對圖像集中的各個對象進行基於內容的特徵分析、相似度匹配。
基於內容的圖像檢索系統一般包括圖像處理模塊、查詢模塊、對象庫和特徵庫和知識庫

網路簡介


根據基於文本的圖像檢索和基於內容的圖像檢索的實現原理可以發現,一般圖像檢索系統提供給用戶的查詢方法主要包括下列幾種形式:
關鍵詞查找:關鍵詞查找輸入關鍵詞對查找圖像進行描述,大多數網路搜索引擎提供的是關鍵詞查找的方式檢索,例如,希望查找山水風景的圖片,可以輸入“山水畫”;又如希望查找關於貓的圖片,可以直接輸入“貓”。
瀏覽查找:瀏覽查找是指通過等級式類目組織的圖像檢索人口,圖像按照不同的主題進行歸類,用戶在查找自己希望的圖像時,通過點擊層層類目的鏈接,到達自己所希望的類目下的圖像。
特徵輸入查找:對圖像的特徵參數進行設置,如希望圖像中的色彩比例為“R:128 ; G:128; B:64”,或者是對圖像的明亮度在0~100%之間加以調節。
草圖查找:用戶親自動手繪製希望查找的圖像特徵,以用戶描繪的草圖為訓練樣本,查找與之相似的其它圖像。
示例查詢:包括系統隨機給出樣本和用戶提交樣本兩種,由系統隨機給出一組圖像訓練樣本時,讓用戶對這組圖像進行評價,選擇與自己的檢索需求相似的圖像,然後根據用戶選擇的圖像進行分析,檢出與之相似的其它圖像。另外,也可以由用戶提供一副圖像的地址信息,由圖像檢索系統即時抓取、即時分析。
歸納而言,圖像檢索的方法對應於圖像特徵的三個層次,也可以歸結為相應的三個層次:
簡單的可視化特徵層次:對圖像的簡單可視化特徵進行查詢,如顏色、紋理、形狀或者是圖像中元素的空間,這些特徵反應的一般是圖像本身客觀的一些屬性,因此,一般不需要任何外界知識的輔助。
中間的對象層次:對圖像的個體特徵進行查詢是介於簡單的可視化特徵查詢和高級的抽象語言特徵查詢的中間狀態,一般表現為對局部的特徵查詢,例如檢索圖像中的某個對象或者是某個人物等。這種查詢一般需要對識別和檢索的目標進行一定程度的邏輯推理,所以需要藉助外界知識的輔助。
高級抽象的特徵層次:對圖形的抽象屬性的查詢,包括檢索與某個事件或者是某個活動相關的圖像,例如查找反映某種情感色彩,或者是符合某種風格流派的圖像,這時需要對這些抽象的目標和場景所代表的意義進行分析,需要對其進行更高級的推理,同時這類特徵帶有較強的主觀色彩,因此,更需要外界知識的輔助。

研究三個方向


基於文本和基於內容是圖像檢索發展的兩個分支,不過從目前圖像檢索研究的趨勢而言,尤其結合網路環境下圖像的特徵——嵌入在具有文本內容的Web文檔中,出現了三個不同的研究著眼點。
立足於文本
立足於文本,對圖像進行檢索。試圖將傳統的文本檢索技術移植於對多媒體信息的檢索上,因為基於文本的檢索技術發展已經成熟。如Page-Rank方法、概率方法、位置方法、摘要方法、分類或聚類方法、詞性標註法等,不僅技術發展較為成熟,同時分析和實現的難度略小。但是因為受控辭彙本身的局限,易歧義,更新慢,所以不太容易應對網路上日新月異的各類圖像。
立足於圖像內容
立足於圖像內容,對圖像進行分析和檢索。相比而言,儘管圖像檢索已經出現了諸如直方圖、顏色矩、顏色集等多種表徵圖像特徵的方法,但是要突破對低層次特徵的分析,實現更高語義上的檢索,實現難度大,進展慢。不過,基於內容的圖像檢索建立在多媒體信息的內容語義上,能夠更為客觀地反映媒體本質的特徵。
結合文本和內容
結合文本和內容,進行融合性研究。發揮各自的優勢促進圖像的高效、簡單檢索方式的實現,尤其是網路環境下,結合圖像所在Web文檔的特徵分析,推斷圖像的特徵,同時結合對圖像的內容分析,共同標引達到對圖像的分析和檢索。
可以說,三個方向都是相互影響和促進的,任何一個方向的進展都會促進圖像檢索技術向前更進一步。