檢索策略

檢索策略

檢索策略,就是在分析檢索提問的基礎上,確定檢索的資料庫、檢索的用詞,並明確檢索詞之間的邏輯關係和查找步驟的科學安排。檢索式(即檢索用詞與各運算符的組配成的表達式)僅僅是狹義上的檢索策略。檢索策略可根據檢索目標和命中文獻的有無或多寡而調整其查全率與查准率

基本環節


1明確課題需求、選擇資料庫

檢索過程中的首要環節,就是要明確課題需求,第一步如果搞錯了,就談不上最後檢索結果的正確性。
由於用戶對自己的需求,特別是潛在的、模糊的需求並不總是非常明確,因此需要進行分析,以求得一個完整而明確的表達。
在用戶需求分析中,應搞清楚以下一些問題:
(1)分析課題檢索的目的
通常有幾種類型:
1) 開始某一項科學研究或承接某項工程設計,需要對課題進行全面的文獻普查,並從中篩選出所需的資料,用以編寫可行性報告、計劃任務書等。
對這樣的課題,應選擇一個年限比較長的,收錄比較廣泛的相關專業的二次文獻資料庫,在全面回溯檢索的基礎上,選出相關的文獻,再獲取一次文獻
2) 為解決某個技術難題,查找關鍵性的技術資料。
對這樣的課題,應選擇工程和技術類資料庫或專利資料庫。
3) 為貿易與技術引進、合資談判,了解國外市場、產品與公司的行情。
查找科學資料庫以了解技術的先進性,查找市場、產品、公司等商情資料庫以對手的情況。
4) 為申報專利或鑒定成果,查找參考依據。
以選擇國內外專利資料庫為主。
5) 為某項決策查找有關情報。
根據決策的不同性質,進行綜合性的全面文獻調研,涉及到科學研究、技術研究、產品、市場等最新發展動態。
6) 為撰寫論文查找相關文獻等。
以期刊論文、學位論文等學術研究性的資料庫為主。
(2)明確題所涉及的學科範圍和專業面
明確課題所涉及的主要學科範圍、相關學科範圍、交叉學科範圍,並根據資料庫的主題收錄範圍進行選擇。
(3)對文獻的新穎性程度的要求
對文獻新穎性要求高,就要選擇數據更新周期短、速度快的資料庫。
(4)用戶對檢索的查全與查准要求
檢索策略
檢索策略
為滿足查全要求,就要普查多種資料庫,為快速滿足查准要求,應選擇主題範圍最專指的資料庫。

2主題分析

明確檢索需求后,就要對用戶課題的具體內容作主題分析,這是正確選用檢索詞和邏輯算符的的關鍵,它將決定檢索策略的質量並影響檢索效果
主題分析就是對用戶的課題進行主題概念的分析,並用一定的概念詞來表達這些主題內容,同時明確概念與概念之間的邏輯關係。主題分析必須注意:
(1)概念的表達要確切。抓住課題的實質性內容,分析出課題中有幾個概念組面。
(2)找出核心的概念組面,排除掉無關概念組面,包括意義不大的概念和重複概念。用戶有時會認為選取的概念組面越多,邏輯組配越細緻,檢索結果的針對性越強。事實上,過多過嚴的概念組配很可能導致大量的漏檢,甚至結果為零。因此有時需要簡化邏輯關係,減少概念組面,以提高檢索效果。
(3)找出隱含的重要概念。如"智力測試",隱含著"能力測試"、"態度測試"、"創造力測試"等概念。資料庫的標引往往使用比較專指的詞,用戶對標引規則不甚了解,往往會列出比較抽象的概念,而忽略了較專指的概念
(4)明確概念組面之間的交叉關係,即明確是邏輯"與"、邏輯"或"還是邏輯"非"的關係。哪些概念可以用來擴大檢索範圍,哪些可以作為進一步縮小檢索範圍的主題詞。明確這些邏輯關係,有助於編製出正確的檢索式。

定義概念


qingbao jiansuo cele情報檢索策略information retrieval strategy在分析情報實質的基礎上,確定檢索途徑與檢索用詞,並明確各詞之間的邏輯關係與查找步驟的科學安排。

計算機檢索


在計算機檢索的條件下,由於情報提問與文獻標識之間的對比匹配工作是機器進行的,必須事先擬訂周密的檢索策略,用計算機能夠理解和運算的形式加以表達,而後交計算機去執行。最常用的表達形式,是應用布爾邏輯(OR,AND,NOT)的原理,使用概念組配的方法,轉化成布爾邏輯檢索表達式。這種表達式,從狹義來說就是檢索策略。任何情報需求,不管表面看起來多麼複雜,都可以用布爾邏輯式加以表達。例如,“輕金屬的焊接”這一情報需求,包含了“輕金屬”這一概念組面和“焊接”另一個概念組面,這兩個組面之間是邏輯乘(AND或×) 的關係。而每個組面應根據所檢資料庫的詞表選出合適的檢索詞。同一組面內的各詞用邏輯或 (OR或+)連接因而可以形成如下檢索表達式:(輕金屬+鎂+鋁+鉍)×(焊接+結合+銅焊+粘接) 。檢索策略可根據檢索目標和命中文獻的有無或多寡而調整其查全率與查准率。提高查全率的措施有;提高檢索詞的泛指度,控制同義詞;截詞;減少用邏輯乘或邏輯非的概念組面;增加用邏輯或連接的相關檢索詞;聚類檢索法,以及字串位置邏輯等。提高查准率的措施有:提高詞的專指度;增加用邏輯乘或邏輯非連接的概念組面;連號法;職號法;加權法;利用文獻的外表特徵進行限制等。而在實現上述調整中,一是依靠概念的分析,即從學科專業知識出發,選擇泛指詞、專指詞及相關詞以及它們的權值,並確定概念組面和組配邏輯;另一是依靠功能操作,即利用計算機檢索系統的功能,從文獻的類型、年代、文種等外表特徵入手對命中文獻集合進行調整與控制。