檢索詞

檢索詞

檢索詞(Search Term或Search word)是能概括要檢索內容的相關辭彙。檢索詞是表達信息需求和檢索課題內容的基本單元,也是與系統中有關據庫進行匹配運算的基本單元,檢索詞選擇恰當與否,直接影響檢索效果

分類


一、從詞的性質來劃分,檢索詞可以劃分為四類:表示主題的檢索詞、表示作者的檢索詞、表示分類的檢索詞和表示特殊意義的檢索詞。
1、表示主題的檢索詞
標題詞:指經規範化處理得先組定組式的辭彙。
單元詞:指從信息內容中抽出的最基本的辭彙。
敘詞:指從信息的內容中抽出的、能概括表達信息內容基本概念的名詞或術語,它是經規範化處理的自然語言辭彙。
關鍵詞:指從信息單元的題目、正文或摘要中抽出德能表徵信息主體內容的具有實質意義的詞語,它是未經規範化處理的自然語言辭彙。
2、表示作者的檢索詞。如作者姓名、機構名。
3、表示分類的檢索詞。如分類號
4、表示特殊意義的檢索詞。如ISBN、ISSN、引文標引詞等。
二、從語言的規範性方面來劃分,檢索詞又可以劃分為兩類:受控詞和非受控詞。
受控詞是事先規範化的檢索語言,取自主題詞表、敘詞表、分類表等,如果資料庫對數據採用了受控標引,並有機讀式或印本式主題詞表時,應優先選用其中的受控詞。
非受控詞是指非規範化的自然語言辭彙,又稱自由詞
受控詞和非受控詞兩者各有優缺點,受控詞的檢索效率高,一旦選定寬度適當的概念,系統就能檢出這一概念的全部內容,而且,由於標引人員已事先解決了自然語言中的同義、近義關係,使檢索相對容易,但由於其先組性質,受控詞不能及時反映新事物的發展,概念數量有限,結構複雜,不能適應數量眾多、要求各異的信息用戶,也不易為非專業人員掌握。非受控詞可以在一定程度上彌補這些缺陷。非受控詞具有可任意選詞、專指性強、不需要熟悉詞表、能使用新產生的名詞術語及時檢索與新概念有關的文獻,但主要缺點是不能提供概念的等級結構,不能檢索寬泛概念,解決同義詞、近義詞、相關詞的結合或連接問題。受控詞和非受控詞的作用是互補的,資料庫的詞表與我們要查詢的主題概念並非存在一一對應的關係,很多概念得不到反映,因此,當檢索結果不滿意時,要對選詞進行分析,要多備用一些辭彙,根據具體情況決定增、刪和替換。

選擇原則


檢索詞的選擇與確定要遵循以下兩個原則:
1、根據檢索課題所涉及的學科專業和技術內容選詞。
2、對檢索詞進行處理。如使用檢索詞表進行比較對照,選用規範化的辭彙作為檢索詞。