情報檢索語言
情報檢索語言
目錄
根據情報檢索的需要而創製的人工語言,專門用於各種手工的和計算機化的文獻情報存儲檢索系統,表達文獻主題概念和檢索課題概念,亦稱文獻工作語言。情報檢索語言實質上是表達一系列概括文獻情報內容的概念及其相互關係的概念標識系統。它可以是從自然語言中精選出來並加以規範化的一套辭彙,可以是代表某種分類體系的一套分類號碼,也可以是代表某一類事物的某一方面特徵的一套代碼,用以對文獻內容和情報需要進行主題標引、邏輯分類或特徵描述。
情報檢索語言作為文獻情報存儲檢索系統的一個要素,在其中起著語言保證作用。基本功能是:①對文獻的情報內容(及某些外部特徵)加以標引;②對內容相同及相關的情報加以集中或揭示其相關性;③對大量情報加以系統化或組織化;④便於將標引用語和檢索用語進行相符性比較。
情報檢索語言由辭彙和語法組成。辭彙是指登錄在分類表、詞表、代碼表中的全部標識,一個標識 (分類號、檢索詞、代碼)就是它的一個語詞,而分類表、詞表、代碼表則是它的詞典。語法是指如何創造和運用那些標識來正確表達文獻內容和情報需要,以有效地實現情報檢索的一整套規則,分為詞法(主要用於分類表、詞表、代碼表編製過程)和句法(主要用於文獻標引和情報檢索過程)兩部分。
情報檢索語言主要以書面形式使用,其標識必須符合唯一性、規律性、定型性、通用性、準確性和政治思想上的正確性等質量要求,必須排除自然語言中的多詞一義、一詞多義和詞義含糊現象,並要有適當的專指度。
採用等級結構、參照系統、輪排聚類法、範疇聚類法和圖示法等各種顯示概念之間關係的方法,來實現對內容相同及相關的情報加以集中或揭示其相關性這項功能,是情報檢索語言優於自然語言的最主要之點。概念邏輯和知識分類(事物和學科的系統分類)是顯示概念關係的基本依據。
情報檢索語言選取概念(選詞和列類)是否符合文獻主題的實際情況和情報檢索的實際需要,標識的種類、結構、專指度、規範化程度和使用方式,在顯示概念關係方面的質量、分類表、詞表、代碼表的結構體系,以及檢索設備是否與其匹配,標引是否正確等,對情報檢索效率都有影響。
情報檢索語言按其結構原理,可分為分類檢索語言(分類法)、主題檢索語言(主題法)和代碼檢索語言;按其標識的組合使用方法,可分為先組式語言(文獻標識在編表時就固定組合好,也稱列舉式語言) 和后組式語言(文獻標識在檢索時才組合起來,也稱組配式語言)。后組式語言也可充當先組式語言使用 (文獻標識在標引時組合成固定的標識串,稱先組散組式)。此外,還可按其包括的學科或專業範圍、適用範圍等劃分類型。
50年代開始的情報檢索計算機化,對情報檢索語言的發展產生了深刻的影響,推動了情報檢索語言的創新和改造,使詞表、分類表向機讀化和機編化發展,使多種語言結合使用成為可能,促進了文獻標引過程和索引編製過程的自動化,促使許多新檢索方法的產生,擴大了情報檢索語言的應用範圍,特別是使自然語言在情報檢索中的應用成為可能。自然語言檢索系統並不是與情報檢索語言檢索系統絕然對立的,它們或採用情報檢索語言作為輔助手段,或與情報檢索語言結合使用,或利用情報檢索語言的某些原理和方法,以保證較高的檢索效率。當前,情報檢索語言仍是情報檢索中的主要語言工具。對情報檢索中的語言保證問題的研究,已成為情報學的重要領域,因而逐步形成情報語言學。情報語言學的主要研究對象就是情報檢索語言,同時也研究自然語言在情報檢索中的應用問題。