標引

標引

標引,顧名思義,標是標記,引是指引,就是通過標記指引人們方便、快捷地找到所需要的信息。通過對文獻的分析,選用確切的檢索標識(類號、標題詞、敘詞、關鍵詞、人名、地名等),用以反映該文獻的內容的過程。主要指選用檢索語言詞或自然語言詞反映文獻主題內容,並以之作為檢索標識的過程。Indexing一詞,音譯為引得法或意譯為索引法,系指索引的編製技術與方法。現代外語辭典中則說明此詞有2解,一指索引法,一指標引。

標引重要性


標引是文獻加工中的重要環節。通過標引,文獻工作者賦予文獻以檢索標識,指明其內容特徵的主題類屬,而後用以配合書目信息編製出各種目錄和索引,或存儲於計算機內,以實現文獻的檢索。標引可按使用檢索語言的類型區分,使用分類檢索語言時,稱為分類標引;使用主題檢索語言時,稱為主題標引。主題標引又分為受控標引與非控標引。受控標引指須由事先指定的敘詞表(主題詞表)中選用相應規範詞,對文獻進行標引。非控標引又稱自由詞標引,指不設規範詞表而由標引人員直接選用文獻內自然語言詞,對文獻進行標引。標引的實質,是按文獻的內容特徵對其進行主題類屬的劃分與區分。
F.W.蘭開斯特認為,主題標引包括兩個很不相同的智力工作步驟,即主題分析與用詞的轉換。所謂用詞的轉換,指選用相應的檢索語言規範詞標明文獻的主題類屬。因此,標引是主題分析與用詞表達兩個步驟的結合。標引的質量,對文獻的檢索效果有直接的決定性影響。衡量標引的質量,一般採用兩個客觀上可比的指標,即:窮舉度與一致性。標引窮舉度,指標引時是否將文獻所討論的全部主題反映出來;標引一致性,是指不同標引人員或同一標引人員在不同時期,對同一主題文獻標引時,對其主題歸屬的一致程度。從文獻檢索的角度看,窮舉度高,有利於提高查全率,一致性強,則有利於提高查准率。由於計算機化檢索系統的建立和文獻資料庫的應用,出現了自動標引。自動標引是指利用計算機對文獻自動進行標引,以代替人的腦力勞動。自動標引有兩種形式:抽詞標引與賦詞標引。無論抽詞標引或賦詞標引,首先都需要將文獻轉化為機讀形式。抽詞標引以文獻內詞的出現頻率作為是否取為標引詞(用作檢索標識的檢索詞,亦稱索引詞)的判據。設立頻率閾時,一般以相對頻率代替絕對頻率效果較好。賦詞標引則須將詞表存入機內,作為計算機對比選用標引詞的依據。為了解決漢語文獻的自動標引,須解決漢語中詞的自動切分問題。

標引意義


對信息內容進行主題分析,賦予檢索標識的過程。