關鍵詞索引

關鍵詞索引

關鍵詞索引是以出現在文獻題名(或正文及文摘)中的描述文獻主題內容的關鍵詞為標目的字順索引。

目錄

正文


以出現在文獻題名(或正文及文摘)中的描述文獻主題內容的關鍵詞為標目的字順索引。它將每個關鍵詞輪排於索引款目中的標目位置,以提供多個檢索入口。一般分為兩類:一類是帶上下文的索引,如題內關鍵詞索引、題外關鍵詞索引、雙重關鍵詞索引等;另一類是不帶上下文的索引,如單純關鍵詞索引和詞對式關鍵詞索引。關鍵詞索引通常用計算機編製,較為簡便,適用於快速報道文獻和進行瀏覽性文獻檢索。由於關鍵詞屬未經規範的自然語言,利用關鍵詞索引難於查全同一主題的文獻,一般不用於編製累積索引。
簡史 西方15~16世紀出現的《聖經索引》和19世紀前期英、德等國家圖書館目錄中的主詞款目,已帶有關鍵詞索引的性質。1856年英國A.克里斯塔多羅的《圖書館編目技術》一書中出現了對關鍵詞索引法的最早論述。1958年美國H.P.盧恩和P.B.巴克森德爾同時向在華盛頓召開的國際科學情報會議提交關於用穿孔卡片分檢機編製關鍵詞索引的論文。次年,盧恩發表題為《技術文獻的上下文關鍵詞索引》的論文。此後他又致力於用計算機自動編製題內關鍵詞索引的研究,使機編關鍵詞索引逐步在科技檢索刊物中得到應用。20世紀60年代以後,在題內關鍵詞索引的基礎上又陸續產生了題外關鍵詞索引、雙重關鍵詞索引等一系列新品種。對關鍵詞索引的研究,促進了自動標引的實現和全文資料庫的建立。70年代以來,中國的一些圖書館、情報機構已開始用機編關鍵詞索引技術編製圖書館目錄和檢索刊物的主題索引。
題內關鍵詞索引 簡稱KWIC,又稱上下文關鍵詞索引。是最早出現的機編索引,首先應用於1960年美國化學文摘社創辦的《化學題錄》。題內關鍵詞索引的標目在款目的中部,左右均為該標目的上下文;索引款目按位於款目中部作為標目的關鍵詞的字順排列。格式如:
關鍵詞索引
關鍵詞索引
KWIC的設計思想是:①文獻題名通常具有揭示文獻主題內容的作用,從題名中抽取的關鍵詞能有效地將用戶指向相關主題的文獻;②保留題名中關鍵詞前後的上下文,有助於說明關鍵詞的含義,可用作限定標目含義的說明語。
KWIC的編製步驟包括:①把經過人工處理的文獻題名(包括增補的關鍵詞)輸入計算機。②計算機用“非用詞表”剔除題名中的介詞、連詞、冠詞等,篩選出有檢索意義的關鍵詞。③將每個關鍵詞依次輪流用作索引標目,同時保留其上下文。若題名過長,可以截斷或移位。④編成索引款目,並進行編排加工,最後交付印刷。上述工序除第一步由人工完成外,其餘皆由計算機完成。例如,一篇題為Play therapy for maladjusted children(《孤僻兒童的遊戲療法》)的論文,輸入計算機后可產生以下幾條索引款目:
關鍵詞索引
關鍵詞索引
檢索時先在索引款目中部找到與檢索課題有關的關鍵詞,再查看其左右的上下文,尋找切題的文獻。
題外關鍵詞索引 簡稱KWOC。最早出現的KWIC改進形式。與KWIC相比,其標目的位置不在款目的中部而是在款目的左端或提行至左上方,標目之後(或之下)仍保留完整的文獻題名。其款目格式為:編製時依次輪流將題名中的每個關鍵詞置於標目的位置,原題名中的關鍵詞也可用一符號(如星號)代替,題名之後註明文獻地址,最後款目按關鍵詞的字順排列起來。上例如按KWOC編製,可產生以下幾條款目:
關鍵詞索引
關鍵詞索引
children
play therapy for maladjusted *3000
maladjusted
play therapy for *children 3000
play
*therapy for maladjusted children 3000
therapy
play * for maladjusted children 3000
KWOC因標目位置突出,款目形式與普通主題索引接近,可讀性比題內關鍵詞索引強,符合用戶的檢索習慣。但所佔篇幅比KWIC大,並容易造成複合主題的文獻在字順序列中被分散在多處。
雙重關鍵詞索引 也稱雙重上下文關鍵詞索引,是KWIC和KWOC的結合形式,由美國A.E.彼特拉克於1969年創製。其特點是雙重標目,主標目(第一關鍵詞)在題名之外,副標目(第二關鍵詞)在題名的左端。索引款目共2行,其格式如:雙重關鍵詞索引兼有 KWIC及KWOC的優點,使用較為方便,但索引篇幅大,編印成本高。前例如編雙重關鍵詞索引,可產生下列幾條索引款目:
關鍵詞索引
關鍵詞索引
children
maladjusted children/play therapy for 3000
play therapy for maladjusted children/3000
therapy for maladjusted children/play 3000
maladjusted
children/play therapy for maladjusted 3000
play therapy for maladjusted children/3000
therapy for maladjusted children/play 3000
play
…………………………
單純關鍵詞索引 純粹由若干關鍵片語成的索引。其索引款目格式是:一般從題名、文摘或正文中抽出1~5個關鍵詞,將每一個關鍵詞依次輪流移至款目的左端或左上方作為標目,將其餘關鍵詞用作說明語。例如美國《化學文摘》中一篇題為“Acetylene crackingfrom heavy oil”的文獻(文獻地址為76733W ),可產生以下索引款目:
關鍵詞索引
關鍵詞索引
acetylene
heavy oil cracking 76733W
cracking
heavy oil acetylene 76733W
heavy
oil cracking acetylene 76733W
單純關鍵詞索引的製作較為簡單,它具有標引深度較大而索引篇幅較小的優點,但由於它不帶上下文,沒有語法結構,難於判斷索引款目的含義,查准率較低。
詞對式關鍵詞索引 由一對關鍵片語成的索引。其原理與雙重關鍵詞索引相似,只是不帶上下文。由於款目輪排時採用數學中的排列原理,因此又稱為輪排主題索引。1967年美國費城科學情報研究所(ISI)首創,最先用於編製《科學引文索引》的主題索引。格式如:如第一例編成詞對式關鍵詞索引, 可以產生以下 6條款目(款目按標目的字順排列):
關鍵詞索引
關鍵詞索引
children
maladjusted 3000
children
play therapy 3000
maladjusted
children 3000
maladjusted
play therapy 3000
play therapy
children 3000
play
maladjusted 3000
這種索引的性能與單純關鍵詞索引相同,可用計算機自動編製,檢索也較為方便,但查全率和查准率都較低。