同義詞詞林

同義詞詞林

《同義詞詞林》是梅家駒等人於1983年編纂而成,初衷是希望提供較多的同義詞語,對創作和翻譯工作有所幫助。但在我們發現,這本詞典中不僅包括了一個詞語的同義詞,也包含了一定數量的同類詞,即廣義的相關詞,可以參考表1.1中的詞條示例。

擴展版


由於《同義詞詞林》著作時間較為久遠,且之後沒有更新,所以原書中的某些詞語成為生僻詞,而很多新詞又沒有加入。有鑒於此,哈爾濱工業大學信息檢索實驗室利用眾多詞語相關資源,並投入大量的人力和物力,完成了一部具有漢語大詞表的《哈工大信息檢索研究室同義詞詞林擴展版》。擴展版剔除了原版中的14,706個罕用詞和非常用詞,最終的詞表包含77,343條詞語。表1.2列出了擴展前後的《同義詞詞林》的主要特徵。擴展后的《同義詞詞林》,含有比較豐富的語義信息。但是目前由於種種原因,《同義詞詞林》完整版並沒有共享,而只是共享了其中的詞典文件。期待著哈工大信息檢索實驗室能夠在不久的將來能夠將完整版進行共享,以滿足研究和實際應用的需要。

目前情況


目前,在最新的改進版 中,《哈工大信息檢索研究室同義詞詞林擴展版》中加入了較高層次的集合,譬如說,Ab000002 男女老少。其中編碼的長度與哈工大擴展版相同,為8位。Ab000002之中,Ab仍然表示的是大類和中類名,00000表示該集合是一個中類的標題,而2表示的該類的深度為2。同時,參考WordNet的保存格式,創建了新的索引文件和數據文件。