知識檢索

知識檢索

知識檢索是一種全新的信息檢索方式,是在現有的信息檢索技術以及模型上發展而來的。

檢索方式


知識檢索和信息檢索的不同,就在於知識檢索強調了語義,不會和信息檢索一樣,只是基於字面的機械匹配,它從文章的語義、概念出發,能夠揭示文章的內在含義。做到了語義和概念層次上的標引工作,知識檢索就提高了查全率查准率,降低了用戶的負擔。
Internet 上的信息呈現指數極的增長趨勢,人們已經被如此浩瀚的信息所淹沒,面對著信息爆炸的困境,處於信息迷航與信息過載的環境之中。不難看出傳統的基於關鍵字的信息檢索技術已經不能滿足用戶的信息需求。高速發展的社會,信息過度的困境,使用戶急切地想尋找到一種能夠快速而又準確地檢索到所需信息的檢索技術。知識檢索應運而生。

存在問題


在此之前,談一下信息檢索的不足,或者說是存在的一些問題。
1、目前,人們主要使用搜索引擎來檢索信息,如baidu、Google。使用這種檢索方式,雖說能在短時間內反饋給用戶大量的信息,但是反饋回的信息中信息噪音過大,其中包含了太多的無用信息。要想獲得真正的信息,需要對海量的反饋信息逐一進行分析、識別、挑選。此外,搜索引擎反饋回的結果會包含一些“死鏈接”,無疑又增加了用戶的負擔,降低了檢索的效率。僅從字面上來判斷某個信息或某些信息是否符合用戶的檢索要求,又會漏掉一些也許是有很高實用價值的信息。採用自然語言的檢索機制,從不同的領域出發,結合不同的學習背景和隔熱的用戶偏好,極有可能出現“一詞多義”或“一義多詞”的現象。比如說,輸入“電腦”這個關鍵字,檢索結果都是包含了電腦這兩個字的信息,如電腦維修、電腦講座、電腦銷售等方面,而我真正需要的是電腦維修方面的知識,那麼我就要從這麼多的反饋結果里去挑選哪些是關於電腦維修方面的。另外,計算機、
computer也完全可以代替電腦這個詞,而我在選擇使用電腦這個詞時,無疑又漏掉了包含計算機、computer等關鍵字的信息,那麼我的查全率就得不到保證。由此看來,使用搜索引擎,並不能真正滿足用戶的信息需求。
2、除了搜索引擎,用戶還可以選擇Yahoo!、sina等採用目錄分類方式的站點。這類站點的實質是基於《中圖法》中的分類法,由一個大類引出一個小類,一級一級的將主題細化。用戶通過瀏覽分類目錄,在目錄體繫上下位類的從屬、並列等關係的導引下層層遞進,不斷深入,隨著目錄類範疇的縮小,查詢的專指度逐步提高,而使用戶最終發現、檢索到自己所需要的相關信息,滿足用戶的查詢需求。這種信息組織的方式可以使用戶模糊的信息需求逐步清晰,在一系列分析、調整中完成檢索。但是它的局限性在於DB的規模較小,某些主題下收錄的範圍不夠全面,檢索到的信息數量有限。
3、使用Dialog等商業資料庫來檢索信息。這類檢索工具包含的信息質量很高,檢索到的信息比較全面,但是需要付費使用,而且費用較高,所以使用的頻率不及前兩種檢索方式。
從上述三點可以看出,傳統的信息檢索缺點在於沒有從語義層次上對信息進行標引,不能夠滿足用戶在語義和知識上的需求。
知識檢索是將信息或知識按照一定的方式組織、存儲,並根據用戶的需求找出相關信息和知識的過程。在這個過程中,被檢索的對象是知識資源、知識庫。知識檢索就是採用一種從語義上標引文章的技術,形成知識庫,再從知識庫中查詢用戶所需的信息。