知識本體

知識本體

本體知識系統

20世紀70年代後期,專家系統、知識系統和知識密集型的信息系統的構建技術發展而形成知識工程,所建立的系統簡稱為知識系統(knowledge-based systems)。知識系統是人工智慧學科最重要的工業化和商業化產物。知識系統用於輔助人們進行問題求解,如檢測信用卡詐騙、加速船舶設計、輔助醫療診斷、使科學軟體更加智能化、向全體決策人員提供金融服務、產品質量的評價和廣告宣傳、支持電子網路的服務恢復。

意義


本體在Web上的應用導致了語義Web的誕生,其目的是解決Web上信息共享時的語義問題[8]。1999年,Web的創始人伯納斯-李(Tim Berners-Lee)首次提出了“語義Web”(Semantic Web)的概念。2001年2月,W3C正式成立“Semantic Web Activity”來指導和推動語義Web的研究和發展,語義Web的地位得以正式確立。
語義Web提供了一個通用的框架,允許跨越不同應用程序、企業和團體的邊界共享和重用數據。語義Web是W3C領導下的協作項目,有大量研究人員和業界夥伴參與。語義Web以資源描述框架(RDF)為基礎。RDF以XML作為語法、URI作為命名機制,將各種不同的應用集成在一起,對Web上的數據所進行的一種抽象表示。語義Web所指的“語義”是“機器可處理的”語義,而不是自然語言語義和人的推理等目前計算機所不能夠處理的信息。
知識管理是一種對知識的組織和再組織,以及對人的顯性和隱性知識進行管理,通過對知識的獲取、組織、分發、應用,實現知識共享和知識創新,提高組織的創新能力、反應能力、生產率以及技術技能,增加核心競爭力。在今天激烈競爭的環境中,知識管理有助於企業整合自身知識,實現知識流程化、企業化;使企業能夠快速有效地對外界進行響應,提高單位時間內創造的價值;擴大知識利用的程度與範圍,增強創新能力和商務智能;打破原有管理等級邊界,拓展組織發展的空間。
本體是語義Web的基礎,本體可以有效地進行知識表達,知識查詢,或不同領域知識的語義消解。本體還可以支持更豐富的服務發現、匹配和組合,提高自動化程度。本體知識管理(ontology-based knowledge management)可實現語義級知識服務,提高知識利用的深度。本體知識管理還可以支持對隱性知識進行推理,方便異構知識服務之間實現互操作,方便融入領域專家知識及經驗知識結構化等。
本體知識管理一般要求滿足以下基本功能:①支持本體多種表示語言和存儲形式,具有本體導航功能;②支持本體的基本操作如本體學習、本體映射、本體合併等;③提供本體版本管理功能,支持本體的可擴展性和一致性。
知識本體是領域概念及概念之間關係的規範化描述,這種描述是規範的、明確的、形式化的,可共享的。“明確”意味著所採用概念的類型和它們應用的約束實行明確的定義。“形式化”指知識本體是計算機可讀的(即能被計算機處理);“共享”反映知識本體應捕捉該領域中一致公認的知識,反映的是相關領域中公認的概念集,即知識本體針對的是團體而非個體的共識。知識本體的目標是捕獲相關領域的知識,提供對該領域知識的共同理解,確定該領域內共同認可的辭彙,並從不同層次的形式化模式上給出這些辭彙和辭彙間相互關係的明確定義。

歷史


1991年,美國計算機專家尼徹斯(R. Niches)等在完成美國國防部高級研究計劃局(Defense Advanced Research Projects Agency, 簡稱DARPA)關於知識共享的科研項目中,提出了一種構建智能系統的新思想,他們認為,構建的智能系統由兩個部分組成,一個部分是“知識本體”(ontologies),另一部分是“問題求解方法”(Problem Solving Methods,簡稱PSMs)。前者涉及特定領域共有的知識結構,是靜態的知識;後者(PSMs)涉及在相應領域的推理知識,是動態的知識,PSMs使用ontologies中的靜態的知識進行動態推理,就可構建一個智能系統。這樣的智能系統是一個知識庫,而ontologies是知識庫的核心,於是,“知識本體(ontologies或ontology)”在計算機科學中就引起了學者們的極大關注。
在20世紀末和21世紀初,“知識本體”的研究開始成為計算機科學的一個重要領域。它借鑒哲學中“本體論(Ontology)”的研究成果,主要的任務是研究世界上的各種事物(物,對象)以及代表這些事物的範疇(意,概念)的形式(文,符號)特性(義,關係),並對其進行分類,建立規範。計算機科學對於“知識本體”的研究就是建立在上述的哲學本體論研究基礎上的並有了很大發展。在計算機科學中“知識本體”不再是一種理論而是事物及其範疇的形式分類系統,是掌控概念體系的規範。
為表示區別,哲學的“本體論(Ontology)”與計算機科學的“知識本體(ontologies或ontology)”可分別採用不同的書寫形式或表達習慣。前者注重理論探討,後者強調實踐操作。
為此,計算機科學專家重新給“知識本體(ontologies或ontology)”下了科學定義。
1993年,格魯伯(Gruber)的定義:“知識本體(ontology)是概念體系的明確規範”(An ontology is an explicit specification of conceptualization)。
1997年,波爾斯特(Borst)對格魯伯的定義做了修改:“知識本體(ontologies)是可以共享的概念體系的形式規範”(The ontologies are defined as a form of specification of a shared conceptualization)。
1998年,施圖德(Studer)等在格魯伯和波爾斯特的定義的基礎上給出了更加明確的解釋:“知識本體(ontology)是對概念體系的明確的、形式化的、可共享的規範”(An ontology is a formal explicit specification of a shared conceptualization)。
定義中,“概念體系”指描述現象的有關概念的抽象模型;“明確”指對所使用的概念的類型以及概念用法的約束須明確地加以定義;“形式化”指這個知識本體(ontology)應該是機器可讀的(machine-readable)或機器可循的(machine traceable);“共享”指知識本體(ontology)中所描述的知識結構不是個人專用而是群體共享。
在計算機科學中有不同類型的知識本體。
通用知識本體(common ontology)是從概念的根結點出發,很抽象的,例如,馮志偉在機器翻譯研究中研製的 ONTOL-MT這個通用知識本體的初始概念有事物(entity)、時間(time)、空間(space)、數量(quantity)、行為狀態(action-state)和屬性(attribute)供6個可管轄不同層次的下位概念。ONTOL-MT在受限條件下做歧義結構的自動消歧效果良好。
領域知識本體(domain ontology)是對領域知識的抽象,概念明確,容易形式化和共享。例如,生物學領域知識本體(domain-specific ontology of botany)、考古學領域知識本體(domain-specific ontology of archeology)。
語言知識本體(language ontology)是一個詞表,它描述了單詞和術語之間的概念關係。例如,詞網(WordNet)。概念結點是專業術語就叫做術語知識本體(terminology ontology)。
形式知識本體(formal ontology)對概念和術語的分類很嚴格,要按一定的原則和標準,明確地定義概念之間的顯性和隱性關係,明確概念的約束和邏輯聯繫。領域知識本體或術語知識本體經過進一步的抽象和提煉,就可發展成形式知識本體。
前三種知識本體可被自然人共享,而形式知識本體則主要是為計算機所共享的。
知識本體幫助人們對於領域知識進行系統的分析,把領域知識形式化,使之便於計算機處理。知識本體還可以實現人和人之間以及人和計算機之間的知識共享,在一定領域中實現知識重用。

參考文獻


1鄒曉輝《融智學原創文集》[C],《前沿科學》期刊[J]連載2005
2鄒曉輝“信息學基礎研究”[A],馬藹乃、姜璐、苗東升、閆學杉編《信息科學交叉研究》[C]浙江教育出版社2007
3張志偉《西方哲學十五講》[M]北京大學出版社 2004,86-87
4北京大學哲學系外國哲學史教研室編譯《西方哲學原著選讀》上卷[C]商務印書社1981,153-154
5趙敦華《西方哲學簡史》[M]北京大學出版社2001,311
6北京大學哲學系外國哲學史教研室編譯《西方哲學原著選讀》下卷[C]商務印書社1981, 287-291
7鄒曉輝“重構‘概念分類體系’的新思路與新方法”[A],CLSW-6[C], Singapore,2006
8鄒曉輝“探索漢語理論建設及中文信息處理的新路”[A]《中國科技論文在線》[J]2007,7
9馮志偉“關於術語ontology的中文譯名:‘本體論’與‘知識本體’”[A],《前沿科學》期刊[J]2006,9