粒計算

看待客觀世界的世界觀和方法論

人類在處理大量複雜信息時.由於人類認知能力有限,往往會把大量複雜信息按其各自特徵和性能將其劃分為若干較為簡單的塊.每個被分出來的塊就被看成是一個粒。實際上,粒就是指一些個體通過不分明關係、相似關係、鄰近關係或功能關係等所形成的塊。這種處理信息的過程.稱信息粒化。如商場的貨物多種多樣,如果不按某種方式擺放就很難進行有效管理.於是人們按貨架所擺放貨物的種類、體積、等級等將商場劃分為若干塊並以此安排貨架,其每一塊將擺放同一種類或體積相似或同一等級的貨物。這裡所說的塊就是粒的概念,劃分粒的過程稱為信息粒

基本概念


粒計算是一個剛剛提出的研究領域, 至今還沒有明確的定義與研究範圍, 不同的研究者對這個領域的理解也不完全相同。大體可分為2大類: 一類側重於不確定性處理; 另一類則注重於多粒度計算。
從粒計算的角度看計算的對象, 可能形成不同的計算模型。如果我們從多粒度計算的角度去看,這個計算模型大體由以下幾個部分組成。基本粒子, 構成粒計算模型的最基本元素, 是計算模型的原語。一個粒子可以看作是由內部屬性描述的個體元素的集合, 以及由它的外部屬性所描述的整體。
粒層, 是對問題空間或計算對象的一種抽象化描述, 按照某個實際需求的粒化準則得到的所有粒子的全體構成一個粒層。同一層的粒子內部往往具有相同的某種性質或功能。由於粒化的程度不同,導致同一問題空間會產生不同的粒層, 各個粒層的粒子具有不同的粒度, 即粒的不同大小。粒計算模型的主要目標是能夠在不同粒層上進行問題求解,且不同粒層上的解能夠相互轉化。
粒結構, 一個粒化準則對應一個粒層, 不同的粒化準則對應多個粒層, 粒層之間的相互聯繫構成一個關係結構, 稱為粒結構。在一般的粒計算理論中, 把同一粒層的粒子看成一個集合, 通常並不考慮粒子之間的結構關係, 而在我們的商空間理論中, 粒層中的粒子間具有結構關係, 因此我們所談的粒結構, 通常既指粒層間的結構關係, 同時又指粒層中的結構。

原理作用


粒計算是一種看待客觀世界的世界觀和方法論.信息粒廣泛存在於我們的現實生活中.是對現實的一種抽象,信息粒化是人類處理和存儲信息的一種反映。粒計算對人類的問題求解非常重要.它通過把複雜問題抽象、劃分從而轉化為若干較為簡單的問題.有助於我們更好的分析和解決問題。
自Zadeh 1979年發表論文“Fuzzy sets and information granularity”以來,研究人員對信息粒度化的思想產生了濃厚的興趣.Zadeh認為很多領域都存在信息粒的概念,只是在不同領域中的表現形式不同.自動機系統論中的“分解與劃分”、最優控制中的“不確定性”、區間分析里的“區間數運算”、以及DS證據理論中的“證據”都與信息粒密切相關.Hobss在1985年直接用“粒度(granularity)”作為論文題目發表論文,討論了粒的分解和合併,以及如何得到不同大小的粒,並提出了產生不同大小粒的模型.I in在1988年提出鄰域系統並研究了鄰域系統與關係資料庫之間的關係.1996年,他在UC-Berkeley大學訪問時,向Zadeh提出作“granular computing”的研究,Zadeh稱之為“granularmathematics”,I in改稱為“granular computing”,並縮寫成GrC.他發表了一系列關於粒計算與鄰域系統的論文,主要是研究二元關係(鄰域系統、Rough集和信任函數)下的粒計算模型,論述基於鄰域系統的粒計算在粒結構、粒表示和粒應用等方面的問題,討論了粒計算中的模糊集和粗糙集法,並將粒計算方法引入數據挖掘和機器發現.依據人們在解決問題時能從不同的粒度世界去分析和觀察同一問題,並且很容易地從一個粒度世界轉到另一個粒度世界,張鈸和張鈴在1990年針對複雜問題求解,建立了一種複雜問題求解的商結構形式化體系,給出了一套解決信息融合、啟髮式搜索、路徑規劃和推理等問題的理論和演演算法.1997年,Zadeh進一步指出,世上有3個基本概念構成人類認知的基礎:粒化、組織及因果關係.其中,粒化是整體分解為部分,組織是部分結合為整體,而因果關係則涉及原因與結果問的聯繫.物體的粒化產生一系列的粒子,每個粒子即為一簇點(物體),這些點難以區別,或相似、或接近、或以某種功能結合在一起.一般來說,粒化在本質上是分層次的,時間可粒化為年、月、日、小時、分、秒就是大家熟悉的例子.

基本問題


根據粒計算的上述模型與概念, 可以看到, 粒計算中存在2個基本問題: 粒化和基於粒化的計算。即如何構造這個模型, 以及根據這個模型的計算。粒化, 是問題空間的一個劃分過程, 它可以簡單理解為在給定粒化準則下(如等價關係)得到一個粒層的過程, 是粒計算的基礎, 通過粒化我們可以得到問題空間的層次間與層次內部的結構。在同一或者不同的粒化準則下均可得到多個粒層, 形成多層次的網路結構。粒計算通過訪問粒結構求解問題, 包括在層次結構中自上而下、或者自下而上2個方向的交互, 以及在同一層次內部的移動。即不同粒層上粒子之間的轉換與推理, 以及同一粒層上粒子之間相互交互,形成所謂的多粒度計算。

模型與理論


粒計算模型大體分為2大類: 一類以處理不確定性為主要目標, 如以模糊處理為基礎的計算模型, 以粗糙集為基礎的模型; 另一類則以多粒度計算為目標, 如商空間理論。這2類模型的側重點有所不同, 前者在粒化過程中, 側重於計算對象的不確定性處理, Zadel認為..在人類推理與概念形成中, 其粒度幾乎都是模糊的, 因此他認為以模糊概念為基礎的詞計算, 是粒計算的主要組成部分。以Paw lak 為首的波蘭學者提出的粗糙集理論, 其基礎也是基於“思維的計算,即關於含糊、不清晰概念的近似推理”。而多粒度計算的思想則來源於H obbs的如下思想“人類問題求解的基本特徵之一, 就是具有從不同的粒度上觀察世界, 並很容易地從一個抽象層次轉換到其它層次的能力, 即分層次地處理它們”。因此多粒度計算的目的是為了降低處理複雜問題的複雜性。

面臨的挑戰


隨著計算機及網路的日益普及, 出現了以下趨勢: 數據的複雜性增加且更加多樣化, 如文本、圖像、語音、與視頻等; 海量數據; 人機交互更加頻繁與密切。這種發展趨勢給粒計算提出巨大的挑戰。這裡僅就粒化問題提出幾點想法。
計算對象的粒化
一個複雜的對象(系統)通常具有複雜的內部結構, 因此要將粒計算方法應用於這類對象, 首先遇到的問題是對象的粒化, 或者是結構分析(分解)。信息結構通常有以下幾種類型: 邏輯(語法)結構(如文本)、空間結構(如圖像)、時間結構(如語音)、與時空結構(如視頻)等。這些結構中, 有的是已知的固定結構, 如資料庫; 有的是未知的固定結構, 如文本; 有的則是未知的變化結構, 如圖像、網頁內部結構等。對於后2 種未知的結構, 無論是固定還是變化的, 在粒化的過程中均存在如何選擇信息結構中的基本元素, 如何劃分, 如何表示粒層之間與粒層內部的結構, 以及結構本身的不確定性等難題,這都是當前研究的熱點課題。已有的粒計算研究主要針對已知的固定結構, 如粗糙集研究中的決策表。
結構的表示
粒化之後, 另一個重要問題是如何表示這些結構。目前已有的進展是採用概率圖模型, 如條件隨機場、馬爾可夫隨機場等, 即利用概率來表示結構中的不確定性。為了分析概率圖模型, 在傳統機器學習的基礎上, 發展出一套具有結構數據的機器學習方法, 即結構預測法。因此對於有結構的對象,也可以採用傳統的機器學習方法加以處理。
面向大規模的實際問題
網路環境下, 粒計算必須面向大規模的問題, 這必然導致採用多粒度、多層次的分析與處理方法。因此需要在此框架下發展出一套高效的演演算法。

Yao的成果


在I in的研究基礎上,Yao結合鄰域系統對粒計算進行了詳細的研究,發表了一系列研究成果,並將它應用於知識挖掘等領域,建立了概念之間的ifthen規則與粒度集合之問的包含關係,提出利用由所有劃分構成的格求解一致分類問題,為數據挖掘提供了新的方法和視角.結合粗糙集理論,Yao探討了粒計算方法在機器學習、數據分析、數據挖掘、規則提取、智能數據處理和粒邏輯等方面的應用.
Yao給 了粒計算的3種觀點:
1)從哲學角度看,粒計算是一種結構化的思想方法;
2)從應用角度看,粒計算是一個通用的結構化問題求解方法;
3)從計算角度看,粒計算是一個信息處理的典型方法.

研究情況


隨著粒計算研究的發展,近年來國內外又有很多學者加入到了粒計算研究的領域.為了探討粗糙集理論在各種環境下的應用,Skowron以包含度概念來研究粒近似空間上的Rough下近似和Rough上近似.劉清在Rough邏輯的基礎上,提出了粒一邏輯的概念( 邏輯),構造了這種邏輯的近似推理系統,並應用於醫療診斷.近幾年來,在掀起粒計算研究的熱潮中,商空間理論被人們廣泛認識和推廣,2003年張鈴和張鈸將模糊概念與商空間理論結合,提出模糊商空間理論,為粒計算提供了新的數學模型和工具,並成功應用於數據挖掘等領域。2002年苗奪謙等人 對知識的粒計算進行探討,引入屬性的重要度,並在求最小屬性約簡方面得到應用.王飛躍等人 ]對詞計算和語言動力學進行了探討,以詞計算為基礎,對問題進行動態描述、分析和綜合,提出了設計、控制和評估的語言動力學系統.王國胤等人 4]提出了基於容差關係的粒計算模型,利用屬性值上的容差關係給出了不完備信息系統的粒表示、粒運算規則和粒分解演演算法,同時結合粗糙集中的屬性約簡問題,提 了不完備信息系統在粒表示下屬性必要性的判定條件,對粒計算方法在規則提取方面進行了探索.鄭征等人提出了相容粒度空間模型,並在圖像紋理識別和數據挖掘中取得了成功,他們認為,人類具有根據具體的任務特性把相關數據和知識泛化或者特化成不同程度、不同大小的粒的能力,以及進一步根據這些粒和粒之間的關係進行問題求解的能力.卜東波等人從信息粒度的角度剖析聚類和分類技術,試圖使用信息粒度原理的框架來統一聚類和分類,指出從信息粒度的觀點來看,聚類是在一個統一的粒度下進行計算,而分類卻是在不同的粒度下進行計算,並根據粒度原理設計了一種新的分類演演算法,大規模中文文本分類的應用實踐表明,這種分類演演算法有較強的泛化能力.Zhang等人對粒神經網路進行了探討,並在高效知識發現中得到很好的應用.李道國等人研究了基於粒向量空間的人工神經網路模型,在一定程度上提高了人工神經網路的時效性、知識表達的可理解性.杜偉林等人根據概念格與粒度劃分在概念聚類的過程中都是基於不同層次的概念結構來進行分類表示,而且粒度劃分本身構成一個格結構的特點,研究了概念格與粒度劃分格在概念描述與概念層次轉換之間的聯繫,通過對概念的分層遞階來進行概念的泛化與例化,使概念在遞階方面忽略不必要的冗餘信息.Yager 探討了基於粒計算的學習方法和應用.I in在2006年粒計算國際會議上提出了新的研究思路“infrastructures for AIengineering”.同時,Bargiela和Witold Pedrycz也從各個側面對粒計算的根源和實質進行了詳細的探討和總結.Yager指出,發展信息粒的操作方法是當前粒計算研究的一個重要任務.

無處不在


粒計算是一種看待客觀世界的世界觀和方法論。信息粒廣泛存在於現實世界中,是對現實的抽象。信息粒化旨在建立基於外部世界的有效的並以用戶為中心的概念,同時簡化我們對物理世界和虛擬世界的認識。

資料參考


論文:《粒計算及其應用研究》
論文導師 王周敬,論文學位 碩士,論文專業 系統工程
論文單位 廈門大學,點擊次數 40,論文頁數 75頁
《粒計算:過去、現在與展望》
基本信息
作者:苗奪謙 王國胤 劉清 林早陽 姚一豫 出版社:科學出版社 ISBN:9787030195708 上架時間:2007-8-23 出版日期:2007 年8月 開本:16開 頁碼:373 版次:1-1 所屬分類:數學 > 計算數學 > 計算方法教材 > 教材彙編分冊 > 高等理工 本版教材征訂號:0044094501-2 適用專業:計算機、計算機科學理論適用分級:博士、碩士
內容簡介
粒計算是近十年來計算機科學中一個非常活躍的研究領域。本書由該領域知名的國內外華人學者撰寫,分別對粒計算基礎理論、模型及典型應用等進行了深入的討論。內容涉及粒計算思想與方法、商空間、相容粒度空間、覆蓋、粒邏輯、粒計算的數學模型及研究方向、粗糙集及其擴展、不完備信息系統、概念格、粒計算在數據挖掘和控制中的應用等方面。
本書通過豐富的文獻資料和研前言究成果,對粒計算的過去做了回顧,對現狀做出了剖析,對未來進行了展望,充分反映出各章作者對所論述問題獨到的見解。本書對粒計算的理論與應用研究具有重要的參考價值。
本書可供計算機、自動化、電子工程專業的高年級本科生、研究生、教師、研究人員與工程技術人員參考。
《商空間與粒計算》
基本信息:張燕平等編著 出版社:科學出版社。主要介紹了運用商空間方法結構化問題從而進行粒計算的過程。