數據模型

數據特徵的抽象

數據模型(Data Model)是數據特徵的抽象。數據(Data)是描述事物的符號記錄,模型(Model)是現實世界的抽象。數據模型從抽象層次上描述了系統的靜態特徵、動態行為和約束條件,為資料庫系統的信息表示與操作提供了一個抽象的框架。數據模型所描述的內容有三部分:數據結構、數據操作和數據約束。

2011年,中國建立礦產資源潛力評價數據模型系列。

簡介


模型可更形象、直觀地揭示事物的本質特徵,使人們對事物有一個更加全面、深入的認識,從而可以幫助人們更好地解決問題。利用模型對事物進行描述是人們在認識和改造世界過程中廣泛採用的一種方法。計算機不能直接處理現實世界中的客觀事物,而資料庫系統正是使用計算機技術對客觀事物進行管理,因此就需要對客觀事物進行抽象、模擬,以建立適合於資料庫系統進行管理的數據模型。數據模型是對現實世界數據特徵的模擬和抽象。
數據模型是資料庫設計中用來對現實世界進行抽象的工具,是資料庫中用於提供信息表示和操作手段的形式構架。數據模型是資料庫系統的核心和基礎。

組成部分


數據模型所描述的內容包括三個部分:數據結構、數據操作、數據約束。
1)數據結構:主要描述數據的類型、內容、性質以及數據間的聯繫等,是目標類型的集合。目標類型是資料庫的組成成分,一般可分為兩類:數據類型、數據類型之間的聯繫。數據類型如DBTG(資料庫任務組)網狀模型中的記錄型、數據項,關係模型中的關係、域等。聯繫部分有DBTG網狀模型中的系型等。數據結構是數據模型的基礎,數據操作和約束都基本建立在數據結構上。不同的數據結構具有不同的操作和約束。
2)數據操作:數據模型中數據操作主要描述在相應的數據結構上的操作類型和操作方式。它是操作算符的集合,包括若干操作和推理規則,用以對目標類型的有效實例所組成的資料庫進行操作。
3)數據約束:數據模型中的數據約束主要描述數據結構內數據間的語法、詞義聯繫、他們之間的制約和依存關係,以及數據動態變化的規則,以保證數據的正確、有效和相容。它是完整性規則的集合,用以限定符合數據模型的資料庫狀態,以及狀態的變化。約束條件可以按不同的原則劃分為數據值的約束和數據間聯繫的約束;靜態約束和動態約束;實體約束和實體間的參照約束等。

發展


數據模型是數據特徵的抽象,是研究、應用與學習資料庫技術的基礎內容與基本手段,是資料庫技術的核心,是最能表現出資料庫技術特色的內容之一。隨著資料庫技術自身的發展,數據模型也經歷相應的發展演變過程,傳統的數據模型在不斷完善,新的數據模型不停湧現。
傳統的層次、網狀與關係模型已發展了多年,取得了很好的理論研究成果與資料庫產品,特別是關係模型,幾乎是近年來整個數據模型領域的重要支撐,是現代管理信息系統數據存儲處理的關鍵所在。隨著資料庫應用領域的進一步拓展與深入,傳統的數據模型已逐漸不能滿足實際工作對數據處理的需要。而對象數據、空間數據、圖像與圖形數據、聲音數據、關聯文本數據及海量倉庫數據等出現,傳統資料庫在建模、語義處理、靈活度等方面都無法適應。為滿足發展需要,數據模型向多樣化發展,主要表現在以下幾方面。
1、傳統關係模型的擴充
關係模型實際上還是管理信息系統最重要的支撐模型,在此基礎之上,引入新的手段,使之能表達更加複雜的數據關係,擴大其實用性,提高建模能力。從總體上看,擴充一般在兩個方面進行。一是實現關係模型嵌套,這種方式可以實現“表中表”這類較為複雜的數據模型;二是語義擴充,如支持關係繼承及關係函數等。
2、面向對象數據模型
OO(面向對象)思維方式已貫穿於程序設計語言領域。在數據模型領域,面向對象數據模型也在快速地引入並持續發展。傳統的關係模型等在存儲數據時,並不能客觀地反映數據所代表的現實事物內在聯繫與邏輯關係,也較難與面向對象程序開發語言在設計上無縫結合。面向對象數據模型則是用面向對象的思維方式與方法來描述客觀實體,在繼承關係資料庫系統的已有的優勢特性基礎之上,支持面向對象建模,支持對象存取與持久化,支持代碼級面向對象數據操作,是現在較為流行的新型數據模型。
3、XML數據模型
XML的中文意思是可擴展標記語言,是標準通用標記語言的子集,是一種自描述的標記語言系統。它提供統一的方法來描述和交換獨立於應用程序或用戶的數據,適合於跨平台與跨語言的數據交換。XML採用樹形結構模式,因此XML的數據模型同時具有層次模型與關係模型的一些特徵。XML現在已成為網際網路數據交換的事實標準W3C已發布了多個有關XML的模型參考標準,幾乎所有的資料庫系統都已支持對XML的存儲與處理。XML應用領域廣泛,已從數據交換領域發展到了數據存儲與業務描述領域。在醫療信息化方面,電子病歷與電子健康檔案交換與共享標準都是採用XML 。
4、發展出新的數據模型
新的數據模型在數據構造器與數據處理原理上都有了新的突破。比較典型的有函數數據模型(FDM)、語義數據模型(SDM)等。但由於這些新的數據模型較為複雜,所需要的解決技術還在發展之中,所以在應用領域中還處於理論研究階段,但其思路與方向,則是代表資料庫在數據模型方面的發展方向。

層次類型


數據模型按不同的應用層次分成三種類型:分別是概念數據模型、邏輯數據模型、物理數據模型

概念模型

概念模型(Conceptual Data Model),是一種面向用戶、面向客觀世界的模型,主要用來描述世界的概念化結構,它是資料庫的設計人員在設計的初始階段,擺脫計算機系統及DBMS的具體技術問題,集中精力分析數據以及數據之間的聯繫等,與具體的數據管理系統(Database Management System,簡稱DBMS)無關。概念數據模型必須換成邏輯數據模型,才能在DBMS中實現。
概念模型用於信息世界的建模,一方面應該具有較強的語義表達能力,能夠方便直接表達應用中的各種語義知識,另一方面它還應該簡單、清晰、易於用戶理解。
在概念數據模型中最常用的是E-R模型、擴充的E-R模型、面向對象模型及謂詞模型。目前較為有名的是E-R模型。

邏輯模型

邏輯模型(Logical Data Model),是一種面向資料庫系統的模型,是具體的DBMS所支持的數據模型,如網狀數據模型(Network Data Model)、層次數據模型(Hierarchical Data Model)等等。此模型既要面向用戶,又要面向系統,主要用於資料庫管理系統(DBMS)的實現。

物理模型

物理模型(Physical Data Model),是一種面向計算機物理表示的模型,描述了數據在儲存介質上的組織結構,它不但與具體的DBMS有關,而且還與操作系統和硬體有關。每一種邏輯數據模型在實現時都有其對應的物理數據模型。DBMS為了保證其獨立性與可移植性,大部分物理數據模型的實現工作由系統自動完成,而設計者只設計索引、聚集等特殊結構。

重要模型


數據發展過程中產生過三種基本的數據模型,它們是層次模型、網狀模型和關係模型。這三種模型是按其數據結構而命名的。前兩種採用格式化的結構。在這類結構中實體用記錄型表示,而記錄型抽象為圖的頂點。記錄型之間的聯繫抽象為頂點間的連接弧。整個數據結構與圖相對應。其中層次模型的基本結構是樹形結構;網狀模型的基本結構是一個不加任何限制條件的無向圖。關係模型為非格式化的結構,用單一的二維表的結構表示實體及實體之間的聯繫。其中應用最廣泛的是關係模型,在邏輯數據類型中最常用的是層次模型、網狀模型、關係模型。

層次模型

它將數據組織成一對多關係的結構,層次結構採用關鍵字來訪問其中每一層次的每一部分。優點是存取方便且速度快;結構清晰,容易理解;數據修改和資料庫擴展容易實現;檢索關鍵屬性十分方便。缺點是結構呆板,缺乏靈活性;同一屬性數據要存儲多次,數據冗餘大(如公共邊);不適合於拓撲空間數據的組織。

網狀模型

它用連接指令或指針來確定數據間的顯式連接關係,是具有多對多類型的數據組織方式。優點是能明確而方便地表示數據間的複雜關係;數據冗餘小。缺點在於網狀結構的複雜,增加了用戶查詢和定位的困難;需要存儲數據間聯繫的指針,使得數據量增大;數據的修改不方便(指針必須修改)。

關係模型

它以記錄組或數據表的形式組織數據,以便於利用各種地理實體與屬性之間的關係進行存儲和變換,不分層也無指針,是建立空間數據和屬性數據之間關係的一種非常有效的數據組織方法。優點在於結構特別靈活,概念單一,滿足所有布爾邏輯運算和數學運算規則形成的查詢要求;能搜索、組合和比較不同類型的數據;增加和刪除數據非常方便;具有更高的數據獨立性、更好的安全保密性。缺點是資料庫大時,查找滿足特定關係的數據費時;對空間關係無法滿足。
(1)關係的數據結構:關係模型採用二維表來表示。二維表由表框架和表的元組組成。表框架由多個命名的表屬性組成。每個屬性有一個取值範圍稱為值域。二維表中的每一行數據成稱為元組
(2)關係操縱:關係模型的數據操縱是建立在關係上的數據操縱,一般有數據查詢(基本單位是元組分量)、數據刪除(基本單位是元組)、數據插入(基本單位是元組)和數據修改(基本單位是元組分量)四種操作。
(3)關係中的數據約束:關係模型中提供實體完整性約束、參照完整性約束和用戶完整性約束三種數據約束。

應用示例


2011年,中國建立礦產資源潛力評價數據模型系列。礦產資源潛力評價數據模型涵蓋成礦地質背景、成礦規律、物(重、磁)化遙及自然重砂綜合信息、成礦預測及煤炭鈾礦、化工礦產潛力評價,以及以上專業的專業術語、專業譜系、代碼體系、特徵分類及屬性描述、圖件分層及定義、編圖表示、空間參數及比例尺元數據規定以及成果匯總與集成技術要求等。