數據元素

數據元素

數據元素(data element)是計算機科學術語。它是數據的基本單位,數據元素也叫做結點或記錄。在計算機程序中通常作為一個整體進行考慮和處理。有時,一個數據元素可由若干個數據項組成,例如,一本書的書目信息為一個數據元素,而書目信息的每一項(如書名、作者名等)為一個數據項。數據項是數據的不可分割的最小單位。

基本理論


在數據元素理論研究中,下面的術語是很重要的,理解好這些術語是理解數據元素的基礎。
(1)數據元素(Data Element):是數據的基本單位,由數據項組成。在不同的條件下,數據元素又可稱為元素、結點、頂點、記錄等。數據元素是用一組屬性描述定義、標識、表示和允許值的一個數據單元。
(2)數據元值/元數據(Data Element Value):數據元能許值集合中的一個值。
(3)數據項:數據項是具有獨立含義的最小標識單位,是數據元的一個具體值,是數據記錄中最基本的、不可分的有名數據單位。
(4)同義名稱: 與給定名稱有區別但表示相同的數據元概念。
(5)限定詞:幫助定度和呈遞唯一性概念的術語。
(6)域:一種屬性的可能數據值的集合。
(7)域名:將數據元的值域及度量單位利用一個統一的名稱來表示。
(8)對象類:對象集,現實世界中的想法、抽象概念或事物集合,有清楚邊界和含義,並且特性和其行為遵循同樣的規則面能夠加以標識。
(9)對象:可以想象或感覺的世界的任一部分。
(10)特性:對象類的所有個體所共有的某種性質。
(11)表示:值域、數據類型的組合,必要時也包括度量單位或字符集
(12)對象類詞:數據元名稱的成分,用於表示其所屬的對象類。
(13)特性類詞:數據元名稱的一個成分,用於表述對象類的特性,(數據元名稱的一個成分,表述數據元所屬類別)。
(14)表示類詞:數據元名稱的成分,用於描述數據元的表示形式。
(15)數據模型:以反信息結構的某種方式對數據組織的某種描述。

組成


數據元由對象類、特性和表示三部分組成,其中對象類用於收集和存儲數據的事物,例如,人、井、岩芯、管線、儲罐都是對象類等;特性是用來區別和描述對象的,例如,顏色、性別、年齡、收入、地址、價格等均為特性;數據的表示部分中最為重要的方面是值域,值域是數據元允許(或有效)值的集合。對於值域,數據元中存在兩種類型的值域,一種是所謂取值是固定的,即取值是可枚舉的,例如,人眼睛顏色這個數據元,其取值可能包括:Brown、Gray、Green、Hazel、Blue,另一種是概括的,即數據元取值是有定義域約束的,其取值可能是有限的,但是無法列出全部值,例如人的年齡,其取值範圍可能是1-200,並且每位要求是十進位表示。

屬性


數據元素本身也是一個事物,既然是事物那麼就需要屬性來描述這一事物,通常我們也將描述屬性稱為描述數據元素的元數據。

信息代碼化


信息標準化實質是信息代碼化的過程,須知,信息分類與編碼在整個企業信息標準化中佔有基礎的不可替代的地位。因此如何對企業的各種信息進行有效的分類,並對其進行編碼這是信息化過程中一個非常重要的過程。其實數據元素與信息分類及編碼有著密不可分的關係。

應用領域


數據元素理論屬於信息標準化的基礎理論,即是數據規範化理論基礎。數據元分析在信息分類、數據的集成參考模型、數據模型優化設計、數據元字典以及制訂數據交換標準等方面得到應用。

參考文獻


袁滿,高雪等。中國石油數據元設計指南(企業標準)[M].北京:石油工業出版社,2005