數據孤島

數據術語之一

數據孤島在企業信息化中,還有很多類似的描述,如"數據的污染"等比較形象的說法,專業人士把數據孤島分為物理性和邏輯性兩種。物理性的數據孤島指的是,數據在不同部門相互獨立存儲,獨立維護,彼此間相互孤立,形成了物理上的孤島。

簡介


“企業發展到一定階段,出現多個事業部,每個事業部都有各自數據,事業部之間的數據往往都各自存儲,各自定義。每個事業部的數據就像一個個孤島一樣無法(或者極其困難)和企業內部的其他數據進行連接互動。”我們把這樣的情況稱為數據孤島。簡單說就是數據間缺乏關聯性,資料庫彼此無法兼容。

原因


在企業信息化中,還有很多類似的描述,如"數據的污染"等比較形象的說法。在我看來,之所以產生信息孤島這樣的情況,有這麼幾個原因:
1、最重要還是因為企業的工作以是部門為主的功能型,這樣的話每個部門都會有業務數據的產生,有對數據保存和使用的需要,不同部門對數據的定義和使用可能存在比較大的差異,所以各部門之間的數據不能互通。
2、信息部門建設的相對滯后,如果信息部門不能儘快滿足業務對數據處理的要求,那業務部門就可能獨自開發業務系統,這種情況現在還是普遍存在。
3、缺少企業內信息化建設的戰略和標準,如果不能做到信息系統建設的統一,由不同部門,不同公司來建設的話,必須有一個標準能夠使得日後的互通比較容易實現。
一般來說,企業信息化發展有三個階段:基於設備的建設,基於項目的建設和基於戰略的建設。在第二階段必然會產生信息孤島,從現在來看,把這些孤島連接起來從技術上還是可以實現的,但關鍵的難題就在於不同部門針對於相同數據的值可以不同,這也就是我們說得污染,我們很難有自動的方法可以區分出來哪些是“正確”的數據,這是導致解決這些信息孤島失敗的主要原因。

方案


所以,我們一般都會用漸進的方法來在企業里解決類似的問題,以時間的先後為順序,有以下的步驟
1、編製IT建設的標準,仍然允許部門自行開發軟體業務系統;
2、給ITC明確的定位,使其有成長和發展的空間,編製IT發現的戰略,我們需要明確哪些軟體項目是暫時性的,那些是長期地,並把它作為項目立項的依據之一;
3、在合適的時機,對企業的主要業務流程進行整合,根據這樣的流程,結合戰略,把不同的業務系統串接起來;
4、與3同時,我們需要在IT的建設、維護責任與,與業務部門有明確的責任界定;
5、這是一項長期的工作。

發展


網路可擴展性是數據孤島的解決辦法,孤島症是指虛擬化應用被分成計算、存儲和網路資源。雖然超融合是擺脫孤島的一個辦法,但超融合基礎設施仍可能存在孤島問題--儘管這些孤島更有效。橫向擴展架構(例如Nutanix創建的架構)可以幫助減少超融合孤島。對於超融合基礎設施中的孤島,主要問題是計算和網路資源有很多數據空間,但存儲被耗盡。通過將計算、網路和存儲資源放到相同的橫向擴展節點設計中,可以實現網路可擴展性,這最終讓IT規劃者可以跨所有可用虛擬化工作負載部署資源。