比爾·恩門

比爾·恩門

比爾·恩門(Bill Inmon),被稱為數據倉庫之父,最早的數據倉庫概念提出者,在資料庫技術管理與資料庫設計方面,擁有逾35年的經驗。他是“企業信息工廠”的合作創始人與“政府信息工廠”的創始人。

人物經歷


比爾·恩門的思想與見識在所有重量級的計算機協會、許多產業會議、技術研討會上,都博得了無比的敬重。他寫過650多篇文章,大多發布在世界最知名的IT刊物里,DMReview雜誌每期都有恩門先生的專欄文章,他寫了46本書籍,最著名的要數“Building the Data Warehouse”(《建立數據倉庫》),這本數據倉庫精典讀物倍受讀者喜愛,一而再在而三地升級出版發行,到目前已經是第三版本,發行量達50多萬冊。也正是這本《建立數據倉庫》為恩門贏得“數據倉庫之父”的殊榮,國內機械工業出版社也分別將第2第3版本引進翻譯,恩門先生的著作也一直是亞馬遜電子商務網站的暢銷書,都深受廣大數據倉庫技術讀者喜歡。同時恩門又是最知名的數據倉庫諮詢顧問專家,他為許多名列《財富》1000排行榜的公司提供過數據倉庫設計和資料庫管理方面的諮詢服務。恩門這些年還創立過公司辦過網上教育,1995創建了現在的Ambeo公司。
其《建立數據倉庫》一書中定義了數據倉庫的概念,隨後又給出了更為精確的定義:數據倉庫是在企業管理和決策中面向主題的、集成的、與時間相關的、不可修改的數據集合。
與其他資料庫應用不同的是,數據倉庫更像一種過程,對分佈在企業內部各處的業務數據的整合、加工和分析的過程。而不是一種可以購買的產品。正是他當初對數據倉庫的這個定義,已成為了業界引用最多、說得最廣的名言,每一個啟蒙的數據倉庫學習者都是從這一句名言開始的。
Ralph Kimball和Bill Inmon一直是商業智能領域中的革新者,開發並測試了新的技術和體系結構。他們都撰寫了關於數據倉庫的多本書籍,這些書也經常被參考。Kimball 和 Inmon 都同意組織需要一個與遺留系統和聯機事務處理(OLTP)系統分開的數據倉庫,以捕獲組織的有關信息並且使之可用。他們也同意數據倉庫中的數據應該是凈化的、一致的,並且不受到其來源的遺留系統和 OLTP 系統設計的牽制。
他們還同意用針對整個體系結構的思想重複構建數據倉庫。到這裡,他們的意見就發生了分歧。Bill Inmon將數據倉庫定義為“一個面向主題的、集成的、隨時間變化的、非易變的用於支持管理的決策過程的數據集合”(Building the data warehouse,第 2 版,第 33 頁)。Inmon通過“面向主題”表示應該圍繞主題來組織數據倉庫中的數據,例如客戶、供應商、產品等等。
每個主題區域僅僅包含該主題相關的信息。數據倉庫應該一次增加一個主題,並且當需要容易地訪問多個主題時,應該創建以數據倉庫為來源的數據集市。換言之,某個特定數據集市中的所有數據都應該來自於面向主題的數據存儲。Inmon 的方法包含了更多上述工作而減少了對於信息的初始訪問。但他認為這個集中式的體系結構持續下去將提供更強的一致性和靈活性,並且從長遠來看將真正節省資源和工作。Ralph Kimball說“數據倉庫僅僅是構成它的數據集市的聯合”(Figure 2,The Data Warehouse Lifecycle Toolkit,第 27 頁)。
他認為“可以通過一系列維數相同的數據集市遞增地構建數據倉庫”。每個數據集市將聯合多個數據源來滿足特定的業務需求。通過使用“一致的”維,能夠共同看到不同數據集市中的信息,這表示它們擁有公共定義的元素。Kimball的方法將提供集成的數據來回答組織迫切的業務問題並且要快於Inmon的方法。Inmon的方法是只有在構建幾個單主題區域之後,集中式的數據倉庫才創建數據集市。而Kimball認為該方法缺乏靈活性並且在現在的商業環境中所花時間太長。
從Inmon被人尊稱為數據倉庫之父,就可以看出,inmon對於數據倉庫領域的技術發展作起的作用的巨大的,無數數據倉庫愛好者甚至把《建設數據倉庫》看作是數據倉庫的“聖經”。inmon自己創建的網站上的文章被廣為傳頌,每當有inmon公開演講的時候,很多用戶和技術人員都把能夠聆聽inmon的最新成果為榮。在企業信息工廠的設計藍圖中,inmon清除地描述了如何從各種業務系統當中捕獲需要的數據,並在隨後的流程中,為適應不同的需求,而逐漸演變為各種不同的形態,所有的這一切都圍繞著一個最重要的部件來運轉,這就是企業數據倉庫。
在國內數據倉庫領域,inmon和kimball的理論也一度爭論不休,但是隨著數據倉庫建設的逐步深化,把企業數據倉庫作為企業數據整合平台的思路深得人心,越來越多的企業開始強調在企業內部建立一個企業級別的數據倉庫來支持整個企業的發展和運作。

人物軼事


隨著拉爾夫·金博爾(Ralph Kimball)博士出版了他的第一本書“The DataWarehouse Toolkit”(《數據倉庫工具箱》),數據倉庫行業就開始喧嘩起來,恩門的“Building the Data Warehouse”主張建立數據倉庫時採用自上而下(DWDM)方式,以第3範式進行數據倉庫模型設計,而他生活上的好朋友Ralph Kimball在“The DataWarehouse Toolkit”則是主張自下而上(DMDW)的方式,力推數據集市建設,以致他們的FANS吵鬧得差點打了起來,直至恩門推出新的BI架構CIF(Corporation information factory),把Kimball的數據集市包括了進來才算平息。

重點著作


以下列出恩門的幾本重點著作:
1、“Building the Data Warehouse ”(《建立數據倉庫》)
2、“Corporation information factory”(《企業信息工廠》)
3、“Govment information factory”《政府信息工廠》
4、“The Data Model Resource Book: A Library of Logical Data and Data Warehouse Designs”(《數據倉庫建模》)
5、“Managing the Data Warehouse”(《數據倉庫管理》)
6、“Data Warehousing for E-Business”(《電子商務中的數據倉庫技術》)