Freebase
用戶協同創作的知識庫
Freebase,是創作共享類網站,所有內容都由用戶添加,採用創意共用許可證,可以自由引用。由美國軟體公司 Metaweb 生產,后此公司於 2010 年 7 月 16 日被谷歌收購,也成為谷歌知識圖譜的建設基礎。
Freebase是個類似wikipedia的創作共享類網站,所有內容都由用戶添加,採用創意共用許可證,可以自由引用。兩者之間最大的不同在於,Freebase中的條目都採用結構化數據的形式,而wikipedia不是。
比如,已故美國總統肯尼迪的條目。可以發現其中所有的內容都是格式化的,一條一條的,有點像履歷表,包括出生時間、死亡時間、性別、職業、國籍、配偶等等。
這一套格式是固定的,所有人物條目都包含同樣的欄位。這樣一來,數據之間就可以很容易地聯繫在一起,為信息的查詢和處理提供了巨大的方便。
舉例來說,將來可以很方便地在Freebase中查到“出生於1946年的美國電影導演的名單”,然後你就可以根據這份名單,立即從Freebase中提取他們每個人的簡歷。要想在wikipedia中完成類似的查詢是非常困難的,事實上,wikipedia最大的缺點就是它的數據不是結構化的,因此難於引用和處理。
推而廣之,Freebase的目標是包含地球上的所有信息,因此可以設想,理論上,將來可以從freebase中得到任何信息。我立刻能想到的一個應用是,將來在電腦上播放DVD或mp3時,播放器可以到Freebase中獲取光碟或專輯的出版信息。
Freebase的結構分為三層:Domain -> Type -> Topic。
1) 在Freebase中,每個條目叫做一個Topic,每個Topic中的固定欄位,叫做“屬性”(Property);
2) 所有同類的Topic組成一個Type,比如所有電影Topic就屬於同一個Type,每個Type都有一套固定的Property,因此同類信息可以直接比較和關聯;
3) 所有相關的Type組成一個“域”(Domain),比如電影和音樂都屬於“藝術和娛樂“ Domain。
截至2007年5月30日,Freebase中共有61個DOMAIN、765個Type,2,312,676個Topic。
如果你熟悉圖書館學的話,其實可以看出來,Freebase的核心功能就是為每一類條目(Type)定義了一套元數據。元數據是否準確和適用,是影響Freebase成敗的關鍵。
Freebase最強大的地方就在於,它裡面的元數據是可變的,具有彈性。
具體的操作機制,我還沒有完全搞清楚,好像是用戶可以定義自己私人的元數據,然後在某些條件下,某些私有元數據的Property可以變為共有的Property。
現在Freebase全站完全都是用Ajax搭建的,HTML頁面中根本不包含具體數據,完全要靠Javascript去讀取。這等於拒絕了搜索引擎,我認為是極其不智的。
不管怎樣,Freebase是一個革命性的網站,就像一個國外程序員所說:“Freebase是2007年迄今網際網路上最激動人心的東西”(This is the most exciting Web thingy 2007 until now.)我想我將在這個網站裡面,繼續花費大量的時間,四處逛逛,熟悉整個系統。