文泉驛
文泉驛
文泉驛是一個以開發開源、免費中文電子資源--如漢字字體、詞庫等--為目標的公益性組織。她的創辦宗旨是實現“任何人在任何地方都可以自由使用漢字和漢語進行交流”。
自旅美學者房騫騫(FangQ)於2004年10月創建迄今,文泉驛項目致力於開源漢字字體的開發,集中力量解決GNU/Linux高質量中文字體匱乏的狀況。目前,文泉驛已經開發併發布了第一個完整覆蓋GB18030漢字(包含27000多個漢字)的多規格點陣漢字字型檔,第一個覆蓋GBK字符集的開源矢量字型檔,並提供了目前包含字元數目最多的開源字體--GNU Unifont--中絕大多數中日韓文相關的符號。這些字型檔已經逐漸成為主流Linux發行版中文桌面的首選中文字體,得到了廣大中文Linux愛好者的支持和喜愛。目前Ubuntu、Fedora、Slackware、Magic Linux、CDLinux使用文泉驛作為默認中文字體,Debian、Gentoo、Mandriva、ArchLinux、Frugalware則提供了官方源支持。文泉驛的網站(除了論壇)採用維基搭建。
作為幾千年中華文明的見證,浩瀚傳統文化傳承的載體,漢字是讓我們每一個中國人引以為豪的東方文明的標誌之一。我們的祖先創造漢字,書寫漢字,利用漢字和漢語的無窮魅力創造出讓人嘆為觀止的文學,藝術。而今天進入了計算機時代的我們,雖然不再象古人一樣手持毛筆,批著簡帛,但我們的生活仍然無時無刻離不開漢字。
可以毫不誇張的講,漢字①是世界上最為複雜和龐大的符號系統之一。早在殷商時期,我們的先人就創造出了數目巨大的甲骨文,從發掘出來的上萬片甲骨中整理出來的單字就有四千餘個,而東漢許慎編撰的“說文解字”,收錄漢字9353字(一說10516)個。至清朝康熙年間的“康熙字典”收錄漢字竟達47035之多。加上少數民族文字,各種古代典籍上曾經出現但並未廣泛使用的古漢字和異體字,漢字總數多達十萬以上。
我們是一群致力於在計算機世界中推廣漢字,豐富電子漢字資源的志願者,我們希望通過自己無私的勞動,使得無論你在世界上任何一個角落,都可以免費地獲得我們的電子漢字資源,能夠流暢地通過漢字進行交流。“文泉驛”是以上述目標為宗旨而自發創建的非贏利性組織。
對於製作電子漢字資源,文泉驛制定了如下子計劃:
<#> 基於開放源代碼②的點陣漢字型檔(優化屏幕顯示)
<#> 基於開放源代碼的矢量漢字型檔
<#> 基於開放源代碼的漢字筆畫筆序資料庫
<#> 基於開放源代碼的漢字圖像識別系統
<#> 基於開放源代碼的漢字筆畫識別系統
<#> 基於開放源代碼的漢字信息系統(解釋,編碼等)
<#> 開放的非官方電子漢字標準
具體來講,我們希望完成覆蓋Unicode 4.0所包含的7萬多漢字的點陣點陣圖(9pt,10pt,11pt,12pt等),筆畫筆順資料庫以及基於筆畫筆順資料庫生成的不同字型(細宋,中宋,報宋等)的矢量漢字型檔。這個工作還可以繼續擴展到對所有漢字進行注音,釋義,通過筆畫筆順進行漢字檢索和分類,少數民族語言文字的點陣和矢量字體,以及漢字圖像識別和筆畫識別演演算法,軟體的開發。
文泉驛計劃的初衷是為了從根本上改變自由中文字體匱乏的現狀,開發高質量、多規格、多字體風格的開源中文字體(點陣字體和矢量字體),解決中文 Linux發展的字體障礙,為中文發行版、開源中文軟體的開發掃清障礙,降低中文Linux的使用門檻,從而讓更多的人接觸和使用Linux。
文泉驛計劃正式開始於2004年10月,計劃的第一步是在台灣志願者Firefly完成的點陣的基礎上開發完整覆蓋Unicode中日韓統一表意文字區(共20902個漢字,等同於GBK字符集)在四個屏幕常用字型大小上的點陣字體,這個工作在王宏 (hotcat)等志願者的推動下於2005年4月完成,共繪製完成了新點陣約15000多個,優化原有的Firefly點陣數萬餘個,並於2005年6 月正式發布了文泉驛點陣宋體。從2005年4月開始,點陣字體開發擴展到中日韓表意文字擴展A區(共6582個漢字)的工作在志願者Nicholas Wang的積極參與下在2006年年中完成。此任務共繪製新點陣23000多個,與前面完成的字體結合,已經具備了完整的GB18030中文字符集覆蓋。文泉驛點陣宋體經過參與者的不懈的改進,現在已經發布了四次主要更新(代號分別為文泉半兩、蒼龍、北斗和英雄-beta)。
與點陣中文字體開發平行啟動的另外一個任務是開發高質量矢量字體,這個工作自2005年5月開始至2008年底,志願者已經完成了超過27000個 CJK基本和擴展A區漢字及25000多擴展B區罕用漢字的筆畫分解工作。文泉驛矢量字體--正黑體--也於2007年9月發布第一個版本(開發代號:紫簫)。該矢量字體至2008年已經歷兩次主要更新(開發代號分別為夸父和祈禱),並成為Wikimedia系統唯一支持的中文黑體字體。
文泉驛字體開發過程大多數是通過一個改寫的Wiki及部分離線編輯軟體完成。特別是在線點陣編輯部分是開發的一個重要環節和工具,由於Wiki本身具備了強大的協同開發能力,具有良好的版本控制和信息組織機制,同時漢字編輯本身具有很好的可并行性和顆粒化特性,所以該平台在整個開發過程當中顯示了強大的生命力。
文泉驛點陣字體和矢量字體分別於2006年05月27日和2007年09月09日實現了“每日自動編譯新字體”(nightly build)的功能,對於在使用中對字型不滿意的漢字,用戶可以進行方便地進行在線修改,經過管理員審核,用戶第二天就可以下載到修改後的最新字體。
由於文泉驛點陣能夠克服大多數純中文矢量字體邊緣模糊不清、不易閱讀的缺點,而且風格統一,字型嚴格按照Unicode和國家標準製作,加之版權、授權明晰,在發布后的不久,便被很多Linux發行版本接受作為默認屏幕中文字體,更多地發行版將文泉驛納入他們的軟體倉庫,提供用戶動態更新下載。相信隨著新版本的推出和時間的發展,會有更多的Linux發行版採用文泉驛開源字體。
對於常見的計算機操作系統,字體的顯示演演算法需要一些字體的信息來優化屏幕顯示效果,英文稱為hinting。漢字由於筆畫複雜,所以hinting的方式與西文截然不同。使用在漢字字體中嵌入預先製作的點陣點陣圖既可以有效地避免hinting演演算法帶來的計算開銷,同時屏幕上顯示的漢字邊緣清晰,易於閱讀。
同時,點陣漢字也是一種非常特殊的漢字形式,如何在點陣有限的網格空間上排步黑白像素,使得即能最好地表現出漢字的筆畫特徵,又能黑白勻稱,顯示優美,可以說,製作點陣漢字是一種藝術創作活動。我們製作的點陣漢字字型檔將可以使用在各種主流計算機操作系統上,特別是同樣基於開放源代碼的Linux操作系統。
在製作點陣漢字的同時,我們的其他計劃也在同時著手開展。我們真心地希望有更多熱愛漢字的朋友加入我們的行列,為中文用戶減輕困難,為中國文化的傳播作出自己的貢獻。
②:這裡的開放源代碼代表了“免費獲得並可以後繼開發”的原則,我們將會在這個基本原則上制定具體使用協議,或者使用現有的開放源代碼使用協議(比如GNU General Public License)。
文泉驛計劃歡迎任何有興趣為公益事業奉獻自己的時間和熱情的朋友參與。參與文泉驛漢字開發活動不需要安裝任何特殊軟體,志願者只需要通過瀏覽器瀏覽文泉驛網站,並使用在線繪圖程序來製作和發送漢字圖案信息,比如漢字筆畫分解或者點陣繪製。參與者可以選擇在任何方便的時間或者長度來參與這些活動。用戶無私的參與將對開源中文的發展至關重要。
參與漢字開發的朋友通過瀏覽器瀏覽文泉驛的漢字開發界面(Canvas和Pixel),製作併發送漢字字型數據,參與者的帳號名和所製作的漢字一起將記錄在我們的開發日誌當中,並作為為文泉驛所發布字體的一部分,所有參與者的信息將會包含在字體的發布文檔當中,進入各個發行版的在線軟體參考和千千萬萬中文用戶的電腦中,成為文泉驛開源字體令人驕傲的奉獻者之一。如果參與者選擇創建編輯在線文檔、教程,或者參與字體缺陷的報告或者論壇的討論和回饋,他們的帳號信息同樣將進入文泉驛網站更新歷史當中,成為開發過程當中的不可替代的重要環節。
沒有時間參與文泉驛在線開發的朋友還可以選擇其他方式來支持這個項目:他可以告訴身邊的朋友對文泉驛字型檔的使用體驗,或者考慮為他支持的發行版添加優秀的文泉驛字體;擁有個人博客的朋友可以考慮為文泉驛添加一個鏈接;如果他正在維護一個在線雜誌或者是一個記者,對文泉驛和其他中文開源開發的宣傳報道也可以大大提高開源中文在用戶當中的影響力。另外,用戶還可以選擇通過捐款支持,文泉驛目前所有網站運行的費用都是通過有限數量的用戶捐款維持的,用戶的經濟資助將會讓這個項目走得更長遠,開發出更多有用的中文資源。