中文輸入法

中文信息處理的重要技術

中文輸入法,又稱為漢字輸入法,是指為了將漢字輸入計算機或手機等電子設備而採用的編碼方法,是中文信息處理的重要技術。

中文輸入法從1980年發展起來的,經歷幾個階段:單字輸入、詞語輸入、整句輸入。漢字輸入法編碼可分為幾類:音碼、形碼、音形碼、形音碼、無理碼等。廣泛使用中文輸入法有拼音輸入法、五筆字型輸入法、二筆輸入法、鄭碼輸入法等,在台灣流行的輸入法有注音輸入法、嘸蝦米輸入法和倉頡輸入法等。流行的輸入法軟體平台,在Windows系統有搜狗拼音輸入法、搜狗五筆輸入法、百度輸入法、谷歌拼音輸入法QQ拼音輸入法、QQ五筆輸入法、極點中文漢字輸入平台;Linux平台有IBus、Fcitx;MacOSX系統除自帶輸入法軟體外還有百度輸入法、搜狗輸入法、QQ輸入法;手機系統一般內置中文輸入法,此外還有百度手機輸入法、搜狗手機輸入法等。

主要功能


從漢字的邏輯構造上看,漢字並不能像英文那樣被分成少量的元素單位,從而不能進行以文字構造為基本單位的分類歸放、處理等。雖然漢字可以分成不同的部首、偏旁等文字基本構件,但是被分成的基本構件數量過多並且基本構件在組成漢字時的位置、方位、朝向都將決定漢字的構成。這大大限制了中文漢字直接以漢字本身的構造進行快速錄入速度,根據漢字的構造輸入的方法有五筆字輸入法。五筆輸入法是按漢字的構造原理來進行漢字輸入的中文輸入法,雖然比英文輸入法繁瑣,但五筆輸入法是真正意義上的中文輸入法。
由於中文漢字的構造特點,漢字的字形輸入顯得繁瑣。這也從而衍生出字音輸入法等其它轉碼輸入法。
音轉碼對漢字的讀音要求比較準確,而漢字又是語素文字。字音輸入法並不能直觀的反映漢字的特點,並且漢字重音字、多音字比較多,這客觀上對字音輸入漢字的方法有一定的障礙。

啟動切換

現代中文操作系統一般提供了多種中文輸入法軟體,當需要輸入中文時,必須調入一種輸入法。
中文輸入法
中文輸入法
在Windows系統中單擊任務欄右側的輸入法圖標En,在彈出的輸入法選擇菜單中選擇一種中文輸入法即可。使用快捷切換如下:
Ctrl+空格鍵:轉換中英文輸入法
Ctrl+Shift:在各種輸入法和英文之間切換。
在Linux發行版中,有關輸入法的快捷方式為:
Ctrl+空格鍵:啟用輸入法
Alt+Shift:切換各種輸入法
Shift:切換中文和英文
MacOSX操作系統中使用輸入法的快捷方式鍵為:command+空格鍵
在Android、iPhone等智能手機上使用輸入法一般在進入文字編輯的時候會自動啟動輸入法軟體。

基本概念

中文輸入法是一種漢字編碼方法,如廣泛使用的漢語拼音方案以及台灣廣泛使用注音符號都能夠作為漢字輸入法的編碼方式,從而形成能夠錄入漢字的拼音輸入法或注音輸入法。另外五筆字型輸入法、二筆輸入法、自然碼輸入法、鄭碼輸入法、嘸蝦米輸入法和倉頡輸入法都屬於漢字編碼方法。漢字輸入法編碼只有搭載在輸入法軟體上才可以在電腦或手機上打出漢字。
廣義上的輸入法還包括輸入法軟體,即輸入法平台或輸入法框架。輸入法軟體一般默認自帶某種漢字編碼方式,例如最流行的拼音編碼,也即通常所說的拼音輸入法。有的輸入法軟體名稱本身也就是該輸入法的編碼名稱,如王碼五筆字型輸入法、超強兩筆輸入法,但多數情況下輸入法軟體本身並不屬於輸入法編碼方法。
Windows系統流行的中文輸入法軟體有搜狗拼音輸入法、搜狗五筆輸入法、百度拼音輸入法、QQ拼音輸入法、QQ五筆輸入法、谷歌拼音輸入法極點中文漢字輸入法平台等,這些輸入法默認情況下帶有拼音輸入法和五筆字型輸入法等編碼方法,有的還可以通過自定義設置而實現其他多種輸入方式,如手寫、筆畫、二筆、鄭碼等輸入方式。在Linux發行版、MacOSX系統以及智能手機中的輸入法框架一般集成多種流行的輸入法編碼,可以在同一個輸入法軟體下自由切換各種不同輸入法。

使用技術

簡碼
動態字頻
動態詞頻
以詞定字
以句定詞
優化詞庫

品質標準

商業化、內建與否:通常系統內建的輸入法最方便、最泛用。而需要額外安裝者次之。除下載或攜帶安裝程式的不便以外,有些系統會限制使用者不得安裝軟體。商業化的輸入法,除了需要付費,許多地方可能沒有安裝而造成使用不便;更甚有因公司倒閉而使輸入法絕滅,使用者只好重新學習新的輸入法。
字根數目:通常字根數越多,記憶量便增加
編碼的合理性:編碼較合理,能方便記憶,加快學習速度
口訣:有些編碼雖不甚合理,但附有特殊口訣,而容易記憶
取碼規則的繁複與否
速度
重碼率:重碼率越低,免卻選字的疑慮,輸入速度越快
極點五筆
極點五筆
編碼長度:編碼越短,輸入時間越低。但另一方面,編碼長度太短,又會增加重碼率。因此好的輸入法須取得平衡。
簡碼:簡碼可大幅增加常用字的輸入速度,但必須額外背誦。因此是否要背簡碼、簡碼是否好背,也是考量要點。
容錯
有些輸入法可一字多拆,避免一些字型由於主觀認知上的差異而拆不出的困擾
有些輸入法支援模糊輸入,如*、?,如此一來,不會拆字時,便可用模糊的輸入方式拆出
符號輸入
標點符號在中文文章中相當重要,因此標點符號是否容易輸入也至關緊要。有些輸入法除常用標點符號以外,尚可輸入較少用的符號,如注音、希臘符號、數學符號、等等。
自由性:有些輸入法可自定編碼或自定詞庫,增加靈活性。
字型檔大小:許多輸入法只針對常用字編碼,較罕用的字不是無法輸入,就是難以輸入

列表

微軟新注音輸入法
在1990年代中期,為了同時照顧不同的用戶群,一些輸入法同時進行了形碼、音形碼、形音碼的編碼(例如認知碼)。下表中的分類中,僅列入輸入法的最主要變種。拼音輸入法(音碼)
中文的同音字不少,所以字音輸入法的重碼率偏高,不易實現盲打,需倚重輸入法軟體在智慧型輸入上的設計。
注音輸入法(注音)
整句輸入的注音輸入法(智慧型預先猜字輸入法,智慧特性來自預先建立的字典字詞或輸入習慣學習推測的自動新建詞)
自然輸入法-網際智慧公司
新酷音輸入法-自由軟體
微軟新注音輸入法-隨附於視窗操作系統內
巧音輸入法-自由軟體(僅適用於類UNIX操作系統上)
忘形輸入法-倚天資訊公司(已停止發展)
漢音輸入法-松下電器公司(已停止發展)
漢語拼音輸入法(主要分為全拼、雙拼兩類。另有簡拼輸入法。一般的拼音輸入法軟體一般可以根據用戶的需要,進行相應的設置。)
詞語輸入的拼音輸入法
百度輸入法
智能ABC輸入法
拼音加加輸入法
紫光拼音輸入法
新華拼音輸入法
搜狗拼音輸入法
谷歌拼音輸入法
QQ拼音輸入法
整句輸入的拼音輸入法
微軟拼音輸入法
黑馬神拼輸入法
智能狂拼輸入法
粵語拼音輸入法(粵語拼音)
速打粵語輸入法
亞偉速錄(需專用的鍵盤,一般為專業速錄員使用。)
極點五筆
形碼輸入法(字形)
二筆輸入法
三角編號法
五筆字型輸入法
極點五筆
海峰五筆
六一輸入法
九方輸入法
十易碼輸入法
倉頡輸入法
速成輸入法(簡易輸入法)
快速倉頡輸入法
新倉頡輸入法
大新倉頡輸入法
大易輸入法
行列輸入法
嘸蝦米輸入法
偽蝦米輸入法
華象直覺輸入法
輕鬆輸入法
快碼輸入法
縱橫輸入法
筆順輸入法
筆劃輸入法
五筆畫輸入法
表形碼
首尾字型輸入法
鄭碼輸入法
快意速成輸入法形音結合(形音碼)
子來輸入法
王林快碼
認知碼
漢碼形音碼
自然碼
部首輸入法
內碼輸入法(無理碼)
參看:中文信息處理
大五碼(Big5碼)
倚天碼
國標碼(如GB2312、GBK、GB18030等)
中文電碼
Unicode(統一碼)
區位碼

發展沿革


由於漢字有數以萬計,電腦鍵盤不可能為每一個漢字而造一個按鍵。因此,人們需要替漢字編碼(檢索出漢字的代碼),用數個鍵來輸入一個漢字。中文輸入法的發展過程,是“萬碼奔騰”的過程,在30年間出現了上千種編碼方法。
台灣交通大學的一套試驗漢字鍵盤
台灣交通大學的一套試驗漢字鍵盤
最早的漢字輸入法,一般認為是從70年代末期或者80年代初期有了個人電腦PC開始誕生的,雖然更早有電報碼,用0──9十個數字中的四位組合構成每一個漢字,便於郵電局發送電報之用,但通常意義上,人們還是認為從1981年國家標準局發布《信息交換用漢字編碼字符集基本集》GB2312-80以來,個人計算機上開始使用五筆或者拼音輸入漢字才是輸入法廣為使用的真正開始。在台灣的漢字輸入法歷史則可追溯至1976年由朱邦複發明之倉頡輸入法開始。
漢字輸入法的發展,一方面是輸入法軟體的功能的改進和完善,另一方面是新型輸入法編碼的不斷湧現。前者主要是針對拼音輸入法,後者則出現了“萬碼奔騰”的局面。早期的輸入法軟體大都為收費軟體,很多企業或個人依靠銷售輸入法軟體掙錢,如今收費的輸入法已經很少,絕大多數輸入法軟體都是免費的產品。

拼音輸入法發展史

拼音類的輸入法包括大陸的拼音輸入法和台灣的注音輸入法等。拼音輸入法相比其他輸入法有著天然的優勢,因為現代每一個接受教育的中國人在還沒學習漢字前就先用大量時間學習漢語拼音或注音符號,原本只是用來標記漢字讀音的拼音也就可以輕鬆地作為漢字的輸入編碼。拼音輸入法另一個優勢就是接近口語話,所以拼音輸入法可以在極短時間內適應。
中文輸入法
中文輸入法
但是拼音輸入法有著致命的弱點,就是漢字輸入法編碼時,單字重碼率異常高,即使片語重碼率也是非常高。為了讓拼音能夠較快速的錄入漢字,只有藉助複雜的輸入法軟體來提高拼音輸入能力,比如支持智能排序,以詞定字,整句輸入,雲輸入功能等,縱觀拼音輸入法的發展,也即拼音輸入法軟體的發展。
在中文輸入法誕生之初就最先出現拼音輸入法,但是當時的拼音輸入法軟體功能差,字序固定,不支持片語和整句輸入,甚至文字不能和編碼一起顯示。在輸入漢字過程中常常要翻很多頁才能找到需要的漢字,輸入效率非常低下。雖然當時很多人都只會用拼音輸入法,但大部分人都不滿拼音輸入法的輸入效率。
20世紀90年代后,拼音輸入法軟體開始支持片語輸入和整句輸入。1993年出來的中文之星輸入法軟體能夠做到單個字詞的即時顯示,即一邊打拚音,同時顯示漢字。中文之星軟體進行一些巧妙設計,如空格確認、逗號句號選重碼、允許模糊音容錯和自定義字元串等,這些功能已經成為當今所有拼音輸入法軟體的必備功能。1993年初北京大學的朱守濤先生髮明發明了智能ABC輸入法,后被微軟收購內置到Windows系統中。在隨後幾年中智能ABC輸入法成為了中國大陸使用人數最多的輸入法軟體。
1994年的出來的自通輸入法軟體和1996年的黑馬神拼輸入法軟體,這兩種輸入法都實現了漢字整句輸入(又稱語句輸入)能力。漢字整句輸入可追溯到20世紀80年代末期,哈爾濱工業大學在校博士生王曉龍進行了漢字分詞方面研究,並申請了863課題,寫出了“最小分詞問題及其解法”方面的論文,從而奠定了拼音整句的輸入的理論基礎。微軟從Windows95中文版開始,在系統內置支持整句輸入功能的“微軟拼音輸入法”。
然而當時的拼音輸入法普遍智能化程度不高,整句輸入不成熟,輸入過程中錯誤率高,而且不能夠與所敲拼音同步顯示漢字(微軟拼音是滯后一個字、自通是滯後幾個字、黑馬拼音是需要最後確認才出現漢字),整句輸入過程中修改拼音選擇漢字不方便,大大限制了整句拼音輸入法的使用,所以很多用戶還在繼續智能ABC。直到1998年譚亞軍發明的拼音之星軟體,才完全支持“實時顯示”的方式,不管輸入多少拼音,每個字母按下去,漢字就同時顯示,拼音有錯誤,用戶就會立即發現,又由於支持自動分詞與整句輸入,用戶不用去擔心是輸入一個詞語還是一句話,系統都能夠進行處理,如果沒有該詞語,系統也能夠自動學習並存檔,似乎具有了詞語輸入法的方便性與整句輸入法的智能性。到了1999年出現了另外幾個拼音輸入法軟體:拼音加加、自由拼音輸入法和考拉輸入法,拼音加加軟體開始支持在不切換輸入法情況下直接用Enter直接鍵入英文字母
在90年代,雙拼輸入法和相應的輸入法軟體也得到了快速發展。雙拼輸入法誕生了多種方案,如自然碼輸入法軟體提供的自然碼方案,更採用雙拼加偏旁或筆劃的音形結合方式編碼,提供了一種快速輸入漢字的途經,這已經超出了拼音輸入法的範疇,嚴格來說自然碼雙拼不屬於純拼音,而是一種音形碼。此外微軟、拼音之星、拼音加加、小鶴雙拼等都提供了各自不同的雙拼方案。
進入新世紀后,拼音輸入法軟體功能趨於成熟,正式進入了智能拼音輸入法時代,這時產生的拼音輸入法軟體主要是整合以前拼音輸入法軟體優點,提供了更大的詞庫,軟體的智能性也更強,還擁有了更強的學習能力。
輸入法界面設計
輸入法界面設計
2000年初出來的智能狂拼也提供了更智能的輸入方式。而紫光拼音輸入法是在考拉輸入法的基礎上開發而成,提供了一個更大的詞庫,增加了智能組詞,也就是說用戶連續輸入9個字以內的拼音串,系統能夠自動轉換成漢字,而不論是否有這個詞語,系統根據詞頻高頻先見的方式給出一個詞語串的組合。紫光輸入法最終成了用戶最喜歡的輸入法之一。
隨著網際網路的快速發展,2006年6月由搜狐公司推出的一款Windows平台下的搜狗拼音輸入法。搜狗拼音輸入法是基於搜索引擎技術的新一代的拼音輸入法產品,用戶可以通過網際網路備份自己的個性化詞庫和配置信息。搜狗拼音輸入法一經出來很快取代了智能ABC輸入法而成為中國現今主流漢字輸入法。
在搜狗輸入法出來后,谷歌、騰訊、百度和微軟也相繼推出了同一類型的智能拼音輸入法:谷歌拼音輸入法、QQ拼音輸入法、百度輸入法、必應輸入法。
常見的繁體中文鍵盤,有注音,倉頡和大易碼
常見的繁體中文鍵盤,有注音,倉頡和大易碼
隨著智能手機和平板電腦的流行,很多IT企業又開發了Android、iPhone、iPad的拼音輸入法,如百度手機輸入法、QQ手機輸入法、搜狗手機輸入法等。這些輸入法延續了電腦上輸入法的特點,同時輸入法軟體針對觸屏的特點,從而提供了更為靈活的輸入方式。
在台灣的拼音輸入法則以注音輸入法為主,與大陸類似都是在輸入法軟體方面不斷得到完善和改進,變得更加智能。與大陸不同的是,大陸拼音輸入法一致採用英文26鍵作為拼音輸入法的鍵位,而台灣使用的注音輸入法鍵位設置沒有一個統一的標準,從40鍵到30鍵,再到26鍵都有人使用。因為注音符號與鍵盤的英文字母並不是一一對應的,所以注音符號設置鍵位的時候往往採用數字鍵和符號鍵作為編碼。
在香港人則流行粵語拼音輸入法(又名廣東話輸入法),利用漢字的粵語讀音,在電腦上輸入漢字。由於粵語拼音缺乏統一的拼音標準辦法,各種軟體的拼音法並不一致,故有礙粵語拼音輸入法進一步的發展和普及。

輸入法編碼發展史

1983年王永民先生推出五筆字型輸入法
1983年王永民先生推出五筆字型輸入法
雖然拼音輸入法簡單易學,但是漢字同音字現象之多所導致的重碼率居高不下,即使輸入片語重碼也是相當高,縱然加上雲輸入功能也無法完全做到精確地輸入文字,所以在拼音編碼外就湧現了大量的編碼方案,主要有形碼和音形碼兩類,這些編碼往往比拼音輸入法具有更低的重碼率,熟練后可以很快地輸入漢字。中國大陸最早出現併流行開來的形碼輸入法是由王永民於1983年發明的五筆字型輸入法。在台灣最早的形碼輸入法則是1976年由朱邦複發明之倉頡輸入法。
電腦在中國普及,第一個急需要解決的問題就是,如何將漢字輸入到電腦中,拼音雖然可以作為漢字的編碼,製作成拼音輸入法,但是很長一段時間拼音輸入法的輸入漢字效率極其低下。為了能夠讓中文快速的在電腦上輸入,有的人拋棄英文鍵盤布局而另外設計了專門的中文鍵盤,這些鍵盤作為編碼的鍵數量有的為幾十個,甚至有的達到幾百個,但是這些方案並沒有實現中文的輕鬆或快速錄入。
這是五筆98碼元的示意圖
這是五筆98碼元的示意圖
直到1983年8月,王永民推出了劃時代的五筆字型輸入法。五筆輸入法採用普通的電腦鍵盤,只使用英文字母鍵其中的25個參與編碼,不但可以讓我們輸入漢字,而且也極大的解決了輸入速度這一頑症。五筆字型完全依據筆畫和字形特徵對漢字進行編碼,是典型的“形碼”。五筆字型在發展過程中先後誕生了三種編碼方案,即86版和98版和新世紀版。作為國內第一個推廣的形碼輸入法,一經推出來,即受到很多用戶的熱捧,在80年代和90年代,很多人學習電腦的第一要務就是學習五筆字型輸入法,五筆的教學培訓班也遍地開花。
在80年後期還出現了另一個著名的形碼輸入法——鄭碼輸入法。鄭碼是鄭易里和女兒鄭瓏共同發明的一種中文輸入法,鄭碼相比於五筆更加規範,而且鄭碼輸入法要比五筆更加廣泛,因為微軟從Windows95系統開始就內置鄭碼輸入法,成為系統默認自帶的輸入法,直到2012年的Windows8才取消內置鄭碼輸入法。鄭碼推出后很快獲得中、美、英國專利授權,並通過國家級的鑒定,曾榮獲北京國際發明金獎和最優秀髮明大獎;榮獲第22屆日內瓦發明金獎。為了解決繁體字與簡體字通用的問題,鄭碼採用字根雙編碼方式減少字根重碼,因採用按特徵檢索基根和區碼方式以及大多採用標準的偏旁部首記憶量增加不大較為易學。
在80年代和90年代,由於國家教委尚未有推薦輸入法方案,所以在中小學里教的漢字輸入法相當多,各個學校教漢字輸入法也不盡相同,有的教五筆字型,有的教自然碼,有的教肖碼等。雖然五筆字型輸入法可以快速錄入漢字,也在全國範圍內得到較為廣泛的商業推廣,但是五筆因為學習難度高,而且五筆編碼本身有不少存在不合理的地方,比如字根不符合漢字基本部件與違反筆順的問題,所以一直無法成為國家教委的推薦輸入法。
進入90年代后,國家教育委員會批准了關於研發輸入法的“八五”重點攻關項目。在1992年8月1日至3日,國家教委基礎教育司及直屬的全國中小學計算機教育研究中心在北京召開了“全國中小學教學漢字編碼規範與計算機漢字輸入系統”的研討會。最後與會代表認為,在目前的中小學計算機教學中,應主要使用漢語拼音方案作為計算機漢字輸入方法,而對形碼的選擇應持特別慎重態度,目的在於避免對語言文字的“污染”,並堅決反對用商業競爭或行政命令手段在中小學中強制推行不規範的漢字輸入編碼方案的做法。兩年後項目課題組推出了名叫“認知碼計算機漢字輸入系統”的形碼輸入法,1995年國家教委推薦中小學使用認知碼,向全國中小學校全面推廣。
可是,由於認知碼自身存在很多欠缺,在推行之中遇到很大爭議和阻力。不少學術刊物紛紛載文討論認知碼,因為認知碼自身的致命缺陷,比如重碼率相當高、編碼規則複雜、易學性差、字根選擇缺乏正確的規範、簡碼的使用不科學,使這種後來研製出的官方編碼被批評家批駁得體無完膚,一蹶不振。最後認知碼全面推廣之事也不了了之。
在國家教委想方設法研發一種易學規範而又快速的輸入法同時,一種更優秀的輸入法——二筆輸入法已經在民間誕生。二筆輸入法是陳勁松於1992年發明的音形碼輸入法,採用拼音首字母與筆畫(兩個筆畫取一鍵)相結合的方式取碼。二筆輸入法直到2000年1月成立的廣東二筆軟體有限公司向外界推出二筆輸入法軟體后,才正式出現在大眾的視野中。二筆輸入法不但易學,還可以輸入文字打出像五筆一樣速度。二筆輸入法具有規範、易學、快速的特點,因此順利通過國家教育部基礎教育課程教材發展中心評審而獲准進入中小學基礎教材,這是截止2013年唯一獲得批准進入中小學基礎教材的漢字輸入法。
由於廣東二筆軟體有限公司以高價銷售二筆輸入法軟體,而且當時(2000年到2004年期間)已經得到廣泛使用的智能ABC輸入法和五筆輸入法是免費的產品,只有很少人願意嘗試使用二筆。最終導致以經營二筆輸入法軟體為主要業務的廣東二筆軟體有限公司在2004年瀕臨倒閉。在另一方面,二筆輸入法以其優秀的特性吸引了不少二筆愛好者,還有些愛好者對二筆進一步改進和優化,同時對二筆輸入法軟體進行維護。二筆輸入法軟體大都能夠在網際網路上免費獲得和使用。
而隨著智能拼音輸入法時代的到來,特別是在2006年搜狗拼音輸入法的誕生后,非拼音類的形碼或音形碼輸入法受到的關注也就越來越少,而且不再有國家相關部門參與開發和推廣輸入法。但這並不影響眾多輸入法愛好者對輸入法編碼方案研究的熱情。很多愛好者研究輸入法都會從多面方面考慮,比如重碼率、易學性、對大字型檔的支持、輸入法按鍵的舒適程度等。
大易字碼的鍵盤排列
大易字碼的鍵盤排列
一些輸入法愛好者仍然想得到一個超低重碼率的輸入法,所以也就產生了GB2312-80字符集的6763個漢字中只有14個重碼字的張碼輸入法。在支持大字型檔方面,除了輸入法編碼本身外,更要輸入法軟體和字型檔或詞庫的支持,所以誕生了收錄全部七萬多個UNICODE漢字的海峰五筆軟體。而在輸入法編碼方案易學方面,至今依然沒有一個能夠超越二筆輸入法的編碼方法,能夠做到既高效又易學。
嘸蝦米輸入法的標準拆碼
嘸蝦米輸入法的標準拆碼
在台灣,中文輸入法也出現了非常多的輸入法編碼方案。1976年朱邦複發明第一個形碼輸入法——倉頡輸入法,發明輸入法后,朱邦復公開該輸入法,不收分文,使電腦漢化得到很大的進展。所以台灣的Windows操作系統都內置有倉頡輸入法。也成為台灣最流行的形碼輸入法之一。成倉頡輸入法出來之後又誕生了一批形碼輸入法,像王贊傑發明了大易輸入法,廖明德發明了行列輸入法,和倉頡輸入法一樣,這些輸入法作者開放輸入法專利,所以同樣內置到了Windows系統中。在台灣使用人數最多的形碼輸入法是嘸蝦米輸入法,這是在20世紀80年代後期,台灣人劉重次發明的一種形碼輸入法。

其他輸入法發展史

通常我們所說的輸入法都指電腦普通鍵盤或手機鍵盤上的輸入法,包括拼音、形碼和音形碼。除了這些通常意義的輸入法外,還有語音輸入、手寫輸入,以及速錄技術等,這類輸入法技術的發展既與普通鍵盤輸入法發展息息相關,又獨立於普通鍵盤輸入技術。
漢字語音輸入是利用語音識別技術將語音轉換為文字的輸入方法,通常是採用馬爾可夫信息模型進行統計處理和基於規則方法進行歧義判別。20世紀90年代中後期,IBM終於推出非特定人連續語音識別系統ViaVoice,這是當時語音識別中的佼佼者。與此同時國內很多從事漢字語音識別研究的人員運用在研究所或大學學到的知識或研究成果,建立了巨大的中文語言資料庫(又叫語料庫),推出了中文普通話的語音輸入系統。科大訊飛現已成為中國最大的智能語言技術提供商。在個人電腦上要實現語音輸入中文往往還需要外接設備。而今隨著智能手機的普及,很多智能手機的輸入法都自帶語音輸入功能,如百度手機輸入法、訊飛語音輸入法等都具有語音輸入的方法,用戶也可以方便地利用手機進行語音輸入文字。但是,語音輸入有還不能提高非常精確的文字輸入。
除了語音輸入文字外,手寫也是一種常見的輸入漢字方法。手寫輸入法是在手寫板或觸屏手機屏幕直接書寫的中文輸入方式。1997年就已經出現了基本可以使用的手寫漢字輸入系統,採用了基於語義句法的模式識別方法。20世紀90年代也誕生了不少手寫產品,比如中自公司的“漢王99”和摩托羅拉公司的“慧筆”。但是在隨後幾年裡手寫並沒有得到廣泛使用,直到觸屏手機的出現,特別是在智能手機和平板流行后,手寫輸入法才得到更加廣泛使用。
速錄技術嚴格來說並不屬於輸入法編碼方法,速錄所用到的編碼方法實際上也就主要為三種:拼音、形碼和音形碼。速錄一般面向特定的領域,速錄師就業面向政府機關、司法系統。這些領域對於文字的錄入速度要求比較高,特別是在會議,速錄師可以邊聽邊將文字打出來,就像文字立即出現在眼前。另外速錄的鍵盤通常也不同於普通鍵盤,而採用速錄鍵盤,如亞偉速錄採用國際通用的速錄鍵盤。
亞偉速錄是最早的一種中文速錄技術,採用拼音輸入方式,由唐亞偉於1993年發明。亞偉速錄也是如今最廣泛的中文速錄技術。在亞偉速錄之後又出現了其他多種速錄技術,如國育速錄、超音速錄、飛耀速錄、五筆雙打等。
雖然速錄使用的編碼方案通常為拼音方案(也有少數採用五筆或二筆方案),經過特殊的編碼組合,但是大多數都採用並擊技術,並擊需要每次多個手指分別按下多個不同的鍵,可以有效地提高擊鍵效率,從而也就突破了普通鍵盤每分鐘200到300字的極限速度,而達到每分鐘600字以上的速度。

編碼分類


漢字輸入法,主要包括音碼、形碼、音形碼、無理碼以及手寫、語音錄入等方法,廣義的輸入還包括用於速寫記錄的速錄機等。

拼音輸入法

微軟新注音輸入法
微軟新注音輸入法
拼音輸入法採用漢語拼音作為編碼方法,包括全拼輸入法和雙拼輸入法。廣義上的拼音輸入法還包括台灣人使用的以注音符號作為編碼的注音輸入法,香港人使用的以粵語拼音作為編碼的粵拼輸入法。
流行的輸入法軟體以智能ABC、中文之星新拼音、微軟拼音、拼音之星、紫光拼音、拼音加加、搜狗拼音、智能狂拼和谷歌拼音、百度輸入法、必應輸入法等為代表。在台灣自然輸入法軟體。

形碼輸入法

形碼輸入法是依據漢字字形,如筆畫或漢字部件進行編碼的方法。最簡單的形碼輸入法是12345五筆畫輸入法,廣泛應用在手機等手持設備上。電腦上形碼廣泛使用的有五筆字型輸入法、鄭碼輸入法。在港澳台等地流行的形碼有倉頡輸入法、行列輸入法、大易輸入法、嘸蝦米輸入法等。流行的形碼輸入法軟體有QQ五筆、搜狗五筆、極點中文輸入法等。

音形結合碼

音形碼輸入法是以拼音(通常為拼音首字母或雙拼)加上漢字筆畫或者偏旁為編碼方式的輸入法,包括音形碼和形音碼兩類。代表輸入法有二筆輸入法、自然碼和拼音之星譚碼等。流行的輸入法軟體有超強兩筆輸入法、極點二筆輸入法、自然碼輸入法軟體等。
以上的形碼輸入法和音形結合碼輸入法,相比拼音輸入法通常具有較低重碼率的特點,漢字輸入確定性高,熟練后可以高速地輸入單字和片語,藉助軟體平台還可以實現整句的輸入。形碼或音形碼通常不需要輸入法軟體太多的功能,更不需要軟體的智能功能,所以這類輸入法的軟體通常都非常小巧,而且無需頻繁更新詞庫。

內碼輸入法

中文輸入法
中文輸入法
內碼輸入法屬於無理碼,並非一般意義上的輸入法。在中文信息處理中,要先決定字符集,並賦予每個字元一個編號或編碼,稱作內碼。而一般的輸入法,則是以人類可以理解並記憶的方式,為每個字元編碼,稱作外碼。內碼輸入法是指直接透過指定字元的內碼來做輸入。但因內碼並非人所能理解並記憶,且不同的字符集就會有不同的內碼,換言之,同一個字在不同字符集中會有不同的內碼,使用者需重新記憶。因此,這並非一種實際可用的輸入法。國內使用的內碼輸入法系統主要有國標碼(如GB2312、GBK、GB18030等)和GB區位碼和GB內碼。