編碼輸入

編碼輸入

編碼輸入是指根據一定的編碼方法,由人藉助輸入設備將漢字輸入計算機的方法。

輸入方法


①整字輸入法:前一階段,一般是將三四千個常用漢字排列在一個具有三四百個鍵位的大鍵盤上。近來,大多是將這些漢字按XY坐標排列在一張字表上,通常叫“字表法”,或“筆觸字表法”。比如,X25行和Y90列交叉的字為“國”,當電筆點到字表上的“國”字時,機器自動將該字的代碼2590輸入。鍵盤上或字表中字按部首或按音序或按字義聯想而排列。不常用的字作為盤外字或表外字,另行編碼處理。
②字形分解法:將漢字的形體分解成筆畫或部件,按一定順序輸進機器。筆畫一般分成 8種:橫(一)、豎(丨)、撇(丿)、點(丶)、折(乛)、彎(乚)、叉(十)、方(口)。部件一般歸納出一二百個。由於一般鍵盤上只有42個鍵(包括數字和標點),容納不下這麼多部件,因而有人設計中鍵盤,也有人利用部件形體上的相似點或出現概率的不同,而把100多個部件分佈在26個字母鍵上。
③字形為主、字音為輔的編碼法:這種編碼法與字形分解法的不同在於還要利用某些字音信息。如有的方案為了簡化編碼規則,縮短碼長,在字形碼上附加字音碼,有的方案為了採用標準英文電傳機,將分解歸納出來的字素通過關係字的讀音轉化為拉丁字母。
④全拼音輸入法:絕大多數是以現行的漢語拼音方案為基礎進行設計。關鍵問題是區分同音字,因而有的方案提出“以詞定字”的方法,還有的方案提出“拼音-漢字轉換法”,即“漢語拼音輸入 ──機內軟體變換(實為查機器詞表)──漢字輸出”系統。
⑤拼音為主、字形為輔的編碼法:一般在拼音碼前面或後面再添加一些字形碼。拼音碼有用現行漢語拼音方案或稍加簡化的,還有的為了縮短碼長而把聲母和韻母都用單字母或單字鍵表示的“雙拼方案”或“雙打方案”。如F鍵既表聲母F,又表韻母ang,連擊兩下,便是Fang“方”字。區分同音字的字形碼也多種多樣。除了大部分採用偏旁部首的信息外,還有採用起末筆或採用語義類別的。

優缺點


上述各種編碼法,各有短長。例如,字表法的特點是一字一格(鍵),無重碼,直觀性好,操作簡單。缺點是需特製鍵盤,速度較慢。字形分解法的好處是按形取碼,不涉及字音,因而不認識的字(包括生僻字、古字)也同樣可以編碼輸入;但漢字形體結構非常複雜,寫法也有許多差異,分解標準不易統一,因而不少方案規則較多。拼音輸入法(包括拼音-漢字轉換法)的優點是操作簡捷,可以“盲打”,不受漢字簡化、字形改變的影響,符合拼音化方向,並且還便於作進一步信息處理;缺點是不認識的字無法輸入;另外,如果不加字形碼或不用以詞定字法或顯式選擇法,同音字較難處理。