見字識碼
見字識碼
“見字識碼”是已故中國科學院院士支秉彝先生於上世紀70年代發明的,可以說比五筆還要早。不過,到了80年代五筆字型大流行過後,“見字識碼”並沒有得到普及。到了2000年後,“見字識碼”輸入法漸漸由“元碼”類輸入法接替,其中,模糊元碼輸入法是“見字識碼”的佼佼者。
元碼輸入法由吳宗怡先生於1999年基於“吳→口天→wkt”的基本理念創建。除了使用音首編碼外,為有效分散重碼還將部分編碼任務人為地定義到5個韻母“a、o、e、i、u”上,並定義“v”鍵為模糊處理鍵。
元碼輸入法經過10年的磨練,認為精確選定一鍵字對於一個輸入法的效率是很重要的,在經過反反覆復的實踐和測試后,元碼輸入法確定的25個一鍵字為:
上不出的這發國,
和一就可了民內。
中平氣,人是同;
水…我,小有在。
移位是一種重碼分散技術,規定將部分編碼任務,尤其是編碼任務較重的鍵“z、s、y”3鍵移位至韻母“a、o、e、i、u”上。這種技術處理有如下幾點明顯的優點: 1. 只要認定是移位字,編碼是可以從該字拼音中導出的,這樣,就可以減少記憶;
2. 將編碼任務較重的鍵中移位至編碼任務輕的韻母,有利於充分發揮有限的鍵盤資源。理論上說,當各鍵的編碼任務較均衡時,重碼最底;
3. 輸入法系統移位后,使編碼空間真正擴展至26×26×26×26,使編碼空間最大化。
元碼中經反覆測試認定的30個移位字或相關部件如下:
A | 上三山長羊(⺶⺷) |
E | 這 |
I | 一十示(礻)絲(糹糸)衣(衤) |
O | 中又走(辶)尤手(扌) |
U | 水(冫氵氺)雨魚 |
如:水(shui)→u、波→氵皮→bup、姜→?女→jan、魚→?田一→ud 或 udth。
部件的鍵盤映射對於“見字識碼”類輸入法來說從來不是問題,關鍵是如何精確確定其鍵盤映射的規則。元碼輸入法在多位中文信息專家如陶沙、華紹和、蔣順炳等老師的指導下,經過不懈的努力在長達10年的時間裡,最終精確認定55個定義的編碼非成字部件如下:
丷 | 八 | 卩 | 耳 | 冂 | 框 | 扌 | 手 | 學 | 小 |
宀 | 寶 | ⺋ | 耳 | 耂 | 老 | 飠 | 食 | 覀 | 西 |
冖 | 寶 | 囗 | 方 | 朩 | 木 | 冫 | 水 | 肩 | 月 |
疒 | 病 | | 戈 | 牜 | 牛 | 氵 | 水 | ⺶ | 羊 |
艹 | 草 | 灬 | 火 | ⺧ | 牛 | 氺 | 水 | 姜 | 羊 |
刂 | 刀 | 虍 | 虎 | 風 | 幾 | 亠 | 頭 | 衤 | 衣 |
リ | 刀 | 釒 | 金 | 亻 | 人 | 攵 | 文 | 訁 | 言 |
⺈ | 刀 | 犭 | 犬 | 彳 | 人 | 夂 | 文 | 辶 | 走 |
堅 | 刀 | 廴 | 建 | 糹 | 絲 | 忄 | 心 | 爫 | 爪 |
介 | 刀 | 匚 | 框 | 糸 | 絲 | ⺗ | 心 | ⺮ | 竹 |
阝 | 耳 | 凵 | 框 | 礻 | 示 | ⺌ | 小 | ⻊ | 足 |
如:關→丷天→gbt、寶→宀玉→bby、軍→冖車→jbc、病→疒丙→bbb、芹→艹斤→qcj、劉→文刂→lwd、帥→リ巾→sdj、爭→?~→zdv、臨→リ~~→ldvv、介→人リ→jrd、隊→阝人→der……
所謂模糊處理指對於未定義部件的模糊處理方式。元碼中將全部“臭蟲”(未定義部件)放入一個“籃子”里,這樣,問題就變得十分簡單,只能精確識別定義的55個部件,那麼,其餘的部件都在一個鍵位中,元碼中的模糊處理鍵是“v”鍵。如:妻→qvn 庸→ygv 敢→gvw 貴→gvb 朝→cvy 罪→zvf 句→jvk 青→qvy……
“v”鍵在元碼中有“化腐朽為神奇”的功效。漢字中類似以上列舉的“臭蟲”(未定義部件),數目繁多,各種輸入法為了能處理這些“臭蟲”想方設法,絞盡腦汁,效果也不盡人意。所幸這個難題在元碼中是不解而解的,實現“最難”→“最易”的神奇轉化。
或許大家會懷疑,元碼中作這種簡化處理是不是在“v”鍵會堆積很多的重碼?答案是元碼中的30個移位字已經起到有效分散重碼的作用,因此“v”鍵的編碼任務恰好做到不多不少,這個結果是大家始料未及的,這正好是漢字能實現與鍵盤abc無縫對接的關鍵。
“見字識碼”這是漢字與鍵盤abc映射時本來就要求的,只是在“見字識碼”技術的發展早期,還不能較好地解決高速盲打或重碼問題,與五筆字型相比,就一直沒有得到人們的重視。不過,隨著元碼輸入法的進步,實現高速盲打已不再是問題。“三十年河東,三十年河西”,自1980年算起,五筆字型至今已發展了30年,其本身的缺陷也被人們清楚地認識。元碼的興起,並取代五筆字型這是歷史發展的必然。