字素
字素
術語,是由語音學里的“音位”(音素)類推到文字學的。在拼音文字系統當中,“字素”是最小的,數量最少的區別性單位。
字素(英語:grapheme)這個“字素”是一個抽象單位。例如:字素,無論它的形式是A,a,或是α,它們都區別於b,c,d等等,所以,A,a,α仍然屬於一個單位,為組成字素的成員。組成一個字素的成員叫“字素變體”(allographs)。計算一個文字系統的規模時,是以字素這個最小單位來計算的,而不是以字素變體。如:英文字母表當中雖然印有52個大小寫變體,但是仍然說英文字母有26個,即26個字素。
計算漢字數量時,通常是按照字形來計算的,即將一個代表相同語音語義的字的簡化,繁體,異體,新字形,舊字形等等分別進行計算。這種計算方式實為是在計算變體。所以,長期以來錯誤地把大型字典里收入的字形數看作是漢字系統的規模。
2004年德國有人對幾本大型漢語字典收錄的變體數量進行了研究,得出的結果是:
1.經過幾千年的積累,漢字系統的規模(總量)為:26,000左右個單位(類似拼音文字系統的字素單位);
2.《康熙字典》(42,176字(不包《備考》里的音義不詳字))、《漢語大字典》(54,709字)、《中華字海》(85,586字)、台灣教育部《異體字字典》(106,000多)收字數量的差別在於:后出版的字典大量地增加變體,及不應該算作字和漢語漢字的符號(不成字的部件;日、朝、越及中國少數民族仿漢字造的字元等等),而字素單位數量並沒有增加多少。這四本字典的核心部分(字位單位數)是基本相當的,《康熙字典》只少約1,000個。
另有延伸為文字素材之意。