漢字

最古老的文字之一

漢字(拼音:hàn zì,注音符號:ㄏㄢˋ ㄗˋ),又稱中文、中國字、方塊字,是漢語的記錄符號,屬於表意文字的詞素音節文字。世界上最古老的文字之一,已有六千多年的歷史。在形體上逐漸由圖形變為筆畫,象形變為象徵,複雜變為簡單;在造字原則上從表形、表意到形聲。除極個別漢字外(如瓩、兛、兣、呎、嗧等),都是一個漢字一個音節。需要注意的是,日本、韓國、朝鮮、越南等國在歷史上都深受漢文化的影響,甚至其語文都存在借用漢語言文字的現象。

現代漢字是指楷化后的漢字正楷字形,包括繁體字和簡體字。現代漢字即從甲骨文、金文、籀文篆書,至隸書、草書、楷書、行書等演變而來。漢字為漢民族先民發明創製並作改進,是維繫漢族各方言區不可或缺的紐帶。現存最早可識的漢字是約公元前1300年殷商的甲骨文和稍後的金文,再到秦朝的小篆 和隸書,至漢魏隸書盛行,到了漢末隸書楷化為正楷,盛行於魏晉南北朝,至今通行。

漢字是迄今為止持續使用時間最長的文字,也是上古時期各大文字體系中唯一傳承至今者,中國歷代皆以漢字為主要官方文字。在古代,漢字不單中國使用,在很長時期內還充當東亞地區唯一的國際交流文字,20世紀前都是日本、朝鮮半島、越南、琉球等國家官方的書面規範文字,東亞諸國都有一定程度地自行創製漢字。非漢語體系中,日本人自行簡化漢字制定了日本新字體,韓國也制定了官方的朝鮮漢字使用規範;而歷史上曾使用過漢字的越南、朝鮮、蒙古等國,現今已廢棄漢字。

漢字源流


漢字起源說

漢字
漢字
倉頡造字的古老傳說到100多年前甲骨文的發現,歷代中國學者一直致力於揭開漢字起源之謎。關於漢字起源的說法歷來各家有不同主張,其中比較有影響力的說法有:結繩說、八卦說、刻契說、倉頡造字說、刻劃說和圖畫說。
結繩說:在文字產生之前,古人們靠結繩記事、認事,此舉起到了幫助人們記憶的作用。《周易·繫辭下》:“上古結繩而治,後世聖人易之以書契,百官以治,萬民以察。”漢代鄭玄註:“結繩為約,事大,大結其繩;事小,小結其繩。”《莊子·胠篋》篇云:“昔者容成氏、大庭氏、伯皇氏、中央氏、栗陸氏、驪畜氏、軒轅氏、赫胥氏、尊盧氏、祝融氏、伏羲氏神農氏,當是時也,民結繩而用之。”又如《周易正義》引《虞鄭九家義》: “古者無文字,其有約誓之事,事大大結其繩,事小小結其繩。結之多少,隨物眾寡;各執以相考,亦足以相治也。”東漢以後,不少人把漢字起源附會於結繩。
八卦說:關於八卦的起源說法不一,有摹象說、星象說、數說和楊雄的“亥”為物之源說等等。《周易·繫辭》云:“古者庖犧氏之王天下也,仰則觀象於天,俯則觀法於地,觀鳥獸之文與地之宜,近取諸身,遠取諸物,於是始作八卦,以通神明之德,以類萬物之情。”這段話提到八卦源自庖犧氏對自然客觀世界的摹象,這與“依類象形”而作的漢字的起源是相似的。孔安國《尚書》序(屬偽作,但年代甚古)里說:“古者庖犧氏之王天下也,始畫八卦,造書契,以代結繩之政,由是文籍生焉。”把八卦和書契(文字)的作用相提並論,把漢字的起源與八卦聯繫起來。
倉頡造字說:相傳倉頡是黃帝時期的史官,漢字的創造者。黃帝是古代中原部落聯盟的領袖,由於社會進入較大規模的部落聯盟階段,聯盟之間外交事務日益頻繁,故迫切需要建立一套各盟聯共享的交際符號,於是搜集及整理共享文字的工作便交在史官倉頡的手上了。《韓非子·五蠹》:“古者倉頡之作書也,自環者謂之私,背私謂之公,公私之相背也,乃倉頡固以知之矣。”
倉頡畫像
倉頡畫像
“倉頡造字說”在戰國時即已流行。 《呂氏春秋·君守》說:“倉頡作書,后稷作稼。”到了秦漢時代,這種傳說更加盛行。漢許慎說文解字序》:“黃帝之史倉頡,見鳥獸蹄迒之跡,知分理之可相別異也,初造書契。”和“倉頡之初作書,蓋依類象形,故謂之文。其後形聲相益,即謂之字。文者,物象之本;字者,言孳乳而寖多也。”現代學者認為,成系統的文字工具不可能完全由一個人創造出來,倉頡如果確有其人,應該是文字整理者或頒布者。
刻契說:刻契是古人在結繩記事後又一種幫助記憶的實物記事法,多作契約用,比結繩記事進步多了。“契”就是在木條上或竹條上刻上刻痕。《釋名·釋書契》:“契,刻也,刻識其數也。”《周易·繫辭》鄭玄註:“書之於木,刻其側為契,各持其一,后以相符合。”鄭玄又在《周禮·質人》注里說:“書契,取予市物之券也。其券之象書兩札,刻其側。”《列子·說符篇》:“宋人有游於道,得人遺契者,歸而藏之,密數其齒。”所說的“齒”即是質契上所刻的齒痕。這種刻契具有記事記數的作用,可以作為契約的憑證,也可以用來傳遞信息。刻契的一些符號與某些漢字形體相似。如“一、二、三、亖、”與漢字數字“一、二、三、四、五”的古文字別無二致。宋末元初戴侗提出“書始於契,契以記數”而“各如其數”認為“刻識其數”的契刻是原始文字的一個源頭。
刻劃說:郭沫若先生立足於半坡陶符與殷商甲骨文的比較考察,認為早期的文字可以從結構上分為“刻劃”和“圖畫”兩大系統,“刻劃系統是結繩、契木的演進,為數不多,這一系統應該在圖形系統之前”。從半坡和姜寨發現的刻劃符號來看,有的是數字,有的是單字。許多現代學者認為它已有固定的音形義,當為漢字之源頭。
鄭州大學博士生導師王蘊智認為:中國最早的刻劃符號出現在河南舞陽賈湖遺址,距今已有8000多年的歷史。對這些原始材料做一番全面的整理,從而爬梳排比出商代文字之前漢字發生、發展的一些頭緒。然而情況並不那麼簡單,除了已有鄭州商城遺址、小雙橋遺址(該遺址先後發現10餘例商代早期朱書陶文)的小宗材料可以直接和殷墟文字相比序之外,其它商以前的符號則零星分散,彼此缺環較多,大多數符號且與商代文字構形不合。還有一些符號地域色彩較重、背景複雜。
王蘊智認為,漢字體系的正式形成應該是在中原地區。漢字是獨立起源的一種文字體系,不依存於任何一種外族文字而存在,但它的起源不是單一的,經過了多元的、長期的磨合,大概在進入夏紀年之際,先民們在廣泛吸收、運用早期符號的經驗基礎上,創造性地發明了用來記錄語言的文字元號系統,在那個時代,漢字體系較快地成熟起來。
據悉,從考古發掘的出土文字資料來看,中國至少在虞夏時期已經有了正式的文字,如考古工作者曾經在山西襄汾陶寺遺址所出的一件扁陶壺上,發現有毛筆朱書的“文”字。這些符號都屬於早期文字系統中的基本構形,可惜這樣的出土文字信息迄今仍然稀少。大約在距今六千年的半坡遺址仰韶文化遺址的陶器外壁,已經出現刻劃符號,共達五十多種。它們整齊規劃,並有一定規律性,具備簡單文字的特徵,可能是我國文字的萌芽。
河圖洛書說
河圖洛書說
圖畫說:關於漢字的起源,歷史上曾盛行“河圖洛書說”。《周易·繫辭上》:“河出圖,洛出書,聖人則之。”《竹書紀年》指出:“黃帝軒轅五十年秋七月庚申,鳳鳥至,帝祭於洛水”沈約註:“龍圖出河,龜書出洛,赤文篆字,以授軒轅。”《河圖·玉版》:“倉頡為帝,南巡狩,發陽虛之山,臨於元扈洛之水,靈龜負書,丹甲青文,以授之。”部分近現代學者認為,漢字真正起源於原始圖畫。一些出土文物上刻劃的圖形,很可能與文字有淵源關係。漢字主要起源於記事的象形性圖畫,象形字是漢字體系得以形成和發展的基礎。
沈兼士先生在1927年提出了漢字起源於記事的圖畫這一觀點,認為在古漢字之前還有一個“文字畫”的起源階段。沈兼士《從古器款識上推導六書以前之文字畫》:“蓋於六書文字時期以前,應尚有一階段,為六書文字之導源,今姑定名為‘文字畫時期’”。文字畫是向文字進化的記事性圖畫,具有亦畫亦字的特點,初步具備了文字記錄信息的可識性功能。關於記事圖畫與記詞文字的聯繫與區別,沈兼士先生講得尤為精闢:“文字畫為摹寫事物之圖象,而非代表言語之符號,雖為象形字之母型,而不得徑目為六書象形指事之文。”
在距今約四五千年的大汶口文化遺址晚期和良渚文化遺址的陶器上,發現有更整齊規則的圖形刻劃,是早期的圖形文字。

漢字演變

經歷階段
漢字主要起源於記事的象形性圖畫,象形字是漢字體系得以形成和發展的基礎。後來的演變經歷了幾千年的漫長曆程,經歷了甲骨文、金文、篆書、隸書、楷書、草書、行書等階段,至今普遍使用楷書,但仍未完全定型。
• 甲骨文
甲骨文主要指殷墟甲骨文,是中國商代後期(前14~前11世紀)王室用於占卜記事而刻(或寫)在龜甲和獸骨上的文字。
發現有大約15萬片甲骨,4500多個單字。這些甲骨文所記載的內容極為豐富,涉及到商代社會生活的諸多方面,不僅包括政治、軍事、文化、社會習俗等內容,而且涉及天文、曆法、醫藥等科學技術。從甲骨文已識別的約1500個單字來看,它已具備了“象形、會意、形聲、指事、轉注、假借”的造字方法,展現了中國文字的獨特魅力。中國商代和西周早期(約公元前16~前10世紀)以龜甲、獸骨為載體的文獻。
• 金文
金文是指鑄刻在殷周青銅器上的文字,也叫鐘鼎文。商周是青銅器的時代,青銅器的禮器以鼎為代表,樂器以鍾為代表,“鐘鼎”是青銅器的代名詞。所以,鐘鼎文或金文就是指鑄在或刻在青銅器上的銘文。
所謂青銅,就是銅和錫的合金。中國在夏代就已進入青銅時代,銅的冶鍊和銅器的製造十分發達。因為周以前把銅也叫金,所以銅器上的銘文就叫作“金文”或“吉金文字”;又因為這類銅器以鐘鼎上的字數最多,所以過去又叫作“鐘鼎文”。
金文應用的年代,上自商代的早期,下至秦滅六國,約1200多年。金文的字數,據容庚《金文編》記載,共計3722個,其中可以識別的字有2420個。
銅器上的銘文,字數多少不等。所記內容也很不相同。其主要內容大多是頌揚祖先及王侯們的功績,同時也記錄重大歷史事件。如著名的毛公鼎有497個字,記事涉及面很寬,反映了當時的社會生活。
• 大篆
大篆為漢字書體的一種。相傳為周宣王時史籀所作,故亦名籀文或籀書。秦時稱為大篆,與小篆相區別。大篆起於西周晚年,春秋戰國時期行於秦國。字體與秦篆相近,但字形的構形多重疊。代表為今存的石鼓文,以周宣王時的太史籀所書而得名。他在原有文字的基礎上進行了改革,因刻於石鼓上而得名,是流傳至今最早的刻石文字,為石刻之祖。
• 小篆
小篆也叫“秦篆”。秦朝李斯受命統一文字,這種文字就是小篆。通行於秦代。形體偏長,勻圓齊整,由大篆衍變而成。東漢許慎《說文解字·敘》稱:“秦始皇帝初兼天下……罷其不與秦文合者。”李斯作《倉頡篇》,中車府令趙高作《爰歷篇》,太史令胡毋敬作《博學篇》,“皆取史籀大篆,或頗省改,所謂小篆者也。”今存《琅琊台刻石》、 《泰山刻石》殘石,即小篆代表作。秦權上刻制的小篆,據說是李斯在秦始皇統一中國后,推行“書同文,車同軌”,統一度量衡的政策,由宰相李斯負責,在秦國原來使用的大篆籀文的基礎上,進行簡化,取消其他六國的異體字,創製的統一文字漢字書寫形式。一直在中國流行到西漢末年,才逐漸被隸書所取代。但由於其字體優美,始終被書法家所青睞。又因為其筆畫複雜,形式奇古,而且可以隨意添加曲折,印章刻制上,尤其是需要防偽的官方印章,一直採用篆書,直到封建王朝覆滅,近代新防偽技術出現。康熙字典上對所有的字還注有小篆寫法。
• 隸書
隸書基本是由篆書演化來的,主要將篆書圓轉的筆劃改為方折,書寫速度更快,在木簡上用漆寫字很難畫出圓轉的筆劃。
隸書也叫“隸字”、“古書”。是在篆書基礎上,為適應書寫便捷的需要產生的字體就小篆加以簡化,又把小篆勻圓的線條變成平直方正的筆畫,便於書寫,分秦隸古隸)和漢隸(今隸)。隸書的出現,是古代文字與書法的一大變革。隸書是漢字中常見的一種莊重的字體,書寫效果略微寬扁,橫畫長而直畫短,講究“蠶頭燕尾”、“一波三折”。它起源於秦朝,在東漢時期達到頂峰,書法界有“漢隸唐楷”之稱。也有說法稱隸書起源於戰國時期。
隸書是相對於篆書而言的,隸書之名源於東漢。隸書的出現是中國文字的又一次大改革,使中國的書法藝術進入了一個新的境界,是漢字演變史上的一個轉折點,奠定了楷書的基礎。隸書結體扁平、工整、精巧。到東漢時,撇、捺等點畫美化為向上挑起,輕重頓挫富有變化,具有書法藝術美。風格也趨多樣化,極具藝術欣賞的價值。
隸書相傳為秦末程邈在獄中所整理,去繁就簡,字形變圓為方,筆劃改曲為直。改"連筆"為"斷筆",從線條向筆劃,更便於書寫。"隸人"不是囚犯,而指"胥吏",即掌管 文書的小官吏,所以在古代,隸書被叫做"佐書"。隸書盛行於漢朝,成為主要書體。作為初創的秦隸,留有許多篆意,后不斷發展加工。打破周秦以來的書寫傳統,逐步奠定了楷書的基礎。在"罷黜百家,獨尊儒術"的思想統一下,是漢代隸書逐步發展定型,成為占統治地位的書體,同時,派生出草書、楷 書、行書各書體,為藝術奠定基礎。
• 楷書
歐陽詢楷作品
歐陽詢楷作品
楷書又稱正書,或真書,始於東漢。其特點是:形體方正,筆畫平直,可作楷模,故名。楷書的名家很多,創造出許多有代表性的字體,如“歐體”(唐·歐陽詢)、“虞體”(唐·虞世南)、“顏體”(唐·顏真卿)、“柳體”(唐·柳公權)、“趙體”(宋元·趙孟頫)等。初期楷書仍殘留極少的隸筆,結體略寬,橫畫長而直畫短。在傳世的魏晉帖中,如鍾繇的《宣示表》、《薦季直表》、王羲之的《樂毅論》《黃庭經》等,可為代表作。觀其特點,正如翁方綱所說:“變隸書之波畫,加以點啄挑,仍存古隸之橫直”。
東晉以後,南北分裂,書法亦分為南北兩派。北派書體,帶著漢隸的遺型,筆法古拙勁正,而風格質樸方嚴,長於榜書,這就是所說的魏碑。南派書法,多疏放妍妙,長於尺牘。南北朝,因為地域差別,個人習性、書風迥然不同。北書剛強,南書蘊藉,各臻其妙,無分上下,而包世臣與康有為,卻極力推崇兩朝書,尤重北魏碑體。康氏舉十美,以強調魏碑的優點。
唐代的楷書,亦如唐代國勢的興盛局面,真所謂空前。書體成熟,書家輩出,在楷書方面,唐初的虞世南、歐陽詢、褚遂良中唐的顏真卿、晚唐的柳公權,其楷書作品均為後世所重,奉為習字的模範。楷書為現代常用的標準。
• 草書
懷素草書作品
懷素草書作品
草書形成於漢代,是為書寫簡便在隸書基礎上演變出來的。有章草今草狂草之分。草書為書寫便捷而產生的一種字體。始於漢初。當時通用的是“草隸”,即潦草的隸書,後來逐漸發展,形成一種具有藝術價值的“章草”。漢末,張芝變革“章草”為“今草”,字的體勢一筆而成。唐代張旭懷素又發展為筆勢連綿迴繞,字形變化繁多的“狂草”。草書為書法家所常用。
章草筆劃省變有章法可循。代表作如三國時期吳國皇象《急就章》的松江本。
今草不拘章法,筆勢流暢。代表作如晉代王羲之《初月》、《得示》等帖。
狂草出現於唐代,以張旭、懷素為代表,筆勢狂放不羈,成為完全脫離實用的藝術創作,從此草書只是書法家臨摹的書法作品。代表作如張旭《肚痛帖》、懷素《自敘帖》。
• 行書
行書作品
行書作品
行書大約是在東漢末年產生的,是介於楷書、草書之間的一種字體,可以說是楷書的草化或草書的楷化。它是為了彌補楷書的書寫速度太慢和草書的難於辨認而產生的。筆勢不像草書那樣潦草,也不要求楷書那樣端正。楷法多於草法的叫“行楷”。草法多於楷法的叫“行草”。代表人物:“二王”:王羲之,王獻之

考古發現

賈湖刻符
賈湖刻符
中國考古界先後發布了一系列較殷墟甲骨文更早、與文字起源有關的出土資料。賈湖刻符經碳14物理測定,距今約7762年(±128年)歷史;七千年前的雙墩刻符、六千年前的半坡陶符、五千多年前青墩遺址刻符、連字成句的庄橋墳遺址文字、大汶口陶尊符號、堯舜時代的陶寺遺址朱文。早期的刻劃符號與骨刻文就是豐富的文字系統,後期的屬於初步成熟階段。這些考古發現可能是漢字起源的重要線索,也可能是各種文字發展的不同源流。
20世紀80年代初,在河南登封夏文化遺址發掘出的陶器上,發現了更完備的文字。當時被學者們確認的迄今為止我國有確切時代的最早的文字。

漢字知識


漢字
漢字
漢字是世界上最古老的文字之一,至少有數千年的歷史,現存最早的原始文字是記事性圖畫和刻符,可識的成熟漢字系統是商代的甲骨文。
漢字是表意文字,一個漢字通常表示漢語里的一個詞或一個語素,這就形成了 音、形、義統一的特點。漢字是由筆畫構成的方塊狀字,所以又叫方塊字。如“車”“上”“明”等,“車”“上”“明”用字的形體來直接表達語言里的詞義;“問”既能表意又能表音,“門”表音,“口”表意。
漢字由最原始的石刻字元在幾千年的演變過程中形成了“漢字七體”,即:甲骨文、金文、篆書、隸書、草書、楷書、行書。

名稱

• 官話
- 漢語拼音:Hànzì
- 威妥瑪拼音: Han4-tzu4
- 注音符號:ㄏㄢˋ ㄗˋ
• 閩語
• - 福州話羅馬字:háng-cê
• - 閩南語白話字: hàn-jī
• - 潮州話拼音: hang3 ri7
• 吳語
• - 上海話拼音:[høz]
• 粵語
• - 粵拼 hon3zi6
• 贛語
• - 贛語白話字 hon5ci5
• 客家語
• - 客家話拼音 hon55 sii55
• 中古漢語
• - 中古漢語 xanCdzɨC

歷史

傳說倉頡造漢字。《說文解字》記載倉頡見鳥獸的足跡受啟發,分類別異,加以搜集、整理和使用,在漢字創造的過程中起了重要作用,被尊為“造字聖人”。
商朝,目前已知最早的成熟漢字甲骨文出現,稍後出現的鐘鼎文雖有字數的增加,但形體並無大的變化。
周朝,由於疆域廣闊且諸侯割據日久,漢字在春秋晚期明顯出現諸侯國之間文字異形,戰國時期的文字異形情況更重。秦統一後為鞏固統治,秦始皇令丞相李斯、中車府令趙高、太史令胡毋敬等整理文字,以秦國大篆為基礎制定出小篆,作為標準字體,通令全國使用。稍後,普遍又依當時民間流行的字體,整理出更簡便的字體隸書,並作為通用文字在全國廣為流傳。
東漢末期,楷書出現,至此漢字的演化已臻完善。不僅如此,東漢時出現了第一部書法專著《草書勢》。
過去常講漢字始於商代的甲骨文,但其實甲骨文已經是成熟文字,在此之前漢字應該存在一段從產生到成熟的發展過程,因此有人主張推至夏末;也有人主張推至夏以前,各執己見。郭沫若在《古代文字之辯證的發展》指出:“漢字究竟源始於何時呢?我認為,這可以從西安半坡村遺址距今的年代為指標。”,“半坡遺址年代距今有六千年左右。”,“半坡遺址是新石器時代仰韶文化的典型”,“半坡彩陶上每每有一些類似文字的簡單刻劃,和器上的花紋判然不同。”“雖然刻劃的意義至今尚未闡明,但無疑是具有文字性質的符號。”“可以肯定地說就是中國文字的起源,或者中國原始文字的孑(jié)遺。”如按此說,中國文明則應算成近六千年。中國文字之源始,究竟在何時?最古老的文字產生於什麼時代?分別代表什麼含義?至今仍未達成一致意見,有待於大量的材料來說明。

數量

漢字
漢字
漢字的數量並沒有準確數字,大約將近十萬個(北京國安咨訊設備公司漢字字型檔收入有出處漢字91251個),日常所使用的漢字只有幾千字。據統計,1000個常用字能覆蓋約92%的書面資料,2000字可覆蓋98%以上,3000字則已到99%,簡體與繁體的統計結果相差不大。
關於漢字的數量,根據古代的字書和詞書的記載,可以看出其發展情況。
秦代的《倉頡》、《博學》、《爰歷》三篇共有3300字;漢代揚雄作《訓纂篇》有5340字,到許慎作《說文解字》就有9353字了;據唐代封演《聞見記·文字篇》所記,晉呂忱作《字林》有12824字,後魏楊承慶作《字統》有13734字,南朝時顧野王所撰的《玉篇》據記載共收16917字,在此基礎上修訂的《大廣益會玉篇》則據說有22726字;唐代孫強增字本《玉篇》有22561字。宋代司馬光修《類篇》多至31319字,宋朝官修的《集韻》中收字53525個,曾經是收字最多的一部書;清代《康熙字典》有47000多字了;1915年歐陽博存等編著的《中華大字典》有48000多字;1959年日本諸橋轍次主編的《大漢和辭典》有49964字;1971年張其昀主編的《中文大辭典》有49888字;1990年徐仲舒主編的《漢語大字典》有54678字;1994年冷玉龍等編著的《中華字海》有85000字。台灣地區教育主管機關編撰的《異體字字典》第五版,內容含正字與異體字,共106230字,是收錄較多漢字的字典。藍德康和松岡榮志主編的《漢字海》是目前世界上收錄漢字最多的工具書,正文收列字頭單字102434個,附錄收列字頭單字11112個。
歷史上出現過的漢字總數有8萬多(也有6萬多的說法),其中多數為異體字和罕用字。絕大多數異體字和罕用字已被規範掉,除古文之外一般只在人名、地名中偶爾出現。此外,繼第一批簡化字后,還有一批“二簡字”,已被廢除,但仍有少數字在社會上流行。
如果學習和使用漢字真的需要掌握七八萬個漢字的音形義的話,那漢字將是世界上沒人能夠也沒人願意學習和使用的文字了。但是《中華字海》一類字書里收錄的漢字絕大部分是“死字”,也就是歷史上存在過而今天的書面語里已經廢置不用的字。據統計,十三經(《易經》、《尚書》、《公羊傳》、《論語》、《孟子》等13部典籍)全部字數為589283個字,其中不相同的單字字數為6544個字。因此,實際上人們日常使用的漢字不過六千多而已。
在漢字計算機編碼標準中,最大的漢字編碼是台灣地區的CNS11643,5.0版全字型檔可供查詢的字共87,047個漢字、10771個拼音文字及894個符號。台港民間通用的大五碼收錄繁體漢字13053個。GB18030是中華人民共和國現時最新的內碼字集,GBK收錄漢字簡體、繁體及20912個,而早期的GB2312收錄簡體漢字6763個。Unicode的中日韓統一表意文字基本字集則收錄漢字20902個,總數亦高達七萬多字。
初期的漢字系統字數不足,很多事物以通假字表示,使文字的表述存在較大歧義。為完善表述的明確性,漢字經歷了逐步複雜、字數大量增加的階段。漢字數量的過度增加又引發了漢字學習的困難,單一漢字能表示的意義有限,於是有許多單一的漢語意義是用漢語詞語表示,例如常見的雙字詞。漢語書寫的發展多朝向造新詞而非造新字。殷墟的甲骨文及更早、與漢字起源有關的出土資料,這些資料主要是指原始社會晚期及有史社會早期出現在陶器上面的刻畫或彩繪符號,另外還包括少量的刻寫在甲骨、玉器、石器等上面的符號,可以說,它們共同為解釋漢字的起源提供了新的依據。

構造

漢字是“形、音、義”的結合體,大多數漢字是由形旁和聲旁組成的。
象形
象形
六書是漢字構字的基本原理。在《周禮》中就提到了六書,只是沒有說明具體內容。到了東漢,許慎在《說文解字》中,詳細闡述了“六書”構造原理:象形、指事、會意、形聲、轉注、假借。
象形:這種造字法是依照物體的外貌特徵來描繪出來,所謂“畫成其物,隨體詰詘”是也。如日、月、山、水等四個字,最早就是描繪日、月、山、水之圖案,後來逐漸演化變成如今的造型。
瓜是一個象形字。“瓜”字中,兩撇表示藤,中間豎鉤表示瓜,捺表示葉。“葫蘆科植物的統稱”就是“瓜”的本義。“形狀像瓜”,在現實生活中有很多東西像瓜形的,比如,“瓜皮帽”是帽子的一種;“瓜皮船”是船的一種。“像切瓜一樣”,瓜的命運是要被切分的,由此引申出此義。人們用“瓜分”表示分割或分配。又指若干強國聯合起來分割弱小或不發達國家的土地。“傻瓜”,表示不聰明,這一詞來自古代的“瓜子族”,春秋時期生活在瓜州(甘肅敦煌一帶)姜姓人被稱為“瓜子族”,他們十分勤勞,受人雇傭時總是一刻不停地幹活,可是有些人把他們這種老實的習俗看作“傻”,於是就有了“傻瓜”了。
指事:這是指表現抽象事情的方法,用象徵的符號,或在象形字上加上符號來表示某個詞。所謂“各指其事以為之”是也。如人在其上寫作“上”,人在其下寫作“下”,“刃”,在刀口上加一點,表示這裡最鋒利,這就是刀刃,等等。自大一點就是“臭”,“富”有田的人,“窮”靠用“力”打工,“賤”的繁體是“賤”,右邊兩個“戈”,為錢而爭鬥,自然是“賤”。
形聲:形聲字由表示意義的形旁和表示讀音的聲旁兩部分組成。拿構造最簡單的形聲字來說,形旁和聲旁都是由獨體字充當的。作為形聲字的組成部分,這些獨體字都是有音有義的字。不過形旁只取其義,不取其音,例如“鳩”字的偏旁“鳥”;聲旁則只取其音,不取其義,例如“鳩”字的偏旁“九”。再例如胡。這個字也可為一個聲旁,結合不同的形旁,可合成為:蝴、蝴、湖、葫、瑚、醐等等,而以同樣的發音(也有的只有聲母一樣),表達不同的事物。形聲是漢字里造字最多的方法和神韻。
形聲字的形旁和聲旁有四種組合方式:
• 左形右聲:情、憶、哼、獷、構、描……
• 右形左聲:期、戰、鸚、鳩、領、飄……
• 上形下聲:宇、笆、霧、草、景、符……
• 下形上聲:盂、貨、娶、基、裘、盒……
• 內形外聲:聞、問、悶、瓣、辮、辯……
• 外形內聲:園、囤、病、衷、閣、匣……
• 形佔一角:疆、騰、栽、裁、載……
有些形聲字,隨著漢字的改革表音部分的讀音有了變化,已經不起表音的作用了,如果再讀半邊就要鬧笑話。“秀才識字讀半邊”又成了對“秀才”們讀錯字的諷刺。
會意:這種造字法,是用兩個或幾個字組成一個字,把這幾個字的意義合成一個意義。如“日”和“月”組起來,就是日光加月光變成“明”。“人”字和“言”字合成“信”字,意思就是人過去所言有信,就是這個人很遵守自己說過的話,“休”,“人”和“木”合在一起,一個人靠在樹上,表示休息。
有些會意字是兩個或幾個同樣的字重疊組成的。二字重疊的多是左右的並列結構,三字重疊的多是塔型的上下結構,看起來像體操活動中的疊羅漢。例如三個“人”組成“眾”;三個“火”組成“焱”;三個“木”組成“森”;三個“日”組成“晶”;三個“直”組成“矗”;三個“水”組成“淼”;三個“口”組成“品”等。
會意字由於字形的變化太大,已看不出它們的字源了。例如婦女的婦字,為什麼在女旁加個歪山呢?正確的字源分析只能從繁體字“婦”中才能看出。這個“婦”字左邊的“女”旁指婦女,女旁的“帚”是掃帚,前後合在一起的意思是婦女拿著掃帚在家裡勞動。“女、帚為婦”和“力、田為男”是符合當時的“女內男外”、“男耕女織”的社會情況的。這類不容易看出字源的字相當多,人們叫作“破體字”。
“她”是現代漢語里常用的一個人稱代詞,專指第三者的女性。此字是古代“姐”字的異體,20世紀20年代由劉半農首先作為第三人稱女性代詞使用,並非新造字。
轉註:這是用於兩個字互為註釋,彼此同義而不同形,漢代許慎解釋道:“建類一首,同意相受,考、老是也。”這怎麼說呢?此二字,古時“考”可作“長壽”講,“老”、“考”相通,意義一致,即所謂老者考也,考者老也。《詩經·大雅·棫樸》亦云:“周王壽考”。
假借:此法簡言之,就是借用一字,去表達別的事物。一般來說,有一個無法描述的新事物,就借用一個發音接近或是屬性近似的字根,來表達這個新事物。例如“又”,本來是指右手(最早見於甲骨文),但後來被假借當作“也是”的意思。又如“聞”,本意是用耳朵聽的意思,《大學》中就有“視而不見,聽而不聞,食而不知其味”,後來被假借成嗅覺動詞。
總結以上六書——前兩項,“造字法”也;中兩項,“組字法”也;后兩項,“用字法”也。總而言之,以上原理是古代文字學學者們群策群力歸納出來的文字學理論,其所含的漢字構成法則,並非一人獨創,是人們在使用過程中長期演化而成,是一代又一代集體智慧的結晶。

字形

漢字因形狀方正,有“方塊字”的別稱,從結構上來看,漢字有以下特色:
規整的字體(如楷書、宋體、隸書、篆書等)書寫下的漢字是一種方塊字,每個字佔據同樣的空間。漢字包括獨體字和合體字,獨體字不能分割,如“文”、“中”等;合體字由基礎部件組合構成,佔了漢字的90%以上。合體字的常見組合方式有:上下結構,如“笑”、“尖”;左右結構,如“詞”、“科”;半包圍結構,如“同”、“趨”;全包圍結構,如“團”、“回”;上中下結構,如“贏”;左中右結構,如“斑”;“品”字形結構,如“品”。漢字的基礎部件包括獨體字、偏旁部首和其他不成字部件。
漢字的最小構成單位是筆畫,筆畫也具有一定的含義,如橫畫(一),可表示地平線(如旦字中的一橫)等。
書寫漢字時,筆畫的走向和出現的先後次序,即“筆順”,是比較固定的。基本規則是,先橫后豎,先撇后捺,從上到下,從左到右,先外后內,先外后內再封口,先中間后兩邊。不同書寫體漢字的筆順可能有所差異。
漢字
漢字
從字體上分,可將各類漢字的字體分為三大類型。第一類是從宋代活字印刷發展起來的宋體、黑體(包括粗、細等線體)等;第二類是由書法演變而來的字體,如楷體、仿宋體、行楷、隸體、魏體、舒體、顏體、瘦金體以及鋼筆書寫的字體等;第三類是屬於美術字體,如綜藝、美黑、琥珀、水柱等。其他字體多是屬於以上三類字體的變異,例如:由宋體演變的大標宋、小標宋、報宋、長宋、中宋、姚體等;由黑體演變而成的大黑、平黑、粗黑、等線體(包括粗、中、細等線體,后又演變出粗、准、細圓體)等;由楷體、仿宋體等演變而來的中楷和細仿宋等;由黑體和宋體演變而來的美黑;由隸體演變而來的隸變體等。
筆畫最少的漢字只有一劃。有的字在書面上沒有,只在民間流傳“biang”是筆畫較多的漢字,有56筆,異體字共有45筆,繁體字共有59筆。“biangbiang面”是源於陝西的一種面,也是一家麵館的品牌,還在使用這個字,流傳不廣,近幾年方才流行,聲稱只能在康熙字典中查到“biang”字寫法。事實上,在康熙字典中查不到“biang”字的寫法。
關於biang,有一個字謎:
一點飛上天,黃河兩道彎,八字大張口,言字往裡走。
東一扭,西一扭。左一長,右一長,中間坐了個馬大王。
心字底,月字旁,打個勾勾掛麻糖
推個車車逛咸陽。
筆劃最多的漢字
筆劃最多的漢字
日文漢字有一個字有84畫之多,日語讀作“たいと”(Tai-To)。

注音

拼音
拼音
漢字是漢語的書寫文字,每個字代表一個音節。中國大陸現今以普通話作為標準讀音,普通話的音節由一個聲母、一個韻母及聲調確定,實際用到1300多個音節。由於漢字數目龐大,因而有明顯的同音字現象;同時還有同一字多音的情形,稱為多音字。這一情況在漢語各種方言中是普遍存在的。
有學者經研究認為:漢朝之前,一個漢字發音為兩個音節,次要音節和主要音節。由於漢字本身不表音,自漢朝到20世紀漢字在數量上、寫法上雖有變遷,但無法看出發音的變化。必須進行專門的研究才能推測它們在上古漢語和中古漢語的發音。漢字在日語中的讀音有“音讀”和“訓讀”之分,往往一個字有很多讀法,原因來自中國不同時期傳入日本的發音。
在近現代,為了表示一些外國制單位曾廣泛創造並使用多音節漢字,如“浬”(海里)、“嗧”(加侖)、“瓩”(千瓦)等。但是在大陸地區由於官方廢除已基本不使用,台灣仍在使用,一般人也明了其意思。
最早的注音方法是讀若法和直注法。讀若法就是用音近的字來注音,許慎的《說文解字》就採用這種注音方法,如“埻,射臬也,讀若准”。直注法就是用另一個漢字來表明這個漢字的讀音,如“女為說己者容”中,使用“說者曰悅”來進行注音。
以上兩種方法都有先天上不完善的地方,有些字沒有同音字或是同音字過於冷僻,這就難以起到注音的作用,例如“襪音韈”等。
魏晉時期發展出了反切法,據傳是受使用拼音文字的梵文影響。漢字的發音可以通過反切法進行標註,即用第一個字的聲母和第二個字的韻母和聲調合拼來注音,使得所有漢字發音都有可能組合出來。如“練,朗甸切”,即“練”的發音是“朗”的聲母與“甸”的韻母及聲調所拼成。
近代以來,又發展出了漢字形式的注音符號以及很多拉丁字母注音方法。注音符號仍是台灣地區教學的一部分,而目前中國大陸最為廣泛使用的是漢語拼音。
由於漢字以本身表意為主,注音方面較為薄弱。這個特性使得上下千年的文獻,不至於產生如同使用拼音文字的西方一樣,用字措辭太懸殊的差距,但也造成推斷古代聲韻的難度。例如“龐”從“龍”而得聲,但今日北京話前者讀“páng”,後者為“lóng”。如何解釋這樣的差異,就是音韻學所探討的課題。需要注意的還有聲調:陰平,陽平,上聲,去聲,輕聲(母音āáǎàa ōóǒòo ēéěèe īíǐìi ūúǔùu ǖǘǚǜü)

詞語

語素是漢文表意的最小單位,類比於英語的“辭彙”和“片語”的總稱。絕大多數漢字可以獨立構成語素,比如“我”,類比於英語中的單一字母構成的辭彙,比如“I”。現在白話文大多數詞語都是由兩個以上的漢字構成的,不過,和英語中“辭彙”和“字母”的關係不同,語素的意思往往和其中各個漢字獨立構成語素時的意思有相關性,因此相當程度上簡化了記憶。詞語包括語素和若干個語素形成的短語。
漢字的高效率,體現在幾百個基本象形字,可以合成表示天上地下的各種事物的上萬漢字;幾千個常用字,又可以輕鬆組合出數十萬詞語。

偏旁

偏旁,漢字合體字的組成部分。舊稱左為偏,右為旁。今泛稱合體字的左右上下任何一部分為偏旁。在漢字的結構中,偏旁是比筆畫大的構字部件,是構成漢字的基本單位。如“坡”中的“皮”是表示讀音的偏旁,“土”是表意的偏旁。

辭典

《中華大字典》
《中華大字典》
中國古代稱“字書”,直到《康熙字典》問世才稱“字典”。最早的漢語字 典是東漢許慎編的《說文解字》。近代大致可分為兩類,一類是綜合性的,如《新華字典》;一類是專門性的,如《異體字字典》。1915年,中華書局出版了《中華大字典》。
世界三大漢語詞典分別是中國大陸的《漢語大詞典》(共13冊,5.6萬詞條,37萬單詞)、中國台灣的《中文大辭典》(共10冊,5萬詞條,40萬單詞)以及日本的《大漢和辭典》(共13冊,4.9萬詞條,40萬單詞)。漢字是記錄漢語的文字,它已有六千年左右的歷史,是世界上最古老的文字之一。
“最中國”漢字“和”:2008年北京奧運會開幕式上,幾百名演員扮演的活字印刷字模通過不斷變幻,用大篆、小篆、楷書三種不同字體展現了同一個漢字――“和”。這一幕至今讓人津津樂道,而這個包含“和諧”“和平”“和睦”等意義的漢字,再度被評選為“最中國”的漢字。最新一期的《中華遺產》雜誌發布了該社組織的“100個最具中華文化意義的漢字”評選結果。“和”字贏得了網上投票的最高票數,也獲得了台灣“中央研究院”歷史語言研究所研究員李貞德等專家的大力推薦。

漢字特點


漢字是世界上最古老的文字之一,對周邊的影響也是非常巨大的,是其它文字的母字。它是記錄事件的書寫符號。在形體上逐漸由圖形變為由筆畫構成的方塊形符號,所以漢字一般也叫“方塊字”。它由象形文字(表形文字)演變成兼表音義的意音文字,但總的體系仍屬表意文字。所以,漢字具有集形象、聲音和辭義三者於一體的特性。這一特性在世界文字中是獨一無二的,因此它具有獨特的魅力。漢字是漢民族幾千年文化的瑰寶,也是我們終生的良師益友,每個人的精神家園。漢字往往可以引起我們美妙而大膽的聯想,給人美的享受。
漢字更是民族靈魂的紐帶,在異國他鄉謀生,漢字便是一種寄託,哪怕是一塊牌匾、一紙小條,上面的方塊字會像磁鐵般地吸引著你,讓你感受到來自祖國的親切。因為那中國人的情思已經濃縮為那最簡單的橫豎撇捺。每一筆,都是飽蘸著華夏碧血寫就的。在海外,無論你功成名就還是漂泊淪喪,只要有方塊字的伴隨,你就會有幾多慰藉幾多寄託,因為無論是象形還是指事,無論是會意還是形聲,每一個字都有深遠的來歷,每一個中國人就是那一撇一捺,已經成為方塊字的魂魄。
相較拼音文字的優點
世界各國使用的文字分為兩大類,即非拼音文字(漢字和水書)及拼音文字(其他文字)。當今世界上使用的文字中,漢字和水書屬於非拼音文字。
漢字演變
漢字演變
現今文字中,漢字是從商朝開始使用並演變至今。傳說梵文字母是創造宇宙之神大梵天所創造並授予人類(《大唐西域記》)其他文字很多都是借用四大字母系統的文字。婆羅米系列字母、拉丁字母、斯拉夫字母、阿拉伯字母被稱為世界四大字母體系。印度、尼泊爾、孟加拉國、緬甸、寮國、泰國、柬埔寨、中國西藏地區用婆羅米系列字母。英文、法文、義大利文等使用拉丁字母;俄文、保加利亞文、塞爾維亞文等使用基里爾字母(或斯拉夫字母),是希臘字母改造而成的;拉丁字母也是希臘字母改造而形成的。阿拉伯字母的祖先——阿拉馬字母(Aramaic)及希臘字母的祖先——迦南(Canaanite)字母也不是他們祖先直接創造的,而是借用了小方閃米特人(Semites)的文字(小方閃米特字母)改造而成的。這種字母借用了蘇美爾人(Sume)的楔形文字,並經過改造而成的。楔形文字是蘇美爾人創造的,聖書文字是埃及人創造的,漢字是漢族先民創造的,中國水族創造的水書,它們都不是拼音文字。四者之中只剩下漢字和水書,其他兩者都已經消亡了。
漢語的另一個奇特之處是它的超方言特性及超語言特性。語言學家把中國各地的方言分為八大方言區。有人說,如果沒有漢字,中國早就分裂成幾十個國家了。歐洲的義大利語、法語、西班牙語、葡萄牙語和羅馬尼亞語之間的差別比中國方言的差距小得多,但是他們絕不願意承認各自的語言是“羅曼語”的不同方言,因為它們都是獨立的國家。
漢字在世界歷史上,作為其它后發明的文字的母字,如越南、朝鮮和日本都曾經用漢字來記錄著它們的語言。日本人至今還使用漢字和假名的混合文字,使用漢字,還有另一項重大發明,就是寫中國字,讀日本詞。只要其他國家願意,他們也可以這樣做。如果真是這樣做了,漢字就成為國際通用的語言符號了,就像數學符號一樣,只表意,不表音。
漢字是世界上使用人數最多的文字。據統計,使用漢字和漢語的人數達到16億以上。
20世紀初葉,隨著西方文化的傳入,有人認為,中國之所以落後,漢字是罪魁禍首,主張將漢字廢掉。到了20世紀後半葉,計算機科學急劇發展,又有些人認為漢字阻礙了科學的發展,方塊字無法輸入電腦,又有一陣要廢除漢字的鼓躁。後來,這方面的問題解決了,質疑聲也隨之消散。
漢字是現在仍在使用的歷史最悠久的文字。現在能看到而又能認讀的最早的漢字是3000多年前的甲骨文。這已是相當成熟、相當系統的漢字了。世界上沒有一種文字像漢字那樣歷盡滄桑,青春永駐。古埃及5000年前的聖書字是人類最早的文字之一。但它後來消亡了,有記載的古埃及文化也被深深地埋藏起來了。蘇美爾人的楔形文字也有5000年的歷史。但在公元330年後,它也消亡了。歷史上衰亡的著名文字還有瑪雅文、婆羅米文等等。而漢字不但久盛不衰,獨矗世界文字之林,還不斷地得以發展,影響也越來越大。
1.優美
它已成為一種藝術——書法藝術。漢字的書法藝術是任何其它文字所無法相比的。下列的古代書法作品已經成為無價之寶。著名的有蘭亭序、神策軍紀聖功德碑、玄秘塔碑、祭侄稿等無數作品。
2.辨識度高
人類的眼睛視野總是一個面,而不是一條線,所以線性排列不易辨認;排成方塊一目了然。拼音文字=線形文字;漢字=方塊文字。漢字比拼音文字有更高的閱讀效率。
3.易懂,具有關聯性
例如,“被”是一個形聲字兼會意字。如果從形聲字的角度來看,“被”字左邊的“衣”字旁表示意義,說明被子是屬於衣物一類,右邊的“皮”字在造字的時代和“被”的讀音相似,表示這個字的讀音,但是隨著時間的推移,“皮”和“被”的讀音變得不一樣了,逐漸失去了它表讀音的功能。如果從會意字的角度來看,用皮做的衣物就是“被”。被的最初意義指的是一種小被子,到了後代,在被的本義基礎上又引申出“蒙受”等意義。
請比較下面一組中英文的詞:
漢字詞英文詞
cattle
calf
公牛bull
母牛cow
牛奶milk
牛肉beef
牛角horn
⒋形象,直觀達意
漢字是象形文字,其顯著的特點是字形和字義的聯繫非常密切,具有明顯的直觀性和表意性。漢字的表意性使漢字成為世界上單位字元信息量最大的文字,因此容易辨識,利於聯想,這也為加快閱讀速度帶來極大的便利。
漢字有著區別於世界其他各種語言的根本特點,這就是漢語語法自身的特殊性即意合。無論是片語合成句子,還是單句組合成複句,首先考慮的因素往往是語意的配合,而不是語法形式的使用,只要幾個負載著重要信息的關鍵詞語在意義上大致搭配得攏,就能言簡意賅地達到交際目的,這幾個詞就可以組合在一起,這就是所謂的“意合”。漢語語法的這一特點,使它結構獨特,靈活多變,頗多隱含,著重意念,其意合性、靈活性和簡約性是其它語言所不能比擬的。漢語語法的上述特點,有利於我們在閱讀中運用意會的方式來進行感知和理解,這對於加快閱讀速度就有極大的便利。
5.信息量大
研究表明:漢字作為一個複雜的文字元號系統,其信息熵很高。研究的基本方法是:逐漸擴大漢字容量,隨著漢字容量增大,信息熵的增加趨緩;漢字增加到12370以後,不再使信息熵有明顯的增加。我國科學家指出:漢字的容量極限是12366個漢字,漢字靜態平均信息熵的值(平均信息量)是9.65比特。通過數理語言學中著名的齊普夫定律(ZIPF’SLAW)核算,這是當今世界上信息量最大的文字元號系統。聯合國五種工作語言文字的信息熵的比較如下:
法文:3.98比特
西班牙文:4.01比特
英文:4.03比特
俄文:4.35比特
中文:9.65比特
可以看出,拼音文字的信息熵小,差別不大。漢字的信息量最大。
漢字對拼音文字的這種信息熵優勢是什麼概念?簡單的比喻就是十進位數與二進位數的差別。十進位數字系統需要人記憶0-9,10個符號,二進位只需要記憶0和1兩個符號。十進位乘除要記憶9X9表,二進位只需要學會與、或、非的簡單邏輯。但是,人類在日常生活中為什麼不使用二進位數字系統呢?因為那樣很浪費,一個數字“7”表示成二進位就成了“111”,記個大數不把人累死?反過來,人類為什麼不用十六進位,或更高的進位呢?一方面是人腦智力的限制,另一方面,十六進位也未必能大幅度提高信息熵。這種信息熵反映在文字上,就是聯合國文件中,中文版本一定是最薄的。這就是漢字字符集信息熵高的優勢。
漢字的以上五個方面的特點,無疑會使其在閱讀心理方面較拼音文字具有相當大的優勢,使漢字的書面語在感知、理解的各個方面都有較高的速度和效率,能夠實現閱讀速度、理解速度、記憶速度的協調發展,快速閱讀,也是中國為何能崛起的天然因素,漢語不失,華夏永存。
計算機輸入
中文信息處理由於打字機鍵盤在設計時本身沒有考慮漢字輸入的問題,輸入漢字往往比輸入拼音文字困難。由於英文是由26個字母排列組合而成的文字,因此可以簡化輸入步驟;相比較之下漢字則不能如此,從字形上雖然可以拆解成不同的部分,但是被分成的部首或偏旁數量多,這樣不但不能達到簡化輸入的目的,反而顯得更為繁瑣,於是從漢字字音上去考慮漢字輸入被分成少量的語音元素組合排列,這樣可以達到簡化輸入的步驟。由於是語音輸入對漢字的讀音必須清楚,某些生僻字或不知道漢字發音的則會很困難,這在一定程度上限制了漢字的輸入。漢字沒有經過中文打字機的普及,直接進入了電腦中文信息處理階段。在電腦發明初期曾引起漢字能否適應電腦時代的問題,支持漢字拉丁化的學者甚至以此為理據。
隨著各種中文輸入法的出現,漢字的計算機輸入、存儲、輸出技術得到了基本解決,大大提高了中文寫作、出版、信息檢索等的效率。中文輸入法有上千種之多,主要包括表音輸入和表形輸入兩類(即五筆和拼音),也有兩者兼之的。漢字的語音輸入、手寫識別和光學字元識別(OCR)技術也已得到廣泛應用。
如收錄數千字的GB 2312(中國大陸),Big5 及CNS 11643(台灣),HKSCS(香港),JIS(日本),以及收錄兩萬多字的GBK(中國大陸), 國外標準Unicode,ISO 10646等等。在這個過程中,因為技術及其他種種因素,在收錄字數,及收錄字體等方面或做不同層次的調整。
中國政府為了解決郵政,戶籍整理等領域用字的迫切需要,於2000年實行了一個新的漢字編碼的國家標準《漢字編碼字符集-基本集的擴充》GB 18030-2000,共收漢字27484個。並強制所有在中國大陸地區售賣的計算機產品必須使用這個新官方標準。
漢字編碼系統為進行信息交換,各漢字使用地區都制訂了一系列漢字字符集標準。
國標碼(“國標”是中華人民共和國國家標準的簡稱)在中國大陸使用。GB2312收錄6763個漢字,GBK收錄20912個漢字,最新的GB18030收錄27533個漢字。
BIG5碼。收錄13053個漢字。在台灣和香港使用的一位元組或兩位元組編碼。
Unicode並不被大陸很好地接受。政府要求在大陸出售的軟體必須支持GB18030編碼。
在國際通信化和軟體設計領域,CJK編碼除了收集了中文,還有日本漢字、韓國漢字的漢字集。

漢字規範化


漢字簡化

漢字自其誕生以來便經歷了甲骨文、金文、篆文,到隸書、楷書、行書、草書的演變過程。漢字書體發展的總體形勢是通過減省筆畫由繁入簡,逐漸簡化的,但有時為了使文字更好更明確地表意,也有文字繁化的現象。特別是造紙術、印刷術的出現,極大地促進了文化的發展與傳播,文字越來越多地被民間人士使用。民間不斷出現一些簡筆字,這些字筆畫的減省是約定俗成的,具有一定的群眾基礎,但由於與當時官方的規範漢字形體不同而被視為俗體、破體,是不能登大雅之堂的。李海霞的《六朝唐五代石刻俗字研究》,潘重規編著的《敦煌俗字譜》、《敦煌變文論輯》,黃征的《敦煌俗字典》,張湧泉的《敦煌俗字研究》《漢語俗字研究》和劉復、李家瑞編的《宋元以來俗字譜》列舉了大量歷史上曾被使用的簡筆字,或稱俗字。
太平天國運動給唐宋以來民間通行的簡筆字(俗字)以正統地位,在太平天國玉璽、官方文件和印發的書籍中採用簡體字。據不完全統計,太平天國總共使用一百多個簡體字,其中80%為後來新中國所採用。
新中國成立後繼續新文化運動和民國時期未能完成的漢字簡化工作,於1956年1月31日通過《人民日報》全文發表了國務院的《關於公布漢字簡化方案的決議》和《漢字簡化方案》,並最終制定出了一個《簡化字總表》,給簡體字以法定地位。一九七七年曾推出過《第二次漢字簡化方案(草案)》,由於在試用過程中產生了文字混亂現象以及人們的反對,於是到了1986年,國務院又宣布“二簡字”停止使用。

異體字整理

異體字是相對於正體字而言的,是指與規範的漢字形體不同但音義相同的字,即漢字的俗體、古體、或體之類。異體字的出現主要是由於漢字書體的演變以及民間書寫過程中產生的字形形體變異,它們有別於官方規範的漢字形體。大部分漢字都有異體字形,有的甚至有多種異體寫法,這些異體字佔了漢字總數相當部分數量。例如:“㷖”與“照”、“秊、䄭、年”、“峯”與“峰”、“氷”與“冰”分別以“照”、“年”、“峰”、“冰”為正體字。
出於統一文字字形,規範漢字形態的目的,中華人民共和國文化部和中國文字改革委員會於1955年12月聯合發布了《第一批異體字整理表》,並於次年2月起實施,該表淘汰了1055個異體字。但在後來頒行的《簡化字總表》和《現代漢語通用字表》中又恢復了不少曾被淘汰的異體字。

錯訛字

“民”字避李世民諱少寫斜鉤
“民”字避李世民諱少寫斜鉤
錯訛字是指傳抄、書寫過程中字形發生了訛變的字,即錯別字,有別於正體字。從廣義上講,因避諱而故意寫錯的缺筆字也屬於此類。

造字歷史


倉頡造字

見前文。

則天造字

則天文字(部分)
則天文字(部分)
武則天在她臨朝稱制和登基為皇時曾命人創製過漢字,後世遂稱“則天文字”。一般認為則天文字共有十八字,包括最初由宗秦客獻給武則天的十二字和後來陸續頒行的六字,這十八個字的創造過程共經過五個不同的階段,並且各有其政治目的及文化系統的內在意涵。隨著人亡政息后,這批文字亦因失去時代意義的支撐而隨之見棄,後人遂用回本字。

科技造字

近現代以來,為了表示一些科技專有名詞造了一批字,這些字大都是依據形聲法和會意法而造。如為了表示一些外國制單位曾廣泛創造並使用的多音節漢字“浬”(海里)、“嗧”(加侖)、“瓩”(千瓦)等;化學元素中的“氫”、“硒”、“鈧”等;有機化學中的化合物“羰、烴”等。

影響


漢字是承載文化的重要工具,當前留有大量用漢字書寫的典籍。不同的方言、甚至語言都使用漢字作為共同書寫體系。在古代日本、朝鮮半島、越南、琉球群島,以及位於婆羅洲的蘭芳共和國,漢字都曾是該國正式文書的唯一系統,因而漢字在歷史上對文明的傳播分享有著重要作用。
由於漢字和發聲的聯繫不是非常密切,比較容易被其他民族所借用,如日本、朝鮮半島和越南都曾經有過不會說漢語,單純用漢字書寫的歷史階段。漢字的這個特點對於維繫一個文化圈—一個充滿各種互相不能交流的方言群體的民族——發揮了主要的作用。
漢字對周邊國家的文化產生過巨大的影響,形成了一個共同使用漢字的漢字文化圈,在日本、越南和朝鮮半島、琉球群島,漢字被融合成它們語言的文字“漢字(かんじ)”、“漢字(한자)”、“漢字(hán tự)”。
對日本文字的影響
日本漢字
日本漢字
漢字於公元 3世紀經朝鮮半島輾轉傳入日本。長期以來,其人民是以漢字作為自己傳播思想、表達情感的載體,稱漢字為“真名”。五世紀初,日本出現被稱為“假名”的借用漢字的標音文字。八世紀時,以漢字標記日本語音的用法已較固定,其標誌是《萬葉集》的編定,故稱“萬葉假名”。是為純粹日語標音文字的基礎。日本文字的最終創製是由吉備真備和弘法大師(空海)來完成的。他們倆人均曾長期留居中國唐朝,對漢字有很深的研究。前者根據標音漢字楷體偏旁造成日文“片假名”,後者採用漢字草體創造日文“平假名”。儘管自十世紀起,假名文字已在日本盛行,但漢字的使用卻並未因此而廢止。
二戰後日本開始限制漢字的數量和使用,頒布了《當用漢字表》及《人名用字表》等,其中簡化了部分漢字(日本新字體),不過文學創作使用的漢字,並不在限制之列。日本除從中文中傳入的漢字外,還創造和簡化了一些漢字。現如今,已在世界佔據重要地位的日本文字仍保留有一千多個簡體漢字。其中,在2010年重新制定並公布的日語常用漢字表中,共收錄了2136個漢字。
對朝鮮半島文字的影響
韓國漢字
韓國漢字
公元 3世紀左右,漢字傳入了朝鮮半島,朝鮮語/韓語曾經完全使用漢字來書寫。相傳薛聰在當時發明了吏讀,把朝鮮語用同音或同義的漢字來表示。由於有不少發音都沒有對應的漢字,所以朝鮮半島的人民又運用組字法,把兩個或多個漢字合組成為一個新的吏讀字。相傳後來的契丹文就是受到吏讀字的影響。此外尚有鄉札、口訣等以漢字表記朝鮮語的方法。
1443年,朝鮮世宗大王頒布《訓民正音》,發明了諺文與漢字一起使用,但當中有不少部件仍然有昔日吏讀字的痕迹。現如今的韓國雖禁止在正式場合下使用漢字,並停止了在中小學中教授漢字(但是從2011年開始,韓國的李明博政府已經決定將漢字重新納入中小學的課程里),不過漢字在民間仍在繼續使用,且可以按照個人習慣書寫,但是現如今能寫一筆漂亮漢字的韓國人越來越少。由於朝鮮語/韓語中使用了大量的漢字辭彙,並且重音現象嚴重,所以在需要嚴謹表達的場合時仍然會使用漢字。雖然在通常情況下人名、公司機構名稱等均使用韓文書寫,不過大多數的人名、公司機構均有其對應的漢字名稱。朝鮮民主主義人民共和國於1948年廢除了漢字,僅保留了十幾個漢字。
對越南文字的影響
越南漢字
越南漢字
公元 1世紀漢字便傳入了越南,越南語也曾完全使用漢字做為書寫用文字,並在漢字的基礎上創造了喃字,但是由於書寫不便,漢字仍是主要的書寫方式。
十世紀以前的越南是中國的郡縣。秦、漢、隋、唐莫不在此設官統轄,故受中國文化的影響較深。越南獨立后,無論是上層人士的交往,還是學校教育以及文學作品的創作,均以漢字為工具。直至十三世紀,越南才有本國文字——字喃。字喃是以漢字為基礎,用形聲、假借、會意等方法創製的表達越南語音的新字。十五世紀時,字喃通行全國,完全取代了漢字(少數人還在用漢字)。
1945年越南民主共和國成立后廢除漢字,使用了稱為“國語字”的拼音文字。現在的越南文已經看不出漢字的痕迹了。

民俗


射虎:即猜燈謎,也叫打燈虎,與漢字有著密切關係。舊時的射虎大致可以分成兩類,一類是文人射虎,謎面深奧,謎格複雜多樣,謎底多為四書五經中的原句;一類是市井燈謎,謎面謎底均較通俗。射虎是元宵節的一項重要活動。