詞式書寫

詞式書寫

詞式書寫是用文字書寫語言的現代化書寫方式,就是用空格間隔一個書面句子中的詞,還原口語本身存在的詞的停頓界線,使語言閱讀更加清晰。

歷史起源


4世紀沒有實行詞式書寫的樣品
4世紀沒有實行詞式書寫的樣品
詞式書寫是文字書寫方式進步的結果。人類的語言在書寫的時候,開始都是一個字一個字書寫,不僅中國古代的文言文這樣,而且西方的字母文字也是這樣。大約在1500年前,西方語言逐漸實行詞式書寫,就是在詞和詞之間增加一個字母大小的空格,是一個句子連續書寫的一串字母,可以從書面上看到詞的界線,方便閱讀。有詞式書寫習慣的文字,是一種更加逼近口語事實的更加完備的文字。現在世界上多數語言採用詞式書寫。下面左邊的圖片是歐洲4世紀的書寫樣品,還沒有實行詞式 書寫,右邊的圖片是9世紀的書寫樣品,已經實行詞式書寫。

操作方法


詞式書寫是用以詞為單位的方式書寫,把記錄每個口語詞的所有字連接在一起,使詞和詞之間在書寫上有明顯的距離等標記,逼真地體現口語詞的界線。早期的詞式書寫還採用符號做詞的界標記,例如拉丁文字早期採用的隔離詞的符號“:”,楔形文字早期採用的隔離詞的符號“、”。詞式書寫又叫做詞連寫、分詞連寫。詞式書寫中的距離也可以說是一種特殊的標點符號,是用空間距離的形式來代替古代人用過的隔離詞的符號。
如果用漢語拼音書寫漢語,那麼必須像音素文字一樣實行詞式書寫,才方便閱讀。所以1958年公布《漢語拼音方案》,規定了漢語音節的書寫規則,1988年又補充公布了《漢語拼音正詞法基本規則》,規定漢語詞和句子的書寫規則。這個規則的基本精神是:用拼音書寫漢語要以詞為單位書寫。這樣,用漢語拼音書寫“中華人民共和國”,應該是: Zhōnghuá Rénmín Gònghéguó。放大 中間 的 詞 空格 是:Zhōnghuá Rénmín Gònghéguó。

書寫特點


9世紀實行詞式書寫的樣品
9世紀實行詞式書寫的樣品
詞式書寫是跟非詞式書寫對應的。詞式書寫是現代文字普遍採用的書寫方式,例如英語等用的拉丁文字,傳統的蒙古語文字也是採用詞式書寫,把一個詞的全部音素字連接成一個整體書寫。非詞式書寫一般是字式書寫,例如漢字的書寫。在字式書寫的影響下,還在新創造的表音文字中出現音節式書寫,例如苗語越南語。不過,越南語像古代漢語一樣,單音節詞很豐富。詞式書寫需要正詞法的幫助。

社會價值


詞式書寫能夠逼真地反映口語中詞的信息,方便閱讀,能夠提高書面語言的閱讀效率。對於表音文字,由於詞內部的字相對多,閱讀中辨別詞的邊界更加困難,採用詞式書寫的迫切性更加強。因此,拉丁文字等文字最早的標點符號,是實現詞式書寫的隔離詞的符號。古代文字一般是詞文字,例如古代漢語的文言文用的漢字,字和詞基本上重合,一個詞用一個字記錄,一個字一個字排列下去就可以了。由於語言的發展,如果再這樣,人們只能看到字的界線,看不到詞的界線,所以現代文字,特別是表音文字一般採用詞式書寫。但是,在漢語中詞式書寫仍然沒有得到很好的推廣。

鑒別方法


詞式書寫和正詞法
正詞法是適應詞式書寫需要對詞進行確認和書寫的規則,例如《漢語拼音正詞法基本規則》。在詞式書寫習慣還沒有形成的文字或者文字轉寫代碼中特別需要。
詞式書寫和字組 字組是記錄一個音素、音節、語素、詞、片語等語言單位的多於一個字的文字單位。例如,英語文字的“shall”用5個字記錄1個詞,也是一個語素,一個音節。其中的“sh”“ll”都用2個字記錄1個音素。日語“きや”是用2個字記錄一個音節“kja”。漢語中“巧克力”用3個字記錄1個詞,也是一個語素。漢語“語言學概論”是用5個字記錄一個片語。語言中記錄1個詞最少用1個字,例如英文詞“I(我)”和“a(一個)”,漢語的“我”和“是”用單字記錄。但是更多的詞用字組記錄,例如英語的“beautiful(美麗)”,漢語的“聰明”。一種文字的字的總數量越少,記錄一個詞需要的字的數量就越多,反過來就越少,它們之間構成反比例關係。一種語言的音素(音位)往往是幾十個,然而一種語言的常用的語素總是多到幾千個,一種語言的常用的詞總是多到幾萬個。相反,一個詞裡面包含的音素比包含的語素要多幾倍。例如,英語採用音素文字,字的總數只有26個;漢語採用語素文字,一般要7000個。但是,英語的文字記錄1個詞大約平均要5個字;漢語的文字記錄1個詞大約平均只要2個字。英語的文字如同數學中的二進位,漢語的文字如同數學中的十進位
詞式書寫和文字類型
一個詞用的字越多,實行詞式書寫的需要就越強烈。否則,閱讀起來相當困難。例如,如果不實行詞式書寫,寫成這樣的英語:“DoyoumindifIaskyouoneortwoqueions?(我可以問你一兩個問題嗎?)”就很浪費閱讀時間。雖然沒有詞的邊界我們也能夠閱讀,如同漢語文言文在印刷的時候幾乎沒有標點符號,我們也能夠閱讀,但是畢竟這樣閱讀比較困難,而且可能發生誤解。例如“學生會來的”,“從小學語文”,“是學校對”,“中國語文現代化學會”,“我國漢語研究中國外理論語言學成果的借鑒和發展”,“由辭彙集成的辭彙是一個整體”,“由於種植籽瓜有利可圖,使大批的種植者就到過渡帶來開墾”。“這不是伊丹十三個人的問題“,“香港人氣少女”中有不少歧義,可以通過詞式書寫區分。詞式書寫是音素文字普遍採用的文字書寫方式,然而漢字書寫漢語至今沒有普遍採用。這是因為一種語言的音素是最小的語音單位,每個詞包含的音素大大多於它包含的語素的數量。漢字是語素文字,一個詞大約用2個語素字,即使不實行詞式書寫,閱讀的時候尋找詞的界線也相對容易。所以,英語的書寫中既有字的小距離,也有詞的大距離;但是,採用現行漢字的漢語書寫中只有字的距離一種。因此,人們很容易把英語詞的距離與漢語字的距離錯誤對應,把英語的詞叫做“字”。在沒有詞式書寫習慣的漢語中,詞式書寫還可以強化漢語使用中的詞意識。例如英語的詞history和law分別對應漢語的詞“歷史”和“法律”。可是人們在寫作或者翻譯中經常用不能做詞用的語素“史”、“法”代替,出現“世界當代科技史”、“國家通用語言文字法”等現象。在詞式書寫中,很容易發現“史”和“法”的不自由局面,從而重新調用真正的現代漢語的詞“歷史”和“法律”。

發展前景


用漢字這樣的語素文字,為什麼幾千年以來沒有實行詞式書寫,現在卻有人呼喚改革呢?因為它在古代是一種詞文字,一個詞一個語素,一個詞內部一般只需要1個字。這種保持一個詞用一個字記錄的書面語,在付出了脫離口語的代價的基礎上,維持了幾千年的歷史。隨著漢語的發展,單音節詞占的比例越來越少。最近100年以來,現代漢語書面語一直保持跟口語基本一致。如果仍然不實行詞式書寫,帶來的不方便就越來越多了。?在漢語信息處理中,這個問題更加突出。例如,一次輸入“xdh”或者“xiandaihua”,可以很快地一次輸出“現代化”,因為沒有同音詞的選擇問題。如果分3次處理,就會慢多了,因為要對同音語素進行多次選擇。可是,很多人由於從小在學習和使用漢語書面語的時候,就是通過一個一個字從語素角度認識漢語的,所以,對於書面上的一個句子,不知道在哪兒把詞切分開來。因此,強化漢族的詞意識已經非常迫切,許多語言信息處理專家也在呼籲漢語進行詞式書寫的改革。當然任何改革會出現麻煩。但是只要方便比麻煩多,這樣的事情就值得去做。而且習慣以後,麻煩幾乎可以忽略。暫時沒有形成詞式書寫習慣的漢語使用者,很容易注意詞式書寫在詞的分離方面遇到的麻煩。其實,這些麻煩任何語言包括英語也有。例如“there can not be”中的“can not”這個片語由於使用頻率高,長度適當,發音緊湊,也可以當做一個詞,寫成“cannot”。“a one to one corre–spondence”中的“one to one”可以當做一個鬆散的詞用連接符號把原來的3個詞連接起來,寫成“one-to-one”。有人說“老師和同學們”中的“們”不好處理,其實只要比較英語“(seedi–rectlyinto)each other's minds”類似的“'s”,就可以處理成“老師和同學們”。在一種語言的語音系統中,音節的總數量和一個詞的形式用的音節數量也有反比例關係。北京話廣州話音節總數量相對少,多音節詞就相對多。

實踐


全面實行詞式書寫的教材《語言理論》
全面實行詞式書寫的教材《語言理論》
拼音文本漢語音節式書寫和詞式書寫對照
拼音文本漢語音節式書寫和詞式書寫對照
詞式書寫在拼音文本或者拼音和漢字對照文本中早就開始嘗試,現在已經普遍使用,但是在漢字文本的韓語書面語中還在嘗試中。最早全書採用詞式書寫的漢字文本的漢語圖書是彭澤潤李葆嘉主編、中南大學出版社從2000年開始出版到2009年出版了第5版的《語言理論》教材。第6版在2013年出版。
在關於《湖南政報》封面名稱拼音的圖片中,左邊的拼音“HU NAN ZHENG BAO”沒有按照正詞法實行詞式書寫,而是對應漢字形成的音節式書寫;右邊的“HUNAN ZHENGBAO”改成了詞式書寫。