中國語言生活狀況報告2006
中國語言生活狀況報告2006
《中國語言生活狀況報告2006》是2007年商務印書館出版的圖書,作者是國家語言資源監測與研究中心。
調查統計和撰寫報告過程中,始終遵循實事求是的原則。“實事求是”體現在兩個方面:一是力求客觀記錄語言文字使用的實態,二是吸收和改進現有技術手段,在記錄語言文字使用實態的過程中努力體現出技術“實態”的最新進展和較高水平。兩個“實態”缺一不可,前者是追求的目標,後者體現了實現目標的手段和方法上的改進。隨著科技的進步,中文信息處理技術發展非常快,使得我們現在有條件運用計算機、語料庫和數理統計的方法定期發布監測數據,開展語言使用實態的研究,這是非常了不起的進步!但是,技術的發展和走向成熟需要一個過程,由於多方面原因,現有的信息技術手段在處理語言文字時尚有一些“瓶頸”問題(如自動分詞和提高詞性標註的準確率等)沒有得到圓滿解決,也在一定程度上影響甚至阻礙著統計數據和研究報告質量的進一步提升。因此可以說,發布中國語言使用狀況報告和相關數據,既得益於信息技術的發展,也受制於目前信息技術水平的“實態”,這是需要信息處理界和語言學界合力攻關才能逐步解決的問題。在《中國語言生活狀況報告(2006)》(下編)數據處理和報告撰寫遇到需要攻關的問題時,我們時常採取請教信息處理專家,或者召開信息處理和語言學專家都參加的專題研討會等方式,探索某些無法迴避的技術“瓶頸”問題的處理策略,力爭使所採用的技術“實態”能夠代表最新和較高發展水平。當然,這類問題目前解決得還不是很理想,這是需要說明的。
報紙、廣播電視、網路(新聞)用字用語調查
附表1 報紙、廣播電視、網路(新聞)頻率比值前20字比較表
附表2 2006年、2005年“前2500字”在一級常用漢字表中未出現的字的比較
附表3 2006年、2005年“前3500字”在《現代漢語常用字表》中未出現的字的比較
附表4 2006年、2005年“前7000字”在《現代漢語通用字表》中未出現的字的比較
附表5 2006年、2005年用字總表中未出現的《現代漢語通用字表》中的通用字的比較
報紙、廣播電視、網路(新聞)字母詞語使用狀況調查
附表6 報紙、廣播電視、網路(新聞)字母詞語表
附表7 報紙、廣播電視、網路(新聞)高頻英文單詞表
中文網路用字用語調查
中文博客用字用語專項調查
中文BBS用字用語專項調查
報紙、廣播電視年度流行語
漢語作為第二語言教材字、詞和詞語義項調查
附表8 前1500條高頻詞語表
附表9 100個樣條的義項義頻表
漢語年度新詞語
圖表目錄
後記