言語理解

信息技術

言語理解是用計算機系統來識別和理解某一言語或其成分的技術。

技術原理


用言語作為人機之間的通信手段,較書面語更直接、更自然,也更快速。不經常使用計算機的人只要經過很少的訓練便可運用複雜的計算機系統。使用者的手可以騰出來從事其他操作,這一優點在航天活動中尤為重要。

主要特點


言語中詞與詞之間的界限是含糊的,語句的重音、語調、節奏等整體現象都會使原來為孤立詞設置的聲學模式失效,因此不能簡單地將連續言語信號和孤立詞語音信號的時間序列等同起來。在這種情況下,簡單的匹配技術不再適用,必須在新的原理指引下尋求新的方法。人在聽懂對方一句話時,除了聲學信號外往往利用其他信息來估計話的內容,而並不需要聽清每一個詞的發音。從單純依靠孤立詞聲學模式的匹配技術到綜合運用語言學各類知識來解釋聲學信號,是方法論上的轉變,這標誌著從言語識別轉入言語理解的新的研究階段(見語音識別)。現代言語理解的實驗系統往往採用自底向上和自頂向下相結合的方法。所謂自底向上就是利用語音學知識將輸入語音信號同儲存的聲學模式匹配。而自頂向下則是運用其他類型語言學知識(包括語法、語義和語用等)對說話人言語中可能出現的詞提出設想,以指引識別的方向;有時還需要在識別和理解言語後作出實時響應;如果這種響應也要求以言語形式作出,則還要運用言語合成技術。

發展歷史


言語理解
言語理解
言語理解的研究工作是從60年代研究孤立詞識別系統開始的。主要應用的技術是將通過傳聲器輸入的語音信號同存儲於機內有限辭彙中每一個詞的聲學模式相比較,根據某種距離準則尋求最佳匹配。能以相當高的精度識別100以上孤立詞的實用系統已經問世,但識別包含片語或整個句子的連續言語信號所遇到的困難則比預計大得多。
1976年開始出現幾種能接收受限領域正常口述語句(連續言語)並能在合理時間內作出響應的實驗性言語理解系統。辭彙量規定為1000,響應誤差小於10%。為了實現這一要求,言語理解系統需要運用包括語音學、音位學、詞素學、韻律學、句法學、語義學和語用學等方面的多層次的知識。
對類型不同的大量知識綜合運用,是知識工程的重大技術課題。為了解決這一問題,hearsay系統提出了知識源和黑板結構。每一類型(屬於不同層次)的知識就是一個知識源,構成總知識庫的一個分庫。黑板結構是一種多級網路結構,構成新形式的全局資料庫。各知識源之間的協作是通過黑板結構進行的。各知識源在黑板上寫上自已對言語組成的設想,這一設想可被其他知識源肯定或否定,結論由系統的控制部分作出。HEARSAY系統的體系結構(圖1)對所有知識型系統均有借鑒意義。圖2為言語理解系統的工作過程。

引申


公務員考試

行測言語理解與表達題型涉及閱讀理解、語句表達、邏輯填空。
2021年度國家公務員考試筆試公共科目考試大綱中指出,言語理解與表達主要測查報考者運用語言文字進行思考和交流、迅速準確地理解和把握文字材料內涵的能力,包括根據材料查找主要信息及重要細節;正確理解閱讀材料中指定詞語、語句的含義;概括歸納閱讀材料的中心、主旨;判斷新組成的語句與閱讀材料原意是否一致;根據上下文內容合理推斷閱讀材料中的隱含信息;判斷作者的態度、意圖、傾向、目的;準確、得體地遣詞用字等。