語音技術

語音技術

語音技術在計算機領域中的關鍵技術有自動語音識別技術(ASR)和語音合成技術(TTS)。讓計算機能聽、能看、能說、能感覺,是未來人機交互的發展方向,其中語音成為未來最被看好的人機交互方式,語音比其他的交互方式有更多的優勢。

信息簡介


最早的語音技術因“自動翻譯電話”計劃而起,包含了語音識別、自然語言理解和語音合成三項非常主要的技術。語音識別的研究工作可以追溯到20世紀50年代AT&T貝爾實驗室的Audry系統,此後研究者們逐步突破了大辭彙量、連續語音和非特定人這三大障礙。
讓計算機說話需要用到語音合成技術,其核心是文語轉換技術(Text to Speech),語音合成甚至已經應用到汽車的信息系統上,車主可以將下載到系統電腦中的文本文件、電子郵件、網路新聞或小說,轉換成語音在車內收聽。