ASR

自動語音識別技術

目錄

正文


自動語音識別技術(Automatic Speech Recognition)是一種將人的語音轉換為文本的技術。語音識別是一個多學科交叉的領域,它與聲學、語音學、語言學、數字信號處理理論、資訊理論計算機科學等眾多學科緊密相連。由於語音信號的多樣性和複雜性,語音識別系統只能在一定的限制條件下獲得滿意的性能,或者說只能應用於某些特定的場合。語音識別系統的性能大致取決於以下4類因素:1. 識別辭彙表的大小和語音的複雜性;2. 語音信號的質量;3. 單個說話人還是多說話人;4. 硬體。