自動語音識別技術(Automatic Speech Recognition)是一種將人的語音轉換為文本的技術。語音識別是一個多學科交叉的領域,它與聲學、
語音學、語言學、
數字信號處理理論、
資訊理論、
計算機科學等眾多學科緊密相連。由於語音信號的
多樣性和複雜性,
語音識別系統只能在一定的限制條件下獲得滿意的性能,或者說只能應用於某些特定的場合。語音識別系統的性能大致取決於以下4類因素:1. 識別辭彙表的大小和語音的複雜性;2. 語音信號的質量;3. 單個說話人還是多說話人;4. 硬體。