ASR

自動語音識別技術

正文

自動語音識別技術（Automatic Speech Recognition）是一種將人的語音轉換為文本的技術。語音識別是一個多學科交叉的領域，它與聲學、語音學、語言學、數字信號處理理論、資訊理論、計算機科學等眾多學科緊密相連。由於語音信號的多樣性和複雜性，語音識別系統只能在一定的限制條件下獲得滿意的性能，或者說只能應用於某些特定的場合。語音識別系統的性能大致取決於以下4類因素：1. 識別辭彙表的大小和語音的複雜性；2. 語音信號的質量；3. 單個說話人還是多說話人；4. 硬體。

ASR

自動語音識別技術

正文

基本信息