聲碼器

聲碼器

一種對話音進行分析和合成的編、解碼器,也稱話音分析合成系統或話音頻帶壓縮系統。它主要用於數字電話通信,特別是保密電話通信。

目錄

正文


圖為人的發聲系統模型。人講話時,氣流經過喉頭形成聲源信號,然後激勵由口、鼻腔構成的聲道,產生話音信號。聲碼器發信端的分析器首先對話音信號進行分析,提取主要話音參數:①聲源特性,如聲帶“振動-不振動”(濁-清音)、聲帶振動時的基本頻率(基頻f0);②聲道傳輸聲源信號的特性。這些話音參數變化很慢,它們所佔的總頻帶比話音本身的頻帶窄得多,因而對這些參數採樣編碼時總數碼率只有幾千甚至幾百比特/秒,只有直接 由話音信號採樣編碼的數碼率的十幾分之一,可以通過一個普通電話通道來傳輸。收信端的合成器利用這些參數來合成話音。
聲碼器
聲碼器
聲碼器最早出現在美國貝爾實驗室。這個實驗室的H.W.達得利在1928年提出合成話音的設想,並於1939年在紐約世界博覽會上首次表演了他取名為聲碼器的話音合成器。此後,話音合成的原理被用來研究壓縮話音頻帶。聲碼器的研究工作不斷取得進展,數碼率已降到2400或1200比特/秒,甚至更低。合成后的話音質量有較大提高。在售價、結構、耗電等諸方面符合商用的聲碼器已經出現。中國於50年代末開始研製聲碼器,並已用於數字通信。
壓縮頻帶 聲碼器能壓縮頻帶的根本依據是話音信 號中存在信息多餘度。話音信號只要保留聲源和聲道的主要參量,就能保證有較高的話音清晰度。
類型 採用頻譜包絡和基頻作為參數的聲碼器稱為通道聲碼器。除通道聲碼器外,還有多種其他類型的聲碼器。它們在合成話音質量、數碼率和複雜程度等方面不大一樣,主要的差別在於話音參數和提取這些參數的方式不同。例如,用共振峰的位置、幅度和寬度表示頻譜包絡的,稱為共振峰聲碼器;利用同態濾波技術,如對話音信號進行積分變換、取對數和反變換以獲得各參數的,稱為同態聲碼器;直接編碼和傳輸話音的基帶(如取200~600赫的頻帶)以表徵聲源特性的,稱為聲激勵聲碼器。此外,還有相位聲碼器、線性預測聲碼器(見線性預測編碼)等。
特點 聲碼器的明顯優點是數碼率低,因而適合於窄帶、昂貴和劣質通道條件下的數字電話通信,能滿足節約頻帶、節省功率和抗干擾編碼的要求。低數碼率對話音存儲和話音加密處理也都很有利。聲碼器的缺點是音質不如普通數字電話好,而且工作過程較複雜,造價較高。現代聲碼器主要用于軍隊、政府以及那些值得付出代價以換取通信安全(保密)的場合。隨著對人類發聲機構和聽覺機理的深入研究以及計算機技術和大規模集成電路的發展,聲碼器的音質和設備小型化將不斷得到改進,並將在數字通信中得到更廣泛的應用。
參考書目
J.L.Flanagan,Speech Analysis Synthesis and Perception,2nd ed., Springer-Verlag, New York,1972.