語音增強

語音增強

語音增強,是指當語音信號被各種各樣的雜訊干擾、甚至淹沒后,從雜訊背景中提取有用的語音信號,抑制、降低雜訊干擾的技術。

術語概述


一、語音增強的定義
語音增強是指當語音信號被各種各樣的雜訊干擾、甚至淹沒后,從雜訊背景中提取有用的語音信號,抑制、降低雜訊干擾的技術。一句話,從含噪語音中提取儘可能純凈的原始語音。
二、語音增強的意義
1. 日常生活中,經常會遇到在雜訊干擾下進行語音通信的問題。例如在汽車、火車上使用行動電話,旁人的喧鬧聲,馬路旁和市場里的公用電話等。
2. 軍事通信中,指揮員的作戰命令和戰鬥員的戰情彙報都需要用語音來表達,由於戰鬥環境中的聲環境惡劣,特別是炸彈產生的衝擊性雜訊,使有用信號完全淹沒在雜訊中。
(3)竊聽技術中需要語音增強
(4)語音識別技術需要語音增強
在實際生活中,語音信號無時無地不受各種雜訊干擾。人們正常的生活環境就是一個聲級為60dB左右的雜訊環境。被強雜訊污染的場合,雜訊達120dB以上。

術語目的


語音增強的一個主要目標是從帶噪語音信號中提取儘可能純凈的原始語音。然而,由於干擾通常都是隨機的,從帶噪語音中提取完全純凈的語音幾乎不可能。在這種情況下,語音增強的目的主要有兩個:一是改進語音質量,消除背景噪音,使聽者樂於接受,不感覺疲勞,這是一種主觀度量;二是提高語音可懂度,這是一種客觀度量。這兩個目的往往不能兼得。目前有一些對低信噪比帶噪語音進行語音增強的方法,可以顯著地降低背景雜訊,改進語音質量,但並不能提高語音的可懂度,甚至略有下降。

方法分類


目前常用的語音增強演演算法分為如下幾類:基於譜相減的語音增強演演算法、基於小波分析的語音增強演演算法、基於卡爾曼濾波的語音增強演演算法、基於信號子空間的增強方法、基於聽覺掩蔽效應的語音增強方法、基於獨立分量分析的語音增強方法、基於神經網路的語音增強方法。這裡只是介紹一下各種語音增強方法流程,待確定方向之後再深入研究。
語音增強不但與語音信號數字處理理論有關,而且涉及到人的聽覺感知和語音學範疇。再者,雜訊的來源眾多,因應用場合而異,它們的特性也各不相同。所以必須針對不同雜訊,採用不同的語音增強對策。目前,某些語音增強演演算法在實際應用中己經證明是有效的,它們大體上可分為四類:雜訊對消法、諧波增強法、基於參數估計的語音再合成法和基於語音短時譜估計的增強演演算法。