杜比AC-3

杜比AC-3

(Dolby Digital AC-3)是杜比公司開發的新一代家庭影院多聲道數字音頻系統。杜比定向邏輯系統是一個模擬系統。它的四個聲道是從編碼后的兩個聲道分解出來的,因此難免有分離度不佳、信噪比不高,對環繞聲缺乏立體感,並且環繞聲的頻帶窄等缺點。AC(Audio Coding)指的是數字音頻編碼,它拋棄了模擬技術,採用的是全新的數字技術

系統簡介


1994年,日本先鋒公司宣布與美國杜比實驗室合作研製成功一種嶄新的環繞聲制式,並命名為“杜比AC-3”(Dolby Surround Audio Coding-3)。1997年初,杜比實驗室正式將“杜比AC-3環繞聲”改為“杜比數碼環繞聲”(Dolby Surround Digital),我們常稱為Dolby Digital

系統特點


杜比數字AC-3提供的環繞聲系統由五個全頻域聲道加一個超低音聲道組成,所以被稱作5.1個聲道。五個聲道包括前置的“左聲道”、“中置聲道”、“右聲道”、後置的“左環繞聲道”和“右環繞聲道”。這些聲道的頻率範圍均為全頻域響應3-20000Hz。第六個聲道也就是超低音聲道包含了一些額外的低音信息,使得一些場景如爆炸、撞擊聲等的效果更好。由於這個聲道的頻率響應為3-120Hz,所以稱“.1“聲道。
杜比數字AC-3是根據感覺來開發的編碼系統多聲道環繞聲。它將每一種聲音的頻率根據人耳的聽覺特性區分為許多窄小頻段,在編碼過程中再根據音響心理學的原理進行分析,保留有效的音頻,刪除多作的信號和各種雜訊頻率,使重現的聲音更加純凈,分離度極高。
杜比數字AC-3系統可用前置的左、右音箱,中置音箱產生極有深度感和定位明確的音場,用兩個後置或側置的環繞音箱和超低音箱表現寬廣壯闊的音場,而六個聲道的信息在製作和還原過程中全部數字化,信息損失的很少。全頻段的細節十分豐富,具有真正的立體聲。
杜比數字AC-3具有很好的兼容性,它除了可執行自身的解碼外,還可以為杜比定向邏輯解碼服務。因此,目前已生產的杜比定向邏輯影視軟體都可以使用杜比數字AC-3系統重現。由於杜比數字AC-3系統的編碼非常靈活,所以它的格式很多。目前它已被美國採用作為高清晰電視(HDTV)音頻系統,最新DVD機也包含杜比數字AC-3。因此杜比AC-3環繞聲系統可能是極有發展前途的技術。

系統原理


起因
自1976年杜比環繞聲(Dolby stereo optical,4-ch)首次應用於電影后,已成為最受歡迎的多聲道立體聲系統之一,用於家庭的杜比環繞聲(Dolby Surround,3-ch,1982)和杜比定向邏輯環繞聲(Dolby Surround Pro Logic,4-ch,1987),更能讓你在家中享受電影院的環繞聲效果。1992年杜比公司又開發了最新一代的杜比數碼環繞聲系統(Dolby Digital)並應用於電影,該系統基於先進的感覺編碼(perceptual coding)和數字壓縮編碼技術,即杜比AC-3。其優良的特點使之在1995年被選作DVD播放機的標準多聲道音頻格式(在NTSC制電視的國家)及多項其它系統的標準音頻格式。杜比數碼環繞聲系統有6個完全獨立的聲道,全頻帶的左、右、中置、左環繞、右環繞,再加上一個20~120Hz的超重低音的聲道(以0?1聲道計),故又稱作5?1聲道。在杜比AC-3規格中超重低音的音量比其它全頻帶聲道大10dB,可得到震撼力非凡的低頻效果。
原理
杜比AC-3原理上是它將每一聲道的音頻根據人耳聽覺特性劃分為許多最優的狹窄頻段,利用音響心理學“聽覺掩蔽效應”,刪除人耳所聽不到或可忽略的部分,並採用數字信號壓縮編碼。同時,利用狹窄頻段的劃分使部分頻段雜訊在編碼時可被幾乎全部濾除,使其餘雜訊的頻譜靠近在信號頻譜附近,而這些雜訊可被信號所抑制。因此杜比AC-3系統實際上是一種具選擇性及強抑噪的系統。不難理解杜比AC-3的特點:以較低的碼率支持全音頻多聲道,並具優良的回放音質和效果。
感知型編碼
杜比AC-3就是一種感知型編碼方式,它把整個音頻頻帶分割成若干個較窄的頻段,因為人類的聽覺對不同頻率的聲音具有不同的靈敏度,各頻段的寬度並不完全一樣。由於有用的信號被劃分成狹窄的頻頻,編碼雜訊的濾降總是就比較容易。因為對於每個頻段來說,該頻率以外的所有信號可以全部被濾除掉而不會損傷有用信號。而頻段內,剩餘雜訊信號的頻率與有用信號的頻率非常接近,這正是遮蔽效應發揮最大作用的區域。從這種意義上說,象AC-3這樣的感知型編碼系統是一種非常有效的減噪係數。這些被分割成狹窄頻段的多路數字音頻信號最終還需要被合成一路完整的全頻帶信號,但每一個頻段所佔有的數據量並不是平均分配的,編碼器內部有一個“聽覺遮蔽模塊”,可以模擬人的聽覺遮蔽效應,它能根據信號的動態特性來決定在某一時刻的數據用量應當如何分配給各頻段才是最合適的。頻譜密集、音量大的聲音元素應該獲得較多的數據佔有量,那些由於遮蔽效應而聽不到的聲音則少佔用或不佔用數據量。

編解碼技術


AC-3是在AC-1和AC-2基礎上發展起來的多通道編碼技術,保留了原AC-2中如窗函數處理、指數變換編碼、自適應比特分配等許多特點,還新增了運用立體聲多聲道的編碼技術策略的coupling和rematrix演演算法。一般而言,立體聲的左聲道和右聲道的信號在聽覺上十分相似,存在著許多重複的冗餘信息,將這兩個聲道的信號聯合起來加以編碼,便可除去冗餘的信號且不會影響原來的音質。這裡AC-3陣低碼率的又一個有效的手法。
數碼流
AC-3輸入PC聲音數據,輸出壓縮后的數碼流。編碼的第一步是,運用TDAC(Time Domain Aliasing Cancellation)濾波器把時域內的PC取樣數據變換成頻域內成塊的一系列變換係數,每個變換係數以二進位指數形式表示,即由一個指數和一個尾數構成。指數部分經編碼后構成了整個信號大致的頻譜,又被稱為頻譜包絡。用頻譜包括和遮蔽由線的相關性決定每個尾數的比特分配。由於比特分配中採用了前/後向混合自適應比特分配以及公共比特池等技術,因而可使有限的碼率在各聲道之間、不同的頻率分量之間獲得合理的分配;在對尾數的量化過程中,可對尾數進行抖晃處理,抖晃所使用的偽隨機數生器的可在不同的平台上獲得相同的結果。最後由六個塊的頻譜包絡、粗量化的尾數及相應的參數組成AC-3數據幀格式,連續的幀匯成數碼流輸出。
指數變換編碼
由時域變換到頻域的塊長度的選擇是指數變換編碼的基礎。在AC-3中定義了兩種長度切換,一種是512個樣值點的長塊,一種是256個樣值點的短塊。在信號頻譜分析時,對要處理的聲道信號塊區截取得越長越好,這樣可以得到較好的頻率分辨力,同時也能得到較高的編碼效率。但是較長的數據塊可能包含了一些不同一些可能被識別的噪音,如pre-echo。也就是說人耳因時間和頻率上存在的遮蔽效應在進行指數變換編碼時是有矛質的,不能同時兼顧,必須統籌處理。對於穩態信號,其頻率隨時間變換緩慢,為提高編碼效率,要求濾波器組有好的頻率分辨力,即要求一個長區塊;而對於快速變化的信號,則要求好的時間分辨力,即要求一個短區塊。在編碼器中,輸入信號在經過3Hz高通濾波器去除直流成分后,再經過一個8kHz的高通濾波器取出高頻成分,用其能量與預先設定的閾值相比較,以檢測信號的瞬變情況。
改良離散餘弦變換
AC-3採用基於改良離散餘弦變換(MDCT)的自適應變換編碼(ATC)演演算法。雖然在AC-3標準中定義了MDCT變換,但是實際採用一個N/4點的IFFT(快速傅立葉變換),再加上兩個簡單的Pre-IFFT和Post-IFFT作為調整,以實現一個N點的IMDCT變換。ATC演演算法的一個重要考慮是基於聽覺遮蔽效應的臨界頻帶理論,即在臨界頻帶內一個聲音對另一個聲音信號的遮蔽效應最明顯。因此,劃分頻帶的濾波器組要有足夠迅速的頻率響應,以此保證臨界頻帶外的雜訊衰減足夠大,使時域和頻率內的雜訊限定在遮蔽閾值以下。
比特分配技術
在AC-3編碼器的比特分配技術中,採用了應用廣泛的前向和後向自適應比特分配法則。前向自適應方法是編碼器計算比特分配,並把比特分配信息明確地編入數據比特流中,其特點是在前端編碼過程中使用聽覺模型,因此修改模型對接收側解碼過程沒有影響;其缺點是降低編碼效率,因為要傳送比特分配信息而佔用了一部分有效比特。後向自適應方法沒有得到編碼器明確的比特分配信息,而是從數碼流中產生比特分配信息,優點是不佔用有效比特,因此有更高的傳輸效率。其缺點是要從接收的數據中計算比特分配,如果計算太複雜會使解碼器的成本升高。此外,解碼器的演演算法也會隨著編碼器聽覺模型的改變而改變。AC-3採用混合前向/後向自適應比特分配,在提高碼率和降低成本間取得了平衡。
AC-3解碼器的解碼原理基本上是編碼的逆向過程,首先解碼器必須與編碼數據流同步,然後從經過數據糾錯校驗的數碼流中分離出控制數據、系統配置參數、編碼后的頻譜包絡及量化后的尾數等內容,根據聲音的頻譜包絡產生比特分配信息,對尾數部分進行反量化,恢復變換係數的指數和尾數,再經過合成濾波器組,把數據由頻域變換到時域,最後輸出重建的PCM樣值信號。
感官模型
通過對AC-3的了解,可以看到AC-3技術充分利用人耳的感官模型,針對不同性質的信號,採取了相應有效的演演算法,達到了在保證較高音質的前提下實現較高碼率的預期目的,是一種非常高效而又經濟的數字音頻壓縮系統。AC-3是美國數字電視系統的強制標準,是歐洲數字電視系統的推薦標準,同時,AC-3還是DVD系統的強制標準。目前我國正在發展和推廣數字電視系統,所有有理由相信AC-3技術會有一個不錯的應用前景。

在DVD中應用


以美國C-CUBE公司研製成功的ZIVA-D6 DVD解壓晶元為核心,組成了一個DVD播放機(Dolby Digital C級產品)方案。其音頻解碼和輸出的方框圖如圖1所示。該方案可支持多種源音頻的解碼,有一個光纖數碼輸出,一個2聲道模擬輸出和一個5.1聲道模擬輸出。既滿足了杜比AC-3的輸出配置要求,又滿足了與不同功放的配接。
聲源的解碼輸出模式
ZiVA可以根據檢測到音源碼的採樣頻率和大小的變化進行音源識別,主要是MPEG-1的系統碼流,MPEG-2的節目碼流,LPCM的採樣碼和VCD的扇區碼。然後通報MCU以便控制數模轉換器
聲源CD-DA,LPCM,MPEG1等都以1或2聲道的格式記錄於光碟中,而且ZiVA-D6不包含Dolby Pro Logic解碼器,所以都以1或2聲道的方式輸出。
聲源Dolby Digital經解碼生成多聲道的數碼送到D/A轉換器,可根據節目源內容和聽音喇叭配置的數量,設置生成相應的多聲道的模擬聲頻輸出。例如3/2,LCR/SL SR;2/2,LR/SL SR;3/1,LCR/S;2/1,LR/S;3/0,LCR;2/0,LR;1/0 C;2/0,LtRt等八種數碼混合輸出模式。以上的各種模式是由ZiVA-D6解碼器通過矩陣混合產生,SUB聲道沒參與混合,是獨立聲道輸出。
表面上ZiVA-D6解碼器輸出模式等同杜比輸出模式,但目前其技術規範並不能完全符合AC-3的規格。因此需要在D/A後作專門電路設計以達到杜比AC-3的規格要求,見本文四。
DVD音頻輸出
DVD音頻有兩種輸出形式:一是數碼輸出;二是音頻模擬輸出。
數碼輸出有兩種格式:光纖數碼輸出(IEC958或IEC1937)和數碼RF輸出。本方案選擇光纖數碼IEC958輸出,採用S/PDIF(SONY/PHIL IPS數碼界面)光學聯結器(內含電光轉換器)生成光信號,再用光纖傳輸到其它A/V產品,如AC-3功率放大器等。
音頻模擬輸出:2-ch輸出是符合杜比AC-3混合輸出要求的必選項,且在聲源為Dolby Digital時,以2/0,LtRt(杜比定向邏輯模式)輸出。線性輸出起初意圖是聯結到一個外接的立體聲或環繞聲複製系統,而不直接聯結功率放大器。於是應該有符合標準電平的固定聲音輸出,這個標準電平依靠應用軟體進行控制。所以DVD等視頻影碟機取消音量控制線性輸出。而多路輸出是可選擇項,本方案亦選擇。