音頻格式
音頻格式
音頻格式即音樂格式。音頻格式是指要在計算機內播放或是處理音頻文件,是對聲音文件進行數、模轉換的過程。音頻格式最大帶寬是20KHZ,速率介於40~50KHZ之間,採用線性脈衝編碼調製PCM,每一量化步長都具有相等的長度。
cd光碟用於儲存cd格式文件
WAVE格式文件音頻圖
AIFF(Audio Interchange File Format)格式和AU格式,它們都和WAV非常相像,在大多數的音頻編輯軟體中也都支持它們這幾種常見的音樂格式。AIFF是音頻交換文件格式的英文縮寫。是APPLE公司開發的一種音頻文件格式,被MACINTOSH平台及其應用程序所支持,NETSCAPE瀏覽器中LIVEAUDIO也支持AIFF格式。所以大家都不常見。AIFF是Apple蘋果電腦上面的標準音頻格式,屬於QuickTime技術的一部分。這一格式的特點就是格式本身與數據的意義無關,因此受到了Microsoft的青睞,並據此搞出來WAV格式。AIFF雖然是一種很優秀的文件格式,但由於它是蘋果電腦上的格式,因此在PC平台上並沒有得到很大的流行。不過由於Apple電腦多用於多媒體製作出版行業,因此幾乎所有的音頻編輯軟體和播放軟體都或多或少地支持AIFF格式。只要蘋果電腦還在,AIFF就始終還佔有一席之地。由於AIFF的包容特性,所以它支持許多壓縮技術。
MPEG是動態圖象專家組的英文縮寫。這個專家組始建於1988年,專門負責為CD建立視頻和音頻壓縮標準。MPEG音頻文件指的是MPEG標準中的聲音部分即MPEG音頻層。目前INTERNET上的音樂格式以MP3最為常見。雖然它是一種有損壓縮,但是它的最大優勢是以極小的聲音失真換來了較高的壓縮比。MPEG含有格式包括:MPEG-1、MPEG-2、MPEG-Layer3、MPEG-4
MP3格式誕生於八十年代的德國,所謂的MP3也就是指的是MPEG標準中的音頻部分,也就是MPEG音頻層。根據壓縮質量和編碼處理的不同分為3層,分別對應 *.mp1 / *.mp2/ *.mp3 這3種聲音文件。需要提醒大家注意的地方是:MPEG音頻文件的壓縮是一種有損壓縮,MPEG3音頻編碼具有10:1~12:1的高壓縮率,同時基本保持低音頻部分不失真,但是犧牲了聲音文件中12KHz到16KHz高音頻這部分的質量來換取文件的尺寸,相同長度的音樂文件,用 *.mp3 格式來儲存,一般只有 *.wav 文件的1/10,因而音質要次於CD格式或WAV格式的聲音文件。由於其文件尺寸小,音質好;所以在它問世之初還沒有什麼別的音頻格式可以與之匹敵,因而為*.mp3格式的發展提供了良好的條件。直到現在,這種格式還是很流行,作為主流音頻格式的地位難以被撼動。但是樹大招風,MP3音樂的版權問題也一直找不到辦法解決,因為MP3沒有版權保護技術,說白了也就是誰都可以用。
MP3格式壓縮音樂的採樣頻率有很多種,可以用64Kbps或更低的採樣頻率節省空間,也可以用320Kbps的標準達到極高的音質。用裝有Fraunhofer IIS Mpeg Lyaer3的 MP3編碼器(現在效果最好的編碼器)MusicMatch Jukebox 6.0在128Kbps的頻率下編碼一首3分鐘的歌曲,得到2.82MB的MP3文件。採用預設的CBR(固定採樣頻率)技術可以以固定的頻率採樣一首歌曲,而VBR(可變採樣頻率)則可以在音樂“忙”的時候加大採樣的頻率獲取更高的音質,不過產生的MP3文件可能在某些播放器上無法播放。把VBR的級別設定成為與前面的CBR文件的音質基本一樣,生成的VBR MP3文件為2.9MB。
MP3是到2008年止使用用戶最多的有損壓縮數字音頻格式了。它的全稱是MPEG(MPEG:MovingPictureExpertsGroup)AudioLayer-3,剛出現時它的編碼技術並不完善,它更像一個編碼標準框架,留待人們去完善。早期的MP3編碼採用的的是固定編碼率的方式(CBR),看到的128Kbps,就是代表它是以128Kbps固定數據速率編碼——你可以提高這個編碼率,最高可以到320Kbps,音質會更好,自然,文件的體積會相應增大。
因為MP3的編碼方式是開放的,可以在這個標準框架的基礎上自己選擇不同的聲學原理進行壓縮處理,所以,很快由Xing公司推出可變編碼率的壓縮方式(VBR)。它的原理就是利用將一首歌的複雜部分用高bitrate編碼,簡單部分用低bitrate編碼,通過這種方式,進一步取得質量和體積的統一。當然,早期的Xing編碼器的VBR演演算法很差,音質與CBR(固定碼率)相去甚遠。但是,這種演演算法指明了一種方向,其他開發者紛紛推出自己的VBR演演算法,使得效果一直在改進。目前公認比較好的首推LAME,它完美地實現了VBR演演算法,而且它是是完全免費的軟體,並且由愛好者組成的開發團隊一直在不斷的發展完善
而在VBR的基礎上,LAME更加發展出ABR演演算法。ABR(AverageBitrate)平均比特率,是VBR的一種插值參數。LAME針對CBR不佳的文件體積比和VBR生成文件大小不定的特點獨創了這種編碼模式。ABR在指定的文件大小內,以每50幀(30幀約1秒)為一段,低頻和不敏感頻率使用相對低的流量,高頻和大動態表現時使用高流量,可以做為VBR和CBR的一種折衷選擇。
音頻格式
MPEG-4標準是由國際運動圖像專家組於2000年10月公布的一種面向多媒體應用的視頻壓縮標準。它採用了基於對象的壓縮編碼技術,在編碼前首先對視頻序列進行分析,從原始圖像中分割出各個視頻對象,然後再分別對每個視頻對象的形狀信息、運動信息、紋理信息單獨編碼,並通過比MPEG-2更優的運動預測和運動補償來去除連續幀之間的時間冗餘。其核心是基於內容的尺度可變性(Content-basedscalability),可以對圖像中各個對象分配優先順序,對比較重要的對象用高的空間和時間解析度表示,對不甚重要的對象(如監控系統的背景)以較低的解析度表示,甚至不顯示。因此它具有自適應調配資源能力,可以實現高質量低速率的圖像通信和視頻傳輸。 MPEG-4以其高質量、低傳輸速率等優點已經被廣泛應用到網路多媒體、視頻會議和多媒體監控等圖像傳輸系統中。中國內外大部分成熟的MPEG-4應用均為基於PC層面的客戶端和伺服器模式,應用在嵌入式系統上的並不多,且多數嵌入式MPEG-4解碼系統大多使用商業的嵌入式操作系統,如WindowsCE、VxWorks等,成本高、靈活性差。如以嵌入式Linux作為操作系統不僅開發方便,且可以節約成本,並可以根據實際情況進行裁減,佔用資源少、靈活性強,網路性能好,適用範圍更廣。
MIDI(Musical Instrument Digital Interface)格式被經常玩音樂的人使用,MIDI允許數字合成器和其他設備交換數據。MID文件格式由MIDI繼承而來。MID文件並不是一段錄製好的聲音,而是記錄聲音的信息,然後再告訴音效卡如何再現音樂的一組指令。這樣一個MIDI文件每存1分鐘的音樂只用大約5~10KB。MID文件主要用於原始樂器作品,流行歌曲的業餘表演,遊戲音軌以及電子賀卡等。*.mid文件重放的效果完全依賴音效卡的檔次。*.mid格式的最大用處是在電腦作曲領域。*.mid文件可以用作曲軟體寫出,也可以通過音效卡的MIDI口把外接音序器演奏的樂曲輸入電腦里,製成*.mid文件。
WMA (Windows Media Audio) 格式是來自於微軟的重量級選手,後台強硬,音質要強於MP3格式,更遠勝於RA格式,它和日本YAMAHA公司開發的VQF格式一樣,是以減少數據流量但保持音質的方法來達到比MP3壓縮率更高的目的,WMA的壓縮率一般都可以達到1:18左右,WMA的另一個優點是內容提供商可以通過DRM(Digital Rights Management)方案如Windows Media Rights Manager 7加入防拷貝保護。這種內置了版權保護技術可以限制播放時間和播放次數甚至於播放的機器等等,這對被盜版攪得焦頭爛額的音樂公司來說可是一個福音,另外WMA還支持音頻流(Stream)技術,適合在網路上在線播放,作為微軟搶佔網路音樂的開路先鋒可以說是技術領先、風頭強勁,更方便的是不用象MP3那樣需要安裝額外的播放器,而Windows操作系統和Windows Media Player的無縫捆綁讓你只要安裝了windows操作系統就可以直接播放WMA音樂,新版本的Windows Media Player7.0更是增加了直接把CD光碟轉換為WMA聲音格式的功能,在新出品的操作系統Windows XP中,WMA是默認的編碼格式,大家知道Netscape的遭遇,現在“狼”又來了。WMA這種格式在錄製時可以對音質進行調節。同一格式,音質好的可與CD媲美,壓縮率較高的可用於網路廣播。雖然現在網路上還不是很流行,但是在微軟的大規模推廣下已經是得到了越來越多站點的承認和大力支持,在網路音樂領域中直逼*.mp3,在網路廣播方面,也正在瓜分Real打下的天下。因此,幾乎所有的音頻格式都感受到了WMA格式的壓力。微軟官方宣布的資料中稱WMA格式的可保護性極強,甚至可以限定播放機器、播放時間及播放次數,具有相當的版權保護能力。應該說,WMA的推出,就是針對MP3沒有版許可權制的缺點而來——普通用戶可能很歡迎這種格式,但作為版權擁有者的唱片公司來說,它們更喜歡難以複製拷貝的音樂壓縮技術,而微軟的WMA則照顧到了這些唱片公司的需求。
除了版權保護外,WMA還在壓縮比上進行了深化,它的目標是在相同音質條件下文件體積可以變的更小(當然,只在MP3低於192KBPS碼率的情況下有效,實際上當採用LAME演演算法壓縮MP3格式時,高於192KBPS時普遍的反映是MP3的音質要好於WMA)。
RealAudio主要適用於在網路上的在線音樂欣賞。real的的文件格式主要有這麼幾種:有RA(RealAudio)、RM(RealMedia,RealAudio G2)、RMX(RealAudio Secured),還有更多。這些格式的特點是可以隨網路帶寬的不同而改變聲音的質量,在保證大多數人聽到流暢聲音的前提下,令帶寬較富裕的聽眾獲得較好的音質。
近來隨著網路帶寬的普遍改善,Real公司正推出用於網路廣播、達到CD音質的格式。如果你的RealPlayer軟體不能處理這種格式,它就會提醒你下載一個免費的升級包。許多音樂網站 提供了歌曲的Real格式的試聽版本。現在最新的版本是RealPlayer 9.0。
雅馬哈公司另一種格式是*.vqf,它的核心是減少數據流量但保持音質的方法來達到更高的壓縮比,VQF的音頻壓縮率比標準的MPEG音頻壓縮率高出近一倍,可以達到18:1左右甚至更高。也就是說把一首4分鐘的歌曲(WAV文件)壓成MP3,大約需要4MB左右的硬碟空間,而同一首歌曲,如果使用VQF音頻壓縮技術的話,那隻需要2MB左右的硬碟空間。因此,在音頻壓縮率方面,MP3和RA都不是VQF的對手。相同情況下壓縮后VQF的文件體積比MP3小30%~50%,更便利於網上傳播,同時音質極佳,接近CD音質(16位44.1kHz立體聲)。可以說技術上也是很先進的,但是由於宣傳不力,這種格式難有用武之地。*.vqf可以用雅馬哈的播放器播放。同時雅馬哈也提供從*.wav文件轉換到*.vqf文件的軟體。此文件缺少特點外加缺乏宣傳。
VQF音頻文件個格式
VQF即TwinVQ技術雖然是由NTT和YAMAHA開發的,但它們的應用軟體都是免費的。只是NTT和YAMAHA並沒有公布VQF的源代碼。
OggVorbis是一種新的音頻壓縮格式,類似於MP3等現有的音樂格式。但有一點不同的是,它是完全免費、開放和沒有專利限制的。Vorbis是這種音頻壓縮機制的名字,而Ogg則是一個計劃的名字,該計劃意圖設計一個完全開放性的多媒體系統。目前該計劃只實現了OggVorbis這一部分。
OggVorbis文件的擴展名是*.OGG。這種文件的設計格式是非常先進的。這種文件格式可以不斷地進行大小和音質的改良,而不影響舊有的編碼器或播放器。
VORBIS採用有損壓縮,但通過使用更加先進的聲學模型去減少損失,因此,同樣位速率(BitRate)編碼的OGG與MP3相比聽起來更好一些。另外,還有一個原因,MP3格式是受專利保護的。如果你想使用MP3格式發布自己的作品,則需要付給Fraunhofer(發明MP3的公司)專利使用費。而VORBIS就完全沒有這個問題。
OggVorbis格式
AMR全稱Adaptive Multi-Rate,自適應多速率編碼,主要用於移動設備的音頻,壓縮比比較大,但相對其他的壓縮格式質量比較差,由於多用於人聲,通話,效果還是很不錯的。
一、分類
1. AMR: 又稱為AMR-NB,相對於下面的WB而言,語音帶寬範圍:300-3400Hz,8KHz抽樣
2. AMR-WB:AMR WideBand,
語音帶寬範圍: 50-7000Hz 16KHz抽樣
“AMR-WB”全稱為“Adaptive Multi-rate - Wideband”,即“自適應多速率寬頻編碼”,採樣頻率為16kHz,是一種同時被國際標準化組織ITU-T和3GPP採用的寬頻語音編碼標準,也稱為G722.2標準。AMR-WB提供語音帶寬範圍達到50~7000Hz,用戶可主觀感受到話音比以前更加自然、舒適和易於分辨。
與之作比較,現在GSM用的EFR(Enhenced Full Rate,增強型全速率編碼)採樣頻率為8kHz,語音帶寬為200~3400Hz。
AMR-WB應用於窄帶GSM(全速通道16k,GMSK)的優勢在於其可採用從6.6kb/s, 8.85kb/s和12.65kb/s三種編碼,當網路繁忙時C/I惡化,編碼器可以自動調整編碼模式,從而增強QoS。在這種應用中,AMR-WB抗擾度優於AMR-NB。
AMR-WB應用於EDGE、3G可充分體現其優勢。足夠的傳輸帶寬保證AMR-WB可採用從 6.6kb/s到23.85kb/s共九種編碼,語音質量超越PSTN固定電話。
APE是目前流行的數字音樂文件格式之一。與MP3這類有損壓縮方式不同,APE是一種無損壓縮音頻技術,也就是說當你將從音頻CD上讀取的音頻數據文件壓縮成APE格式后,你還可以再將APE格式的文件還原,而還原后的音頻文件與壓縮前的一模一樣,沒有任何損失。APE的文件大小大概為CD的一半,隨著寬頻的普及,APE格式受到了許多音樂愛好者的喜愛,特別是對於希望通過網路傳輸音頻CD的朋友來說,APE可以幫助他們節約大量的資源。當然,目前只能把音樂CD中的曲目和未壓縮的WAV文件轉換成APE格式,MP3文件還無法轉換為APE格式。事實上APE的壓縮率並不高,雖然音質保持得很好,但是壓縮后的容量也沒小多少。一個34MB的WAV文件,壓縮為APE格式后,仍有17MB左右。對於一整張CD來說,壓縮省下來的容量還是可觀的。
FLAC與MP3相仿,都是音頻壓縮編碼,但FLAC是無損壓縮,也就是說音頻以FLAC編碼壓縮后不會丟失任何信息,將FLAC文件還原為WAV文件后,與壓縮前的WAV文件內容相同。這種壓縮與ZIP的方式類似,但FLAC的壓縮比率大於ZIP和RAR,因為FLAC是專門針對PCM音頻的特點設計的壓縮方式。而且可以使用播放器直接播放FLAC壓縮的文件,就象通常播放你的MP3文件一樣。FLAC文件的體積同樣約等於普通音頻CD的一半,並且可以自由地互相轉換,所以它也是音樂光碟存儲在電腦上的最好選擇之一,它會完整保留音頻的原始資料,用戶可以隨時將其轉回光碟,音樂質量不會有任何改變,而在播放當中,FLAC文件的每個數據幀都包含了解碼所需的全部信息,中間的錯誤不會影響其它幀的正常播放,這保證了它的實用有效和最小的網路時間延遲。目前在國內市場上,FLAC已經是和APE齊名的兩大最常用無損音頻格式之一,並且它的編碼技術原理使得它在未來有超過APE的巨大的發展空間。
AAC實際上是高級音頻編碼的縮寫,蘋果ipod、諾基亞手機也支持AAC格式的音頻文件。AAC是由Fraunhofer IIS-A、杜比和AT&T共同開發的一種音頻格式,它是MPEG-2規範的一部分。AAC所採用的運演演算法則與MP3的運演演算法則有所不同,AAC 通過結合其他的功能來提高編碼效率。AAC的音頻演演算法在壓縮能力上遠遠超過了以前的一些壓縮演演算法(比如MP3等)。它還同時支持多達48個音軌、15個低頻音軌、更多種採樣率和比特率、多種語言的兼容能力、更高的解碼效率。總之,AAC可以在比MP3文件縮小30%的前提下提供更好的音質。
音頻文件格式常見的特點有:要在計算機內播放或是處理音頻文件,也就是要對聲音文件進行數、模轉換,這個過程同樣由採樣和量化構成,人耳所能聽到的聲音,最低的頻率是從20Hz起一直到最高頻率20KHZ,20KHz以上人耳是聽不到的,因此音頻文件格式的最大帶寬是20KHZ,故而採樣速率需要介於40~50KHZ之間,而且對每個樣本需要更多的量化比特數。音頻數字化的標準是每個樣本16位-96dB的信噪比,採用線性脈衝編碼調製PCM,每一量化步長都具有相等的長度。在音頻文件的製作中,正是採用這一標準。
作為數字音樂文件格式的標準,WAV格式容量過大,因而使用起來很不方便。因此,一般情況下我們把它壓縮為MP3或WMA格式。壓縮方法有無損壓縮,有損壓縮,以及混成壓縮。MPEG,JPEG就屬於混成壓縮,如果把壓縮的數據還原回去,數據其實是不一樣的。當然,人耳是無法分辨的。因此,如果把MP3,OGG格式從壓縮的狀態還原回去的話,就會產生損失。然而,APE格式即使還原,也能毫無損失地保留原有音質。所以,APE可以無損失高音質地壓縮和還原。在完全保持音質的前提下,APE的壓縮容量有了適當的減小。拿一個最為常見的38MBWAV文件為例,壓縮為APE格式後為25MB左右,比開始足足少了13MB。而且MP3容量越來越大的今天,25M的歌曲已經算不上什麼龐然大物了。以1GB的mp3來說可以放入4張CD,那就是40多首歌曲,已經足夠了!
MP3支持格式有MP3和WMA。MP3由於是有損壓縮,因此講求採樣率,一般是44.1KHZ。另外,還有比特率,即數據流,一般為8---320KBPS。在MP3編碼時,還看看它是否支持可變比特率(VBR),現在出的MP3機大部分都支持,這樣可以減小有效文件的體積。WMA則是微軟力推的一種音頻格式,相對來說要比MP3體積更小。
音頻格式日新月異,到2008年音頻格式包括:CD格式、WAVE(*.WAV)、AIFF、AU、MP3、MIDI、WMA、RealAudio、VQF、OggVorbis、AAC、APE。
音頻格式