MPEG-1

MPEG-1

MPEG-1是MPEG組織制定的第一個視頻和音頻有損壓縮標準。視頻壓縮演演算法於1990年定義完成。1992年底,MPEG-1正式被批准成為國際標準。MPEG-1是為CD光碟介質定製的的視頻和音頻壓縮格式。一張70分鐘的CD光碟傳輸速率大約在1.4Mbps。而MPEG-1採用了塊方式的運動補償、離散餘弦變換(DCT)、量化等技術,並為1.2Mbps傳輸速率進行了優化。MPEG-1隨後被Video CD採用作為核心技術。MPEG-1的輸出質量大約和傳統錄像機VCR,信號質量相當,這也許是Video CD在發達國家未獲成功的原因。

概述


MPEG-1是為CD光碟介質定製的視頻和音頻壓縮格式。VCD的解析度只有約352×240,並使用固定的比特率(1.15Mbps),因此在播放快速動作的視頻時,由於數據量不足,令壓縮時宏區塊無法全面調整,結果使視頻畫面出現模糊的方塊。因此MPEG-1的輸出質量大約和傳統錄像機VCR相當,這也許是Video CD在發達國家未獲成功的原因。MPEG-1音頻分三代,其中最著名的第三代協議被稱為MPEG-1 Layer 3,簡稱MP3,已經成為廣泛流傳的音頻壓縮技術。MPEG-1音頻技術在每一代之間,在保留相同的輸出質量之外,壓縮率都比上一代高。第一代協議MP1被應用在LD作為記錄數字音頻以及飛利浦公司的DGC上;而第二代協議MP2後來被應用於歐洲版的DVD音頻層之一。
MPEG-1具有以下特點:
隨機訪問
靈活的幀率
可變的圖像尺寸
定義了I-幀、P-幀和B-幀
運動補償可跨越多個幀
半像素精度的運動向量
量化矩陣
GOF結構
slice結構

音頻分層


MPEG-1音頻分三層,分別為MPEG-1 Layer1,MPEG-Layer2以及MPEG-Layer3,並且高層兼容低層。其中第三層協議被稱為MPEG-1 Layer 3,簡稱MP3。MP3已經成為廣泛流傳的的音頻壓縮技術。
MPEG-1 Layer1採用每聲道192kbit/s,每幀384個樣本,32個等寬子帶,固定分割數據塊。子帶編碼用DCT(離散餘弦變換)和(快速傅立葉變換)計運算元帶信號量化bit數。採用基於頻域掩蔽效應的心理聲學模型,使量化雜訊低於掩蔽值。量化採用帶死區的線性量化器,主要用於數字盒式磁帶(DCC)。
MPEG-1 Layer2採用每聲道128kbit/s,每幀1152個樣本,32個子帶,屬不同分幀方式。採用共同頻域和時域掩蔽效應的心理聲學模型,並對高、中,低頻段的比特分配進行限制,並對比特分配、比例因子,取樣進行附加編碼。Layer2 廣泛用於數字電視,CD-ROM,CD-I和VCD等。
MPEG-1 Layer3採用每聲道64kbit/s,用混合濾波器組提高頻率解析度,按信號解析度分成6X32或18X32個子帶,克服平均32個子帶的Layer1,Layer2在中低頻段解析度偏低的缺點。採用心理聲學模型2,增設不均勻量化器,量化值進行熵編碼。主要用於ISDN(綜合業務數字網)音頻編碼
MPEG-1制定於1992年,為工業級標準而設計,它可針對SIF標準解析度(對於NTSC製為352X240;對於PAL製為352X288)的圖像進行壓縮,傳輸速率為1.5Mbits/sec,每秒播放30幀,具有CD(指激光唱盤)音質,質量級別基本與VHS相當。MPEG的編碼速率最高可達4- 5Mbits/sec,但隨著速率的提高,其解碼后的圖象質量有所降低。
MPEG-1也被用於數字電話網路上的視頻傳輸,如非對稱數字用戶線路(ADSL),視頻點播(VOD),以及教育網路等。同時,MPEG-1也可被用做記錄媒體或是在INTERNET上傳輸音頻。

運用


MPEG-1曾經是VCD的主要壓縮標準,是實時視頻壓縮的主流,可適用於不同帶寬的設備,如CD-ROM、Video-CD、CD-I。與M-JPEG技術相比較,在實時壓縮、每幀數據量、處理速度上均有顯著的提高。MPEG1可以滿足多達16路以上25幀/秒的壓縮速度,在500kbit/s的壓縮碼流和352像素×288行的清晰度下,每幀大小僅為2k。若從VCD到超級VCD到DVD的不同格式來看,MPEG1的352 ×288格式,MPEG2可有576×352、704 ×576等,用於CDROM上存儲同步和彩色運動標視頻信號,旨在達到VCR(模擬式磁帶錄放機Video Cassette Recorder;VCR)質量,其視頻壓縮率為26:1。MPEG1可使圖像在空間軸上最多壓縮1/38,在時間軸上對相對變化較小的數據最多壓縮1/5。MPEG1壓縮后的數據傳輸率為1.5Mbps,壓縮后的源輸入格式SIF(Source Input Format),解析度為352像素×288行(PAL制),亮度信號的解析度為360×240,色度信號的解析度為180×120,每秒30幀。MPEG1對色差分量採用4:1:1的二次採樣率。MPEG1、MPEG2是傳送一張張不同動作的局部畫面。在實現方式上,MPEG1可以藉助於現有的解碼晶元來完成,而不像M-JPEG那樣過多依賴於主機的CPU。與軟體壓縮相比,硬體壓縮可以節省計算機資源,降低系統成本。
但也存在著諸多不足。一是壓縮比還不夠大,在多路監控情況下,錄像所要求的磁碟空間過大。尤其當DVR主機超過8路時,為了保存一個月的存儲量,通常需要10個80G硬碟,或更多,硬碟投資大,而由此引起的硬碟故障和維護更是叫人頭疼。二是圖像清晰度還不夠高。由於MPEG1最大清晰度僅為352 X 288,考慮到容量、模擬數字量化損失等其它因素,回放清晰度不高,這也是市場反應的主要問題。三是對傳輸圖像的帶寬有一定的要求,不適合網路傳輸,尤其是在常用的低帶寬網路上無法實現遠程多路視頻傳送。四是MPEG1的錄像幀數固定為每秒25幀,不能丟幀錄像,使用靈活性較差。從廣泛採用的壓縮晶元來看,也缺乏有效的調控手段,例如關鍵幀設定、取樣區域設定等等,造成在保安監控領域應用不適合,造價也高。
總體看來M-JPEG與MPEG1由於技術成熟,是DVR市場的主流技術,但兩者的致命弱點就是硬碟耗費量大,且不能同時滿足保安與實時錄像場合的需要。

特點


隨機訪問,靈活的幀率、可變的圖像尺寸、定義了I-幀、P-幀和B-幀、運動補償可跨越多個幀、半像素精度的運動向量、量化矩陣、GOF結構、slice結構、技術細節、輸入視頻格式。

參數


最大像素數/行:720
最大行數/影格:576
最大影格/秒:30
最大宏塊/影格:396
最大宏塊/秒:9900
最大位元率:1.86Mbps
最大解碼緩衝區尺寸:376832bit。

壓縮模式


MPEG-1可以按照分層的概念來理解,一個MPEG-1視頻序列,包含多個GOP,每個GOP包含多個幀,每個幀包含多個slice。
影格是MPEG-1的一個重要基本元素,一個影格就是一個完整的顯示圖像。影格的種類有四種:
I-圖像/影格(節點編碼圖像,intra coded picture)參考圖像,相當於一個固定影像,且獨立於其它的圖像類型。每個圖像群組由此類型的圖像開始。編碼時獨立編碼,僅適用幀內編碼技術,因而解碼時不參考其他幀,類似JPEG編碼。
P-圖像/影格(預測編碼圖像,predictive coded picture)包含來自先前的 I 或 P-畫格的差異資訊。編碼時使用運動補償和運\動估計,採用前向估計,參考之前的I-幀或者P-幀去預測該P格。
B-圖像/影格(前後預測編碼圖像,bidirectionally predictive coded pictures)包含來自先前和/或之後的 I 或 P-畫格的差異資訊。編碼也使用運動補償和運\動估計,預估採用前向估計、後向估計或是雙向估計,主要參考前面的或者後面的I格或者P格。
D-圖像/影格(指示編碼圖像,DC direct coded picture)用於快速進帶。僅由DC直流分量構造的圖像,可在低比特率的時候做瀏覽用。實際編碼中很少使用。

解碼標準


MPEG-1 audio layer 1
類型:Audio
制定者:MPEG
所需頻寬:384kbps(壓縮4倍)
特性:編碼簡單,用於數字盒式錄音磁帶,2聲道,VCD中使用的音頻壓縮方案就是MPEG-1層Ⅰ。
優點:壓縮方式相對時域壓縮技術而言要複雜得多,同時編碼效率、聲音質量也大幅提高,編碼延時相應增加。可以達到“完全透明”的聲音質量(EBU音質標準)
缺點:頻寬要求較高
應用領域:voip
版稅方式:Free
備註:MPEG-1聲音壓縮編碼是國際上第一個高保真聲音數據壓縮的國際標準,它分為三個層次:
--層1(Layer 1):編碼簡單,用於數字盒式錄音磁帶
--層2(Layer 2):演演算法複雜度中等,用於數字音頻廣播(DAB)和VCD等
--層3(Layer 3):編碼複雜,用於網際網路上的高質量聲音的傳輸,如MP3音樂壓縮10倍