摘要:隨著網(wǎng)絡(luò)多媒體技術(shù)的發(fā)展,采用MPEG-4技術(shù)向計(jì)算機(jī)用戶提供VOD業(yè)務(wù)已經(jīng)大量出現(xiàn),由于都是MPEG(運(yùn)動(dòng)圖像專家組)這個(gè)組織提出的建議,因此一般地認(rèn)辦MPEG-4是MPEG-2的一個(gè)延續(xù)版本。事實(shí)上,這兩者之間有著較大的差別。本文對(duì)MPEG-2與MPEG-4作一些簡(jiǎn)單的介紹和比較。
熟悉數(shù)字視音頻技術(shù)的人對(duì)MPEG一定不陌生,這是ISO組織運(yùn)動(dòng)圖像專家組(Moving Picture Expert Group)的簡(jiǎn)稱,該組織成立于1988年,多年來(lái)一直致力于制定與有關(guān)研制視頻壓縮、音頻壓縮及多種壓縮數(shù)據(jù)流復(fù)合及同步方面的國(guó)際標(biāo)準(zhǔn)。繼1990年公布MPEG-1的標(biāo)準(zhǔn)以來(lái),先后公布了MPEG-2標(biāo)準(zhǔn)(1994年)以及MPEG-4標(biāo)準(zhǔn)(1996年),目前正在研究制定MPEG-7標(biāo)準(zhǔn)。其中,大家所熟知的VCD和DVD分別采用了MPEG-1和MPEG-2技術(shù),而MPEG-4則是最近一階段隨著網(wǎng)絡(luò)多媒體發(fā)展而大量被采用的技術(shù)。從原理來(lái)看,MPEG-2是MPEG-1的延伸,而MPEG-4的編碼出發(fā)點(diǎn)與MPEG-2相比則有較大的差異。因此,本文旨在介紹MPEG-2與MPEG-4這兩個(gè)標(biāo)準(zhǔn)。
1 MPEG-2技術(shù)
MPEG-2的初衷是為廣播級(jí)電視質(zhì)量(CCIR6601格式)的視音頻信號(hào)定義的壓縮編碼標(biāo)準(zhǔn),但最終結(jié)果是成為了一個(gè)通用的標(biāo)準(zhǔn),能在很大范圍內(nèi)對(duì)不同分辨率和不同輸出比特率的圖像信號(hào)進(jìn)行有效編碼。
MPEG-2的編碼技術(shù)主要基于兩個(gè)概念:即時(shí)間相關(guān)性與空間相關(guān)性。所謂時(shí)間相關(guān)性指的是物體前后運(yùn)動(dòng)的連續(xù)性,例如,一扇門的開啟不可能是開關(guān)兩個(gè)狀態(tài),而一定是關(guān)、微開、開等一系列的連續(xù)動(dòng)作,因此利用前一次的動(dòng)作可以預(yù)測(cè)下一次的動(dòng)作;空間相關(guān)性指的是空間內(nèi)相鄰物體的色彩和亮度是一個(gè)漸變過(guò)程,而非一個(gè)突變過(guò)程。有一點(diǎn)美術(shù)常識(shí)的人都很容易明白,即白黑的過(guò)渡是漸進(jìn)的,而非突變。如果將空間每一點(diǎn)及時(shí)間上每一幀進(jìn)行獨(dú)立編碼,雖然能夠表達(dá)所有的信息,但是帶寬非常大,幾乎沒(méi)有一樣載體可以經(jīng)濟(jì)地傳送這種信號(hào);另一方面從信息學(xué)的角度來(lái)看,也包含著大量的冗余信息。數(shù)據(jù)壓縮正是基于這樣的角度,采用相應(yīng)的編碼方式將大量的冗余信息去除,保留有用的信息,有效節(jié)省帶寬。
MPEG-2技術(shù)綜合采用了3大基本編碼技術(shù),即預(yù)測(cè)編碼、變換編碼和統(tǒng)計(jì)編碼。壓縮技術(shù)采用多種編碼手段消除系統(tǒng)的冗余信息,歸納起來(lái)將有以下四個(gè)方面。
①利用二維DCT減少圖像的空間冗余度;
②利用運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)減少圖像的時(shí)間域冗余度;
③利用視覺(jué)加權(quán)量化減少圖像的“灰度域”冗余度;
④利用熵編碼來(lái)減少圖像“頻率域”上統(tǒng)計(jì)特性方面的冗余度;
此外,MPEG-2在MPEG-1的基礎(chǔ)之上擴(kuò)充了“可伸縮性”和“可分級(jí)性”兩個(gè)概念,所謂“可伸縮性”指的是對(duì)碼流的一部分進(jìn)行編碼和對(duì)碼流的全部解碼獲得的圖像分辨率(或信噪比等)要低。MPEG-2所支持的可伸縮的視頻編碼方式共有時(shí)間、空間、信噪比及數(shù)據(jù)分割等四種!翱煞旨(jí)性”則是指在MPEG-2中用范疇(Profile)以及層次兩個(gè)定義來(lái)描述不同的編碼參數(shù)集。每個(gè)范疇是前一個(gè)的合集(Profile),層次則規(guī)定了空間和時(shí)間分辨率的上限。
MPEG-2標(biāo)準(zhǔn)的第3部分詳細(xì)地描述音頻部分的壓縮,并在MPEG-1的基礎(chǔ)之上,增加了AC-3編碼方式。對(duì)音頻部分信號(hào)采用3種壓縮模式,稱為層次1、2和3。隨著層次的增加,復(fù)雜度相應(yīng)增加,層次具有向下兼容性,即層次3的解碼器可以對(duì)層次2或?qū)哟?編碼的碼流進(jìn)行解碼。
層次2與MUSICAM(Masking Pattern Adapted Universal Subband Integrated Coding and Mul-tiplexing)壓縮方法相同。對(duì)于頻率在20kHz以下的音樂(lè)信號(hào),以48kHz(或44.1kHz)采用并用16(或18)比特量化,采用上述的方法可以將雙聲道立體聲的一個(gè)聲道壓縮成96或128kb/s。層次1是層次2的簡(jiǎn)化形式,它將單聲道壓縮到192或256kb/s。層次3即我們通常說(shuō)的MP3,采用了MUSICAM和ASPEC(Adaptive Spectual Perceptual Entropy Coding)兩種算法的結(jié)合,壓縮后的比特率為每聲道64kb/s。
AC-3則是對(duì)6個(gè)聲道的音頻進(jìn)行壓縮的標(biāo)準(zhǔn),這6個(gè)聲道分別為左、中、右、左環(huán)繞、右環(huán)繞和低頻增強(qiáng),其中前5個(gè)聲道的帶寬為3Hz20kHz,最后一個(gè)聲道限制在120Hz。所有聲道的采樣率均為48kHz,每個(gè)取樣值量化到1622b,并采用TDAC分析儀將音頻信號(hào)劃分成子帶,然后根據(jù)人的聽覺(jué)心理-生理特征對(duì)不同子帶信號(hào)采取不同的量化以實(shí)現(xiàn)數(shù)據(jù)的壓縮。多個(gè)聲道的總數(shù)據(jù)率最后壓縮成320kb/s。
2 MPEG-4技術(shù)
從技術(shù)角度來(lái)看,MPEG-4標(biāo)準(zhǔn)與MPEG-2標(biāo)準(zhǔn)的基點(diǎn)大相徑庭,MPEG-4不再將圖像看成是一個(gè)矩形像素陣列的序列,把音頻看成是一個(gè)多聲道或單聲道的聲音,而是深入到組成一個(gè)場(chǎng)景的視頻、音頻對(duì)象的語(yǔ)義中去,對(duì)不同的主體采用不同的編碼方式,例如把一幅圖像中活潑的白貓和毛線團(tuán)以及背景中的房間分別進(jìn)行編碼。各種視、音頻源不限于自然界,也可以是合成源,最終在解碼端進(jìn)行組合。因此MPEG-4是完全基于對(duì)象的一種編碼方式。當(dāng)然MPEG-4采用了比MPEG-2更為先進(jìn)的壓縮方式,因此簡(jiǎn)單說(shuō),基于內(nèi)容的壓縮、更高的壓縮比和時(shí)空可伸縮性是MPEG-4的3個(gè)最重要的特點(diǎn)。
MPEG-4幾乎涵蓋了MPEG-2的所有功能,并支持基于內(nèi)容的獨(dú)立編碼和解碼。此項(xiàng)功能又成為基于內(nèi)容的可分級(jí)性,這一機(jī)制為壓縮域中對(duì)圖像或視頻內(nèi)容的交互提供了最基本機(jī)制,而無(wú)須在接收機(jī)做進(jìn)一步的分割或代碼轉(zhuǎn)換。
MPEG-4自制定之日起,就受到了密切關(guān)注,從1993年開始著手制定,到預(yù)定完成時(shí)間(1997年)似乎仍很不成熟,因而轉(zhuǎn)向全面支持目前標(biāo)準(zhǔn)尚未全面支持的應(yīng)用。例如,移動(dòng)通信中的聲像業(yè)務(wù)、與其它多媒體數(shù)據(jù)(如計(jì)算機(jī)產(chǎn)生的圖形、圖像)的集成和交互式多媒體服務(wù)等。MPEG-4發(fā)展的艱難歷程可以從兩個(gè)方面加以說(shuō)明。
(1)MPEG-4標(biāo)準(zhǔn)在制定時(shí)想適用于所有的應(yīng)用和環(huán)境,并想采用第二代壓縮算法。但是實(shí)際由于當(dāng)時(shí)第二代算法中的很多算法都很不成熟,因此結(jié)果使得MPEG-4的壓縮技術(shù)變的難度很高,使得其不得不中途變節(jié),加長(zhǎng)了應(yīng)用的時(shí)間、喪失了占據(jù)市場(chǎng)的先機(jī);
(2)由于時(shí)間上的延遲,本希望應(yīng)用于各種場(chǎng)合,結(jié)果反變成沒(méi)有適用的場(chǎng)合。從低信息量的視訊電話、視訊會(huì)議、到儲(chǔ)存媒體的VCD、DVD,到最高品質(zhì)的HDTV,各種標(biāo)準(zhǔn)已經(jīng)確定,各相關(guān)產(chǎn)品也已經(jīng)陸續(xù)上市。而廠商受限于研發(fā)及銷售成本和時(shí)間的考慮,不太可能為了新的標(biāo)準(zhǔn)而重新開發(fā)產(chǎn)品。
3 結(jié)論
通過(guò)以上的介紹不難看出,MPEG-2與MPEG-4之間最根本的區(qū)別在于編碼的出發(fā)點(diǎn)的不同,前者是基于矩陣相素圖像的壓縮,后種是基于圖像中不同物體的壓縮;前者發(fā)展的比較成熟,并已經(jīng)成為廣播電視行業(yè)的標(biāo)準(zhǔn),后者主要針對(duì)于低碼率場(chǎng)合應(yīng)用,適用相對(duì)范圍寬。從發(fā)展趨勢(shì)上看,MPEG-2將會(huì)在有線電視網(wǎng)上進(jìn)一步發(fā)展,而MPEG-7則是MPEG-4的進(jìn)一步發(fā)展,主要適用于基于對(duì)象的查詢,并將在IP網(wǎng)上將會(huì)得到進(jìn)一步發(fā)展。