- 相關(guān)推薦
TMS320C6201在MPEG-4視頻解碼器中的應(yīng)用
摘要:TMS320C6201是美國(guó)TI公司生產(chǎn)的一種高性能數(shù)字信號(hào)處理器。本文介紹如何利用1片TMS320C6201數(shù)字信號(hào)處理器實(shí)現(xiàn)MPEG-4SVP視頻解碼,并討論解碼器的結(jié)構(gòu),算法、存儲(chǔ)器分配以及程序的優(yōu)化等問(wèn)題,最后給出該解碼器總體特性表。關(guān)鍵詞:TMS320C6201視頻壓縮MPEG-4VOPMBIDCT運(yùn)動(dòng)補(bǔ)償
引言
隨著網(wǎng)絡(luò)和多媒體技術(shù)的發(fā)展,視覺(jué)通信的重要性和需求急劇增加,如桌面視頻會(huì)議、移動(dòng)終端、基于因特網(wǎng)的視音頻通信等。隨之而來(lái)的是視頻壓縮技術(shù)的迅速發(fā)展和視頻壓縮標(biāo)準(zhǔn)的不斷推出。國(guó)際運(yùn)動(dòng)圖像編碼專家組(MPEG)先后推出了MPEG-1、MPEG-2和MPEG-4.MPEG-4是由國(guó)際運(yùn)動(dòng)圖像專家組于1998年11月制定的。它是一個(gè)面向多媒體應(yīng)用的壓縮標(biāo)準(zhǔn),其應(yīng)用覆蓋范圍遠(yuǎn)大于MPEG-1和MPEG-2等標(biāo)準(zhǔn)。從移動(dòng)可視電話到專業(yè)視頻編輯,既支持自然圖像,也支持計(jì)算機(jī)合成圖像。最重要的是它支持交互功能。這是由于MPEG-4采用了與其它標(biāo)準(zhǔn)不同的、基于對(duì)象的圖像描述方式。目前,國(guó)內(nèi)有關(guān)MPEG-4應(yīng)用技術(shù)的研究及開(kāi)發(fā)的工作正在悄然興起。筆者在研究了MPEG-4視頻標(biāo)準(zhǔn)之后,充分利用TMS320C6201的硬件資源和軟件優(yōu)化,實(shí)時(shí)實(shí)現(xiàn)了嵌入式MPEG-4視頻解碼器。
1MPEG-4視頻碼流及主要算法
MPEG-4采用了基于對(duì)象的壓縮編碼技術(shù)。在編碼前,首先要對(duì)視頻序列進(jìn)行分析,從原理圖像中分割出各個(gè)視頻對(duì)象,然后南分別對(duì)每個(gè)視頻對(duì)象單獨(dú)編碼。每個(gè)對(duì)象都有自己的形狀信息(shape)、運(yùn)動(dòng)信息(motion)、紋理信息(texture)。對(duì)視頻對(duì)象的編碼就是對(duì)這3種信息進(jìn)行編碼。MPEG-4通過(guò)運(yùn)動(dòng)預(yù)測(cè)和運(yùn)行補(bǔ)償來(lái)去除連續(xù)幀之間的時(shí)間冗余。運(yùn)動(dòng)預(yù)測(cè)與運(yùn)動(dòng)補(bǔ)償?shù)木瓤梢詾檎袼亍胂袼鼗?/4像素,另外還增了重疊運(yùn)動(dòng)補(bǔ)償方式。與形狀相關(guān)算法有:基于鄰近信息的算術(shù)編碼、水平和垂直填補(bǔ)、擴(kuò)張?zhí)钛a(bǔ)等。與紋理編碼相關(guān)的算法有:離散余弦變換(DCT)、量化、DCT系數(shù)的DC/AC差分預(yù)測(cè)、Zig-Zag掃描、游程編碼、霍夫曼變長(zhǎng)編碼等。
筆者實(shí)現(xiàn)的是MPEG-4的SVP(SimpleVisualProfile)視頻解碼。視頻序列全部為矩形,所以不存在任意形狀編碼。視頻序列按照視頻對(duì)象層VOL(VideoObjectLayer)、視頻對(duì)象平臺(tái)VOP(VideoObjectPlane)、宏塊MB(MacroBlock)視順序編成一串碼流。1個(gè)VOL中包含多個(gè)VOP,1個(gè)VOP中包含多個(gè)MB。MB是碼流中的基本單位。MB又分為幀內(nèi)MB(intraMB)、幀間MB(imterMB)。幀間4VMB(inter4VMB)等幾種。在I-VOP中,所有的宏塊都是intraMB。P-VOP中宏塊有多種可能,可以是intraMB、interMB或inter4VMB。P-VOP中的interMB或inter4VMB的碼流描述如下:
MB碼流=MB形狀+MB頭信息+MV+DCT紋理信息(Y1+Y2+Y3+Y4+U+V)
由于是矩形幀,所以無(wú)形狀編碼MBshape部分。
MB頭信息中主要包括4個(gè)參數(shù):not_coded(本MB是否編碼的標(biāo)志位)、mcbpc(色度塊U和V是否編碼的標(biāo)志位)、cbpy(亮度塊Y1~Y4是否編碼的標(biāo)志位)、dquant(本MB中DCT系數(shù)量化步長(zhǎng)的增量值)。
MV為運(yùn)動(dòng)矢量,實(shí)際寫(xiě)入碼流的是運(yùn)動(dòng)矢量誤差值(ΔMV),這是因?yàn)榫幋a中MV采用差分編碼。如果MB是一個(gè)interMB,則表示本MB只有1個(gè)運(yùn)動(dòng)矢量,所以在碼流中只傳1個(gè)ΔMV;如果MB是一個(gè)inter4VMB,則表示本MB有4個(gè)運(yùn)行矢量,即每個(gè)子塊(block)有1個(gè)運(yùn)動(dòng)矢量,所以在碼流中需傳送4個(gè)ΔMV,即mvd1、mvd2、mvd3和mvd4。
最后是一連串經(jīng)過(guò)量化、Zig-Zag掃描、游程編碼和霍夫曼變長(zhǎng)編碼的DCT系數(shù),按照Y1、Y2、Y3、Y4、U和V的先后順序編碼。
2TMS320C6201DSP及EVM板介紹
2.1TMS320C6201DSP
TMS320C6201是美國(guó)TI公司的C6000系列新一代數(shù)字信號(hào)處理器中的第1個(gè)產(chǎn)品,于1997年3月發(fā)布。它是一個(gè)32bit的定點(diǎn)DSP芯片。該芯片具有8個(gè)相互獨(dú)立的功能單元,可以工作在200MHz的CPU時(shí)鐘頻率,全速運(yùn)行時(shí)可達(dá)到1600MIPS。其主要特性包括:
*芯片內(nèi)核采用VelociTITM先進(jìn)的超長(zhǎng)指令字(VLIW)結(jié)構(gòu),具有高度的并行性和快速的運(yùn)行能力,每個(gè)時(shí)鐘周期最多可同時(shí)執(zhí)行8條32位指令,并且所有的指令都可以有條件執(zhí)行;
*具有豐富的指令系統(tǒng)且可對(duì)字節(jié)操作,支持16位的乘法運(yùn)算;
*有4個(gè)彼此獨(dú)立的快速的DMA通道,可以進(jìn)行多種形式的數(shù)據(jù)傳輸。
*片內(nèi)數(shù)據(jù)存儲(chǔ)區(qū)和程序存儲(chǔ)區(qū)各64KB,并支持多種數(shù)據(jù)寬度8位/16位/32位;32位的外部存儲(chǔ)器接口,提供與片外SDRAM、SDSRAM和SRAM的直接接口。
TMS320C6201的以上特點(diǎn),能滿足視頻圖像處理的實(shí)時(shí)性要求。例如:TMS320C6201DSP計(jì)算1塊8×8IDCT(逆變散余弦變換)僅用(168+62)個(gè)時(shí)鐘周期,為1.15μs。
2.2EVM板
TMS320C6201EVM板是一塊帶有PCI接口的插卡,除了可以插在計(jì)算機(jī)主板的PCI插槽上使用外,還可以外配電源作為獨(dú)立的模塊工作,并通過(guò)XDS510仿真器進(jìn)行調(diào)試。該板上配有1片TMS320C6201DSP,最高工作在160MHz。
EVM板上提供的片外存儲(chǔ)器包括1組64Kbit×32(256KB)、133MHz的SBSRAM,配置成CE0;2組4MB、100MHz的SDRAM,分別配置成CE2和CE3;另外還可以通過(guò)板上的外部存儲(chǔ)器接口(EMIF)擴(kuò)展存儲(chǔ)空間,這些擴(kuò)展存儲(chǔ)器配置成CEI。
3用TMS320C6201實(shí)現(xiàn)MPEG-4SVP解碼
3.1MPEG-4視頻解碼原理
MPEG-4的一個(gè)VOP的解碼過(guò)程如圖1所示,解碼器用這一過(guò)程從編碼位流中恢復(fù)視頻對(duì)象。不難看出,解碼器主要由形狀解碼器、運(yùn)動(dòng)解碼器和紋理解碼器3部分組成。
3.2程序流程
整個(gè)程序采用模塊化設(shè)計(jì),以優(yōu)化C語(yǔ)言編程為主。限于篇幅,僅列出主程序流程(如圖2所示)和MB解碼流程(如圖3所示)。
主程序在初始化后,首先從碼流中解出VOL和VOP的頭,然后根據(jù)這些頭信息以宏塊為單位進(jìn)行解碼。MB解碼單獨(dú)做成函數(shù),也是首先解出頭信息,據(jù)此判斷出宏塊類型:幀內(nèi)MB、幀間MB或幀間4VMB。幀內(nèi)MB解碼是以1塊為單位作紋理解碼,解出的紋理值在block[6][64]中,最后存入解碼后宏塊行緩存區(qū)內(nèi);2種幀間MB解碼相同部分都是先解出運(yùn)動(dòng)矢量MV,根據(jù)MV進(jìn)行運(yùn)動(dòng)補(bǔ)償?shù)玫筋A(yù)測(cè)值存入解碼后宏塊行緩存區(qū),再以塊為單位進(jìn)行紋理解碼,解出殘差值存入block[6][64]中,最后將block[6][64]加入到解碼后宏塊門(mén)緩存區(qū)中得到最后結(jié)果。不同的是,在解碼MV時(shí)intraMB解出1個(gè)MV;而inter4VMB解出4個(gè)MV。因此,運(yùn)動(dòng)補(bǔ)償時(shí),一個(gè)按宏塊做,一個(gè)按塊做。另外還有一種情況,就是P-VOP中的MB沒(méi)有被編碼(not_coded=1),碼流中沒(méi)有此宏塊的數(shù)據(jù),應(yīng)該MV=0、DCT系數(shù)全為0處理,即從前一幀同樣位置處找到參考?jí)K作為當(dāng)前宏塊的結(jié)果。
3.3存儲(chǔ)器分配
MPEG-4SVP解碼器是在EVM板上編程實(shí)現(xiàn)的。由于TMS320C6201DSP片內(nèi)數(shù)據(jù)存儲(chǔ)空量只有64KB,而圖像處理的數(shù)據(jù)量非常大,因此,合理有效地分析存儲(chǔ)空間是解碼設(shè)計(jì)中的關(guān)鍵問(wèn)題。內(nèi)部64KB存儲(chǔ)空間內(nèi)開(kāi)辟了一些空間用于暫存解碼中常用的一些信息,具體設(shè)置如表1所列。
表1內(nèi)部數(shù)據(jù)存儲(chǔ)器空間分配
全局變量所占空間/B變長(zhǎng)解碼(VLD)表4906Zig-Zag掃192VOL、VOP和MB的頭信息108DC/AC預(yù)測(cè)和MB模式5560MV預(yù)測(cè)9504量化步長(zhǎng)396解碼輸出緩存區(qū)(1個(gè)宏塊行)8448輸入的壓縮碼流緩存區(qū)10K
合計(jì)
38.3K
輸入的壓縮碼流和解碼后的視頻輸出都存儲(chǔ)在片外。輸入的壓縮碼流在程序開(kāi)始前由PC機(jī)傳輸?shù)紼VM板的外部存儲(chǔ)器中保存,解碼時(shí)分批將數(shù)據(jù)通過(guò)DMA方式復(fù)制到片內(nèi)。片內(nèi)設(shè)置1個(gè)壓縮碼流緩存區(qū)。解碼后的視頻序列存放在外部存儲(chǔ)器中,在內(nèi)部緩存1個(gè)宏塊行,每解完1個(gè)宏塊行后,就用DMA傳輸?shù)酵獠看鎯?chǔ)器中。
3.4程序優(yōu)化
。1)軟件開(kāi)發(fā)流程及開(kāi)發(fā)工具
整個(gè)程序的編寫(xiě)和調(diào)試按照C6000軟件開(kāi)發(fā)流程進(jìn)行,流程分為:產(chǎn)生C代碼、優(yōu)化C代碼和編寫(xiě)線性匯編程序3個(gè)階段。使用的開(kāi)發(fā)工具是TI的集成開(kāi)發(fā)環(huán)境CCS(CodeComposerStudio)。在CCS下,可以對(duì)軟件進(jìn)行編輯、編譯、調(diào)試、代碼性能測(cè)試(profile)等所有工作。
(2)程序優(yōu)化措施
為使程序優(yōu)化,采取如下措施:
、贋榫帉(xiě)出優(yōu)化的C程序,在編程時(shí)盡量按照C6000環(huán)境下支持的優(yōu)化C的方法進(jìn)行編程,這樣有助于C編譯器產(chǎn)生高效的匯編代碼。
②使用TI提供的庫(kù)函數(shù),大大提高了編程效率。
③使用DMA傳數(shù),提高了CPU的效率。
在解碼程序中用DMA方式實(shí)現(xiàn)了下列數(shù)據(jù)的傳輸:
*碼流輸入——碼流從片外存儲(chǔ)器傳輸?shù)狡瑑?nèi);
*解碼后的結(jié)果輸出——解碼完一宏塊行后,將結(jié)果從片內(nèi)傳輸?shù)狡獗4妫?br />
*頂部和低部的填充;
*運(yùn)動(dòng)補(bǔ)償時(shí),將在片外找到的參考?jí)K傳輸?shù)狡瑑?nèi)。
(3)采用線性匯編對(duì)某些程序段做進(jìn)一步優(yōu)化。
為了提高代碼性能,對(duì)影響應(yīng)用程序的代碼可以用線性匯編重新編寫(xiě)。
3.5MPEG-4SVP解碼器的特性及測(cè)試結(jié)果
按照上述思路所實(shí)現(xiàn)的MPEG-4SVP視頻解碼器完全符合MPEG-4的SVP規(guī)范,其特點(diǎn)如表2所列。輸入圖像分辨率可為QCIF或CIF,輸入比特率為64Kbps、128Kbps和384Kbps,輸出圖像格式為4:2:0YUV,最大解碼速率為30幀/s。
表2MPEG-4SVP視頻解碼器特性表
壓縮標(biāo)準(zhǔn)MPEG-4SVP輸入圖像分辨率QCIF(176×144),CIF(352×288)像素精度8bit/pixel掃描格式逐行掃描輸入比特率/Kbps64,128,384最大解碼幀率最高30幀/s輸出圖像格式4:2:0YUV
在解碼軟件是在EVM板上調(diào)試通過(guò)的,解碼時(shí)間可在CCS環(huán)境下測(cè)得。對(duì)于不同的圖像解碼所用的時(shí)間是有差異的。筆者對(duì)多種情況的碼流進(jìn)行了測(cè)試,在1秒內(nèi)都能解出25~30幀,甚至更多幀從而實(shí)現(xiàn)了實(shí)時(shí)解碼。
結(jié)束語(yǔ)
筆者在研究了MPEG-4的視頻編解碼算法之后,成功地在TMS320C6201EVM板上編程實(shí)現(xiàn)子MPEG-4SVP的實(shí)時(shí)解碼,為最終設(shè)計(jì)出獨(dú)立的MPEG-4解碼器打下了基礎(chǔ)。此解碼器可以嵌入到某些移動(dòng)終端中,用于解碼VPEG-4碼流,如PDA、機(jī)頂盒和住宅網(wǎng)關(guān)等;還可以與相應(yīng)的編碼器配套用于遠(yuǎn)程監(jiān)控中。
【TMS320C6201在MPEG-4視頻解碼器中的應(yīng)用】相關(guān)文章:
MPEG-4視頻數(shù)字水印技術(shù)的設(shè)計(jì)與實(shí)現(xiàn)08-06
數(shù)字視頻解碼器SAA711008-06
集成有10位ADC的增強(qiáng)型視頻解碼器ADV7183及其應(yīng)用08-06
論虛擬存儲(chǔ)技術(shù)及其在視頻網(wǎng)絡(luò)中的應(yīng)用08-06
OSD技術(shù)在ATM數(shù)字視頻監(jiān)控系統(tǒng)中的應(yīng)用08-06
H.264視頻解碼器在C6416 DSP上的實(shí)現(xiàn)08-06
服務(wù)器集群技術(shù)及其在視頻網(wǎng)絡(luò)中的應(yīng)用08-06