- 相關(guān)推薦
MPEG-7與媒體資產(chǎn)檢索
MPEG-7與媒體資產(chǎn)檢索
1、 引言 隨著電視技術(shù)與IT技術(shù)的不斷融合,以及IT技術(shù)日新月異的發(fā)展,實現(xiàn)視音頻信息的數(shù)字化管理即所謂的媒體資產(chǎn)管理已成為可能。但要實現(xiàn)對龐大的視音頻數(shù)據(jù)進(jìn)行組織、管理及檢索,僅僅有數(shù)字化的視音頻信息是遠(yuǎn)遠(yuǎn)不夠的,這時便提出了所謂的"元數(shù)據(jù)(Metadata)"技術(shù)。"元數(shù)據(jù)"就是描述數(shù)據(jù)的數(shù)據(jù),即有關(guān)視音頻信息的描述信息。但現(xiàn)在多數(shù)媒體資產(chǎn)管理系統(tǒng)都是按照傳統(tǒng)的管理信息系統(tǒng)的方式組織和管理元數(shù)據(jù)的,即將視音頻信息進(jìn)行編目,再將編目信息(元數(shù)據(jù))存入數(shù)據(jù)庫以備日后的檢索和管理。這種方式對于版權(quán)、作者、主題等等文本信息是很有效的,但是要實現(xiàn)真正的面向內(nèi)容的管理就力不從心了。針對這一問題,MPEG (Moving Picture Experts Group)推出了基于內(nèi)容的多媒體描述標(biāo)準(zhǔn)MPEG-7。MPEG-7標(biāo)準(zhǔn)重點在于AV(Audiovisual)信息的描述和定義,以明確的結(jié)構(gòu)和語法來定義AV信息的內(nèi)容。它的正式名稱是"多媒體內(nèi)容描述接口(multimedia content description interface)"。通過MPEG-7格式定義的信息,使用者可以有效地搜尋、過濾和定義想要的視音頻資料。 2、 MPEG-7 MPEG-7于2001年推出,它本身并不試圖定義一種新的數(shù)字壓縮方法,而主要是針對基于內(nèi)容的多媒體描述問題。 2.1 MPEG-7標(biāo)準(zhǔn)的范圍 MPEG-7是MPEG繼MPEG-1、MPEG-2、MPEG-4之后制定的新標(biāo)準(zhǔn),但它與前三個標(biāo)準(zhǔn)不同,它超越基于波形或基于樣本、基于壓縮(如MPEG-1和MPEG-2)甚至是基于對象(如MPEG-4)的表示,也超越具體的存儲方式(如可以應(yīng)用于存儲在磁帶、影片等上模擬信號也可以應(yīng)用于存儲在磁盤、光盤上的數(shù)字信號,甚至可應(yīng)用于存在于紙上的圖形、圖片),其目的是建立一種基于多媒體內(nèi)容的描述方式,以便更有效地支持多媒體資料在產(chǎn)生、存儲、交換、傳輸?shù)冗^程中的各種應(yīng)用,這些應(yīng)用包括搜索引擎、編輯工具和個性化的檢索機(jī)制等。但MPEG-7并不涉及這些就在具體的應(yīng)用本身,而是僅僅定義了多媒體內(nèi)容的描述方法,圖1是關(guān)于MPEG-7標(biāo)準(zhǔn)內(nèi)容的抽象描述。● 有關(guān)媒體使用方面的信息(如媒體的版權(quán)、使用記錄等);
● 有關(guān)媒體存儲方面的信息(如媒體的編碼方式、存儲格式等);
● 有關(guān)媒體時間域、空間域方面的信息(如媒體中的場景切換、區(qū)域分割等);
● 有關(guān)媒體特征方面的信息(如媒體的灰度、紋理、音頻特征等);
● 有關(guān)媒體內(nèi)容表述方面的信息(如媒體中包括的對象、事件及其之間的相互關(guān)系等)。
2.2 MPEG-7描述
MPEG-7定義了一組的描述方法和工具,主要包含:
● 描述子D (Descriptors):用來描述多媒體內(nèi)容的各種特征。
● 描述方案DS (Description Schemes):用來描述D之間的結(jié)構(gòu)及關(guān)系。
● 描述定義語言DDL(Description Definition Language):用來定義D和DS的語言。 一個MPEG-7描述(descriptions)由一組DS實例組成,并與AV素材的內(nèi)容鏈接,以使用戶能夠快速、有效地訪問需要的AV素材。描述可以與AV素材存儲在同一存儲系統(tǒng)中,也可以異地、遠(yuǎn)程存儲。 2.2.1描述子 MPEG-7定義了一組標(biāo)準(zhǔn)的描述子,下表列出的是一些MPEG-7的視覺描述子: 類型 特征 描述子 視覺 結(jié)構(gòu) 網(wǎng)格分布 二維/三維多視圖 時間序列 三維空間坐標(biāo)系 時間插值 顏色 顏色空間 顏色量化 顏色直方圖 主顏色 可擴(kuò)展顏色 顏色結(jié)構(gòu) 顏色分布 GOF/GOP顏色 紋理 邊緣直方圖 同類紋理 紋理瀏覽 形狀 對象范圍 基于區(qū)域的形狀 基于輪廓的形狀 三維形狀 運動 鏡頭運動 對象運動軌跡 參數(shù)運動 運動速度 位置 區(qū)域定位子 時空定位子 其它 人臉描述子 每個描述子都定義了標(biāo)準(zhǔn)和非標(biāo)準(zhǔn)兩個部分,標(biāo)準(zhǔn)部分定義了描述子的語法、語義及其二進(jìn)制的表示法。而操作部分是非標(biāo)準(zhǔn)的部分,許多低層的特征(如顏色直方圖等)都是可以自動抽取的,推薦使用的特征抽取及匹配算法都包含在非標(biāo)準(zhǔn)的部分。 2.2.2描述方案 描述方案(DS)定義了各組成部分之間的結(jié)構(gòu)和語義關(guān)系,它由描述子(D)和描述方案(DS)組成,下面是在AV內(nèi)容描述方案中常用到的幾個概念: ● 語法結(jié)構(gòu):AV內(nèi)容的物理和邏輯結(jié)構(gòu),如時間片斷、空間區(qū)域的基礎(chǔ)結(jié)構(gòu)。
● 語義結(jié)構(gòu):語義含義的細(xì)分,如時間事件、空間對象結(jié)構(gòu)。
● 語法語義鏈接:語法元素與語義元素間的結(jié)合。
一個頂層的AV描述方案往往是由多個描述方案組成:
● 一組語法結(jié)構(gòu)描述方案(Syntactic structure DS):即片斷、區(qū)域、顏色、文本、運動等物理特征的描述。
● 一組語義結(jié)構(gòu)描述方案(Semantic structure DS):即對象、人物或事件等語義特征,如"進(jìn)球"、"射門"、"廣告"等。
● 語法語義鏈接描述方案(Syntactic-semantic links DS):即語法元素和語義元素之間的關(guān)系。
● 摘要描述方案(Summary DS):用于不同粒度間的瀏覽。
● 媒體信息描述方案(MetaInfo DS):有關(guān)作者、出版者等信息的描述,包括內(nèi)容描述方案、信用描述方案、創(chuàng)作目的描述方案、版權(quán)描述方案、出版描述方案等。
● 介質(zhì)信息描述方案(MediaInfo DS):有關(guān)存儲介質(zhì)的描述,如文件格式、存儲介質(zhì)、壓縮格式、長度等。
● 模式描述方案(Model DS):提供AV數(shù)據(jù)的分類方法的描述或當(dāng)前AV內(nèi)容和其它內(nèi)容間的通信的不同方法。 圖2是一個AV描述方案的結(jié)構(gòu)描述:
● XML語言的數(shù)據(jù)類型部分
● MPEG-7的擴(kuò)展部分 DDL語言、描述方案、描述子之間的關(guān)系見圖3。
1、 ISO/IEC JTC1/SC29/WG11 N4031. Overview of the MPEG-7 Standard (version 5.0). José M. Martínez
2、 D-Lib MagazineSeptember 1999. MPEG-7 Behind the Scenes. Jane Hunter
3、 http://www.cbttn.com.《MPEG-7及其在廣播電視中的應(yīng)用》. 張穎輝、陶然、王越、馬越
4、 北京郵電大學(xué)出版社.《MPEG-7標(biāo)準(zhǔn)及其應(yīng)用》.余兆明、李曉費、陳來春、
【MPEG-7與媒體資產(chǎn)檢索】相關(guān)文章:
多級存儲技術(shù)在媒體資產(chǎn)管理系統(tǒng)中的應(yīng)用08-06
實習(xí)檢索報告08-16
談?wù)剬幭牡胤轿墨I(xiàn)檢索08-09
信息檢索心得體會08-20
文獻(xiàn)檢索心得體會12-06
文獻(xiàn)信息檢索心得體會03-21
信息檢索課的心得體會04-01
信息檢索課心得體會04-17