直播推薦
企業(yè)動態(tài)
- 上海兆越打造智能化IDC能源系統(tǒng)網(wǎng)絡方案
- 華為協(xié)同產業(yè)伙伴參與編寫《工業(yè)制造企業(yè)千兆光網(wǎng)建設指南研究報告(2024)》
- 首赴華南工博會,歐姆龍以“超越人的自動化“ 創(chuàng)新力量加速制造業(yè)質效雙升
- 數(shù)智破局·生態(tài)共生:重構全球制造新引擎
- 廣東某光電企業(yè)引進東莞市皓天試驗設備有限公司紫外老化試驗箱
- 東莞市皓天非標定制恒溫恒濕試驗箱及老化箱成功交付廣東某電子科技企業(yè)
- 長沙老化房完工并順利通過第三方檢測合格!
- 臭氧老化試驗的靜動態(tài)博弈:從橡膠龜裂機理到工業(yè)場景的失效預警
推薦展會
關鍵詞:mpeg 視頻 音頻 jpeg
mpeg壓縮技術已是目前視頻壓縮的重要技術之一。它解決了以往硬盤容量有限及計算機總線瓶頸效應,因而擴大了多媒體應用空間的自由度及靈活度。它開拓了很多不同的數(shù)字影像應用,vcd節(jié)目制作就是運用了mpeg壓縮技術。vcd盤上存儲的影視圖像和聲音是采用mpeg算法壓縮的數(shù)字信息,并按mpeg的格式交錯存放在vcd盤上。在數(shù)字多媒體壓縮(特別是視頻壓縮)領域內的標準有很多,如iso/itu-t(標準化組織/電信同盟)技術委員會下的jpeg(joint photographic experts group)標準,ccitt(電報咨詢委員會)制定的h.261標準等,而的mpeg(moving pictures experts group,運動圖像專家組)是iso(標準組織)和iec(電工委員會)內動作的一個工作組,它組建于iec(電工委員會)內動作的一個工作組,它組建于1988年,開始時只有15位專家。
mpeg的任務是開發(fā)運動圖像及其聲音的數(shù)字編碼標準,專家組zui初的任務有三個:實現(xiàn)1.5mb/s、10mb/s、40mb/s的壓縮編碼標準,即mpeg-1、mpeg-2、mpeg-3。但因為mpeg-2的功能已使mpeg-3為多余,所m以mpeg-3于1992年撤消。mpeg-4項目是1991年5月建議并于1993年7月確認。到現(xiàn)在為止,mpeg公布的標準有:①mpeg-1標準:1993年8月公布。用于傳輸1.5mb/s數(shù)據(jù)傳輸率的數(shù)字存儲媒體運動圖像及其伴音的編碼;②mpeg-2標準:1994年11月公布。其全稱為:“運動圖像及其伴音的編碼”,主要針對高清晰度電視(hdtv)所需要的視頻及伴音信號,傳輸速率為10mbps,與mpeg-1兼容,適用于1.5mbps~60mbps甚至更高的編碼范圍;③mpeg-4標準:2002年10月公布。該標準的目標為:支持多種多媒體應用(主要偶重于多媒體信息內容的訪問),可根據(jù)應用的不同要求現(xiàn)場配置*。目前,mpeg將研究重點轉向了交互性更加的形式,在未來的幾年里,技術的發(fā)展將使這種形式成為可能。
1 mpeg的發(fā)展及其特點
1.1 mpeg-1
在mpeg出現(xiàn)之前,關于圖像壓縮已經(jīng)有兩個標準,即用于靜態(tài)圖像數(shù)據(jù)壓縮的jpeg和用于電視、會議電視圖像壓縮的h.261,但是他們都與計算機數(shù)據(jù)標準無關。這就要求制定一個圖像、伴音、存儲和傳輸四個方面的計算機系統(tǒng)和廣播電視都統(tǒng)一的標準,從而有利于各種媒體廣泛交流,因此mpeg就應運而生了。
mpeg-1標準完成的基本任務就是質量適當?shù)膱D像(包括伴音)數(shù)據(jù)必須成為計算機數(shù)據(jù)的一種,和已有的數(shù)據(jù)(如文字、繪圖等數(shù)據(jù))在計算機內兼容,并且這些數(shù)據(jù)必須在現(xiàn)有的計算機網(wǎng)絡和廣播電視等通信網(wǎng)絡中兼容傳輸。mpeg-1標準有3個組成部分:mpeg視頻、mpeg音頻、mpeg系統(tǒng)。所以mpeg涉及的問題是視頻壓縮、音頻壓縮及多種壓縮數(shù)據(jù)流的復合和同步問題。mpeg-1標準是適用于傳輸1.5mbps數(shù)據(jù)傳輸率的數(shù)字存儲媒體動力圖像及其伴音的編碼標準,可以處理各種類型的活動圖像,其基本算法對于壓縮水平方向360個象素、豎直方向288個象素的空間分辨力,每秒24至30幅畫面的運動圖像有很好的效果。與jpeg不同,它沒有定義產生合法數(shù)據(jù)流所需的詳細算法,而是在編碼器設計中提供了大量的靈活性,另外定義已編碼位流和*的一系列參數(shù)都包含在位流本身當中,這些特點允許算法可以用于不同大小和寬度比的圖像,也可以用在工作速率范圍很大的信道和設備上。
mpeg-1標準壓縮首先對色差信號進行亞采樣,減少數(shù)據(jù)量,采用運動補償技術,減少幀間冗余度,利用二維dct變換云除空間相關性,對dct分量進行量化,舍去不重要的信息,將量化后dct分量按照頻率得新排序,將dct分量進行變字長編碼,zui后對每個數(shù)據(jù)塊的直流分量(dc)進行預測差分編碼。mpeg視頻的編碼和解碼框圖如圖1所示。
mpeg-1的壓縮目標是先對分辨率為30幀/秒(ntsc制式)或704×576、25幀/秒(pal制式)的視頻圖像在水平方向和垂直方向上使象素減少一半,即變成352×240(ntsc制式)或352×288(pal制式)的sif圖像格式,再對其與立體聲伴音進行壓縮。
1.2 mpeg-2
mpeg-2標準全稱為“運動圖像及其伴音的編碼”,主要針對高精晰度電視(hdtv)所需要的視頻及伴音信號,傳輸速率為10mbps。
mpeg-2標準分為八個部分,統(tǒng)稱為iso/iec1318標準。*部分:系統(tǒng),描述多個視頻,音頻和數(shù)據(jù)基本碼流合成傳輸碼流和節(jié)目碼流的方式;第二部分:視頻,描述視頻編碼方法;第三部分:音頻,描述與mpeg-1音頻標準反向兼容的音頻編碼方法;第四部分:符合測試,描述測試一個編碼碼流是否符合mpeg-2標準的*、二、三部分的軟件實現(xiàn)方法;第五部分:數(shù)字存儲器體-命令與控制,描述交互式多媒體網(wǎng)絡中服務器與用戶間的會話信令集;第六部分;非向后兼容的音頻,規(guī)定不與mpeg-1音頻反向兼容的多通道音頻編碼;第七部分:10比特視頻,現(xiàn)已停止;第八部分:實時接口,規(guī)定了傳送碼流的實時接口。
mpeg-2視頻編碼標準是一個按等級劃分的系列,按編碼圖像的分辨率分成4個“級”:低級(ll:low level),輸入信號的像素為itu-r601格式的四分之一;主級(ml:main level),輸入信號的像素為itu-r601;-1440(h14l:high-1440 level)為4:3模式電視高清晰度格式;(hl:high level)為16:9模式電視的高清晰度格式。按所使用的編碼工具的集合分成5個“類”:簡單類(sp:simple profile),只有基準幀i和預測幀p;主類(mp:main profile),比sp增加了雙向推測幀b;信雜比分層類(snrp:snr scalable profile);空間可分層類(ssp:spatial scalable profile);高類(hp:high profile)。“級”與“類”的若干組合構成mpeg-2視頻編碼標準在某種特定應用下的子集。對某一輸入格式的圖像,采用特定集合的壓縮編碼工具,產生規(guī)定速率范圍內的編碼碼流。mpeg-2的編碼碼流分為6個層次。從上至下依次為:視頻序列層(sequence);圖像組層(gop:groupofpicture);圖像層(picture);像條層(slice);宏塊層(macroblock)和像塊層(block)。
mpeg-2的編碼流程:在幀內編碼的情況下,編碼圖像僅經(jīng)過dct,量化器和比特流編碼器即生成編碼比特流,而不經(jīng)過預測環(huán)處理。dct直接應用于原始的圖像數(shù)據(jù)。在幀間編碼的情況下,原始圖像首先與幀存儲器中的預測圖像進行比較,計算出運動矢量,由此運動矢量和參考幀生成原始圖像的預測圖像。而后,將原始圖像與預測像素差值所生成的差分圖像數(shù)據(jù)進行dct變換,再經(jīng)過量化器和比特流編碼器生成輸出的編碼比特流。
1.3 mpeg-4
mpeg-4標準的目標是:支持多種多媒體應用(主要側重于對多媒體信息內容的訪問),可根據(jù)應用的不同要求現(xiàn)場配置*。mpeg-4旨在為視(音)頻數(shù)據(jù)的通信、存取與管理提供一個靈活的框架與一套開放的編碼工具。
在mpeg-4圖像與視頻標準中,視頻表示工具的目標,是為多媒體環(huán)境下的紋理、圖像和視頻數(shù)據(jù)的有效存儲、傳輸及管理提供標準化的核心技術。尤其強調這些工具對圖像和視頻內容的原子單元(稱為視頻對象vo)的編解碼能力。對任意形狀的視頻對象進行有效的表示,以支持所謂基于內容的功能集。而此功能集支持內容(即場景中的物理對象vo)的單獨編碼和解碼,這一特性為交互性提供了有力的底層機制支持,也為在壓縮域對圖像或視頻的vo內容進行靈活的表示和管理提供了有利條件。mpeg-4圖像與視頻標準統(tǒng)一支持傳統(tǒng)矩形和任意形狀圖像與視頻的編解碼。對于基于內容的應用,輸入的圖像序列可能具有任意形狀和位置。形狀可以用8位透明分量表示(一個vo由多個其它對象構成時)或用一個二值掩模描述。另外,通過對場景中每個物理采用適當?shù)暮途毜幕趯ο蟮倪\動預測工具,可以大大提高某些視頻序列的壓縮比。對于mpeg-4擴展的基于內容的編碼可視為傳統(tǒng)的vlbv內核或hbv工具由矩形輸入向任意形狀輸入的邏輯延伸。從這個意義上,基于內容的編碼是vlbv和hbv內核的超集。
mpeg-4標準在原有的基礎上增加了七個新的功能。增加的各個功能的特點:
(1)基于內容的操作與比特流編輯支持無需編碼就可進行基于內容的操作與比特流編輯。(2)自然與合成數(shù)據(jù)混合編碼。提供將自然視頻圖像同合成數(shù)據(jù)(文本、圖形)有效結合的方式,同時支持交互性操作。(3)增強的時間域隨機存取。mpeg-4將提供具有效的隨機存取方式:在有限的時間間隔內,可按幀或任意形狀的對象,對一音、視頻序列進行隨機存取。(4)提高編碼效率。在與現(xiàn)有的正在形成的標準的可比擬速率上,mpeg-4標準將提供更好的主觀視覺質量的圖像。(5)對多個并發(fā)數(shù)據(jù)流的編碼。mpeg-4將提供對一景物的有效多視角編碼,加上多伴音聲道編碼及有效的視聽同步。在立體視頻應用方面,mpeg-4將利用同一景物的多視點觀察所造成的信息冗余,在足夠的觀察視點條件下有效地描述三維自然景物。(6)錯誤易發(fā)環(huán)境中的抗錯性“靈活多樣”是指允許采用各種有線網(wǎng)和各種存儲媒體,mpeg-4將提高抗錯誤能力,尤其是在易發(fā)生嚴重錯誤環(huán)境下的低比特應用中(移動通信鏈路)。mpeg-4是*個在其音、視頻表示規(guī)范中考慮信道特性的標準,目的不是取代已由通信網(wǎng)提供的錯誤控制技術,而是提供一種對抗殘留錯誤是緊韌性。(7)基于內容的尺度可變性。內容尺度可變性意味著給圖像中的各個對象分配優(yōu)先級。基于內容的尺度可變性是mpeg-4的核心,因為一旦圖像中所含對象的目錄及相應的優(yōu)先級確定后,其它的集內容的功能就比較容易實現(xiàn)了。對甚低比特率應用來說,尺度可變形成一個關鍵的因素,因為它提供了自適應可用資源的能力。
以上七個新的功能可以歸納為三類:基于內容的交互性、高壓縮率和靈活多樣的存取模式。前三個功能為基于內容的交互性,四、五為高壓縮率模式,zui后兩個為靈活多樣的存取模式。
1.4 mpeg-7
mpeg-7標準稱為“多媒體內容描述接口”,它將擴展現(xiàn)有內容識別解決方案的有限能力,特別是還包括了更多數(shù)據(jù)類型。換言之,mpeg-7將規(guī)定一個用于描述各種不同類型多媒體信息的描述符的標準集合。
mpeg-7對定義其它描述符及其結構(描述方案)和他們之間關系的方法進行標準化。這種描述(也就是描述符和描述方案的組合)將與內容本身關聯(lián)起來,以便對用戶感興趣的素材進行快速的搜索。mpeg-7標準化了一種用來定義描述方案的語言,即描述定義語言(ddl)。加之相關的mpeg-7數(shù)據(jù)的av素材,就可以被加上索引,并可進行檢索。
mpeg-7像mpeg家族中其他成員一樣,是針對滿足特定需要的音、視頻信息的標準化表述,mpeg-7的描述符并不依賴于描述的內容是編碼的或存儲的方式,可以把mpeg-7的描述說明附加到模擬制的電影里或使用紙張打印出來的圖片上。然而,盡管mpeg-7 描述不依賴于所處理素材的(編碼)表示方式,但由于在一定程度上它是在mpeg-4的基礎上發(fā)展起來的,而mpeg-4采用了按照具有一定時間關系和空間關系的對象來進行音、視頻編碼的處理方式,因此用mpeg-4編碼有可能把描述說明附加到場景中的成員(對象)。所以,mpeg-7在描述中要提供不同的程度,才可能實現(xiàn)不同等級的識別。
因為描述特征必須在應用環(huán)境中才有意義,所以會因用戶范圍的不同和應用領域的不同而有所區(qū)別。這就意味著,同樣的素材,因為要和應用范圍相匹配,可能會使用不同類型的特征來描述。當然,所有這些描述都會以方式進行編碼,業(yè)績能提高搜索的效率。同時,中間也可能存在過渡的抽象等級。抽象等級與提取特征的方式有關,許多低等級的特征可以用全自動的方式提取出來,而高等級的特征就需要更多的人工交互。
2 mpeg的未來展望
mpeg視頻壓縮系統(tǒng)是一個技術含量很高的復雜集成系統(tǒng),在世界上也只有少數(shù)極有實力的公司才能推出商業(yè)產品。由于mpeg視頻壓縮系統(tǒng)的技術復雜、設備昂貴,故至今為止普及程度很低。但隨著技術的進步、工藝的成熟和價格下降,其應用面正在拓寬。過去需要花費上百萬元才能做成的事,現(xiàn)在幾萬元即可實現(xiàn)。如果你已有這樣的mpeg視頻壓縮系統(tǒng),就可以很容易地把錄像、照片、圖片、電影等節(jié)目加以壓縮存放在計算機中生活錄像、檔案管理等各類視頻制作中。
mpeg制定的是一系列的標準,實際上很多情況下并沒有給出具體的實現(xiàn),zui后的實施還要通過各個廠商和研發(fā)人員實現(xiàn)。mpeg的研空主要集中在兩方面:(1)對mpeg實現(xiàn)的研究;(2)進一步研究圖像壓縮方法已獲得更大數(shù)據(jù)的壓縮比并且實現(xiàn)人機對話的功能。
從現(xiàn)在mpge標準來看,作者認為主要將集中在基于對象的處理方法上,也就對于不同的數(shù)據(jù)、內容、要求將根據(jù)情況選擇不同方法處理。首先這是滿足人機對話zui基于要求,也是滿足以人為本宗旨的要求,每一個人都可以根據(jù)自己的需求而要求采用不同的處理方法;其次,這是進一步獲得更大圖像數(shù)據(jù)壓縮比的要求。以前基于數(shù)據(jù)本身和其交換與統(tǒng)計個性的壓縮方法很難滿足高速公路上的數(shù)據(jù)流速度,而基于對象的處理方法,要是現(xiàn)實基于模型的壓縮方法,可以針對不同對象(內容)采用不同的壓縮方法,從而獲得巨大的壓縮比,而且滿足人的視覺要求。在mpeg-4和mpeg-7標準中已經(jīng)注意到這個問題,引入了甚至對象或稱為內容的研究。因此,筆者認為基于對象的圖像處理方法將是未來mpeg的發(fā)展方向。
mpge視頻壓縮技術和vcd制作為我們開拓了一條發(fā)展的新路。mpeg視頻壓縮技術的推廣應用,可能會產生一個新行業(yè),即多媒體制作。這方面的市場剛剛啟動,在教育、培訓等方面幾乎是空白,是一個有很大發(fā)展?jié)摿Φ男袠I(yè),有待于開拓。未來是信息化的社會,各種多媒體數(shù)據(jù)的傳輸和存儲是信息處理的基本問題,本文僅僅從mpeg標準方面進行了詳細的闡述,還有很多這方面的技術有待于研究和開發(fā),希望有志于此研究的人士共同探討。
免責聲明
- 凡本網(wǎng)注明"來源:智能制造網(wǎng)"的所有作品,版權均屬于智能制造網(wǎng),轉載請必須注明智能制造網(wǎng),http://www.xashilian.com。違反者本網(wǎng)將追究相關法律責任。
- 企業(yè)發(fā)布的公司新聞、技術文章、資料下載等內容,如涉及侵權、違規(guī)遭投訴的,一律由發(fā)布企業(yè)自行承擔責任,本網(wǎng)有權刪除內容并追溯責任。
- 本網(wǎng)轉載并注明自其它來源的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或證實其內容的真實性,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉載時,必須保留本網(wǎng)注明的作品來源,并自負版權等法律責任。
- 如涉及作品內容、版權等問題,請在作品發(fā)表之日起一周內與本網(wǎng)聯(lián)系,否則視為放棄相關權利。
2025長三角國際智能儀表/線纜產業(yè)博覽會
展會城市:滁州市展會時間:2025-11-11