UTF.COM.CN

MPEG-4编码技术及其应用

作者:佚名 | 来源:网络 | 添加时间:2007-01-17 20:45:12 | 人气:1950

MPEG-4编码技术及其应用

  摘 要:本文从编码理念、数据结构、时域、空域、可调性和抗差错措施4个方面介绍了MPEG-4编码技术,并介绍了MPEG-4技术的部分应用。
  关键词:MPEG-4 编码技术
  你曾经设想过我们可以方便的操作视频和音频对象,随心所欲的组合或增删它们,就像我们现在可以随意编辑文本?你曾经设想过我们可以坐在电视机前,只需简单的按上几个键,就可以享受到不同质量的视频点播?你曾经设想过我们可以通过无线信道来传输一定质量的视频和音频,那么打移动电话的同时可以看到对方的音容笑貌,并且可以用它来欣赏美妙的电影和音乐?针对互联网和无线条件下这些特定的应用,MPEG-4提供了一种高效的视频和音频编码,为我们现在和未来的视频及音频通信勾画出了一幅诱人的图景。
  1 MPEG-4技术简介
  MPEG是活动图像专家组(Moving Picture Expert Group)的缩写,是国际标准化组织IEC/JTC1/SC2/WG11的一个小组。该小组1988年成立,1992年颁布了MPEG-1标准,并基于此标准衍生出了VCD和MP3等应用。MPEG-2是MPEG-1的兼容扩展,并成为数字电视,机顶盒以及DVD这些应用的标准。而1998年颁布的MPEG-4标准则主要针对互联网及无线信道的应用,充分考虑了这2种传输条件的特点并提供了一些关键技术。
  1.1 编码理念:基于对象的编码方法(Object-based Coding)
  MPEG-4标准同以前标准的最显著的差别在于它是采用基于对象的编码理念,即在编码时将1幅景物分成若干在时间和空间上相互联系的视频音频对象,分别编码后,再经过复用传输到接收端,然后再对不同的对象分别解码,从而组合成所需要的视频和音频(图1)。这样既方便我们对不同的对象采用不同的编码方法和表示方法,又有利于不同数据类型间的融合,并且这样也可以方便的实现对于各种对象的操作及编辑。例如,我们可以将一个卡通人物放在真实的场景中,或者将真人置于一个虚拟的演播室里,还可以在互联网上方便的实现交互,根据自己的需要有选择的组合各种视频音频以及图形文本对象。
  1.2 数据结构:特殊的二进制数据结构BIFS(Binary Format for Scenes)及XMT(ExtensibleMarkup Text)
  考虑到MPEG-4面向对象的编码特点,压缩后的数据采用一种特殊的二进制数据结构BIFS,这种数据结构中封装了各种媒体对象数据流以及表征这些对象间时域空域关系的信息,为不同媒体数据的复用,传输和重构提供了便利。用户可以通过和服务器间的交互,由服务器发送特殊的命令(BIFS-COMMAND)来改变各个对象的参数,在重构图像中,我们可以改变物体的大小,物体的位置与倾角,还可以将其它图像中的物体加到该图像中。
  除了这种二进制结构,MPEG-4标准又扩展出一种新的原文数据格式XMT,即扩展标记文本(Extensible Markup Text),它能够涵盖其他的扩展描述语言(XML),可以通过简单的标记来表示信息的各种含义,并且能够被编译成二进制数据结构BIFS,这样我们就可以更加方便直观的标记出各对象的信息及其相互关系。
  1.3 时域空域可调性(Spatial and Temporal Scalability)
  在互联网及无线的应用中,都面临着带宽受限的问题,为了解决这个问题,MPEG-4提供了一些措施来实现编码的时域空域可调性,以便用户根据不同的带宽状况及接收终端的限制来选择不同的分辨率,如图2所示,我们可以在解码端得到3种不同的空间分辨率。
  这种技术广泛应用于多种多媒体应用中,比如视频数据库浏览,视频移分辨率回放等等。
  1.4 有效的抗差错措施(Error Resilience Tools)
  互联网传输面临的一个重要问题是网络阻塞和丢包,而无线传输中由于多径时延与衰落以及多普勒频移的存在,也同样面临着恶劣的信道条件,所以提供高效的抗差错措施是MPEG-4标准制定过程中的一个热点。
MPEG-4编码标准中,针对无线和互联网上的应用,考虑到不同的信道条件,提出了多种行之有效的抗差错措施,例如再同步标志,可逆变长编码,数据分割等等,而且我们还可以通过一些后续滤波进一步提高解码后的视频质量,提高抗差错性能。
  MPEG-4可以支持由低到高的数据速率,使多种应用成为可能。近期它又扩展了一种新的类别Studio Profile,速率能够达到1Gbit/s以上,用来支持演播室之类很高分辨率的应用。
  由上面简要的介绍我们可以看出来,相较于MPEG-1,MPEG-2及H263等编码标准,MPEG-4有着很大的优势:
  ★高压缩比
  ★支持比特率的范围更为宽广
  ★更方便有效的数据表示形式
  ★易于实现交互性以及基于内容的访问与操作
  ★更好的抗差错性能
  2 MPEG-4技术的主要应用
  正是基于上述各项技术,MPEG-4能够支持多种应用,主要包括数字广播,基于内容的存储和检索,数字电视机顶盒,移动多媒体等等,下面就简要介绍一下其中一些有代表性的应用。
  2.1 集成数字广播服务系统ISDB(Integrated Service Digital Broadcast)
  集成数字广播服务系统不仅能够提供现有的最基本的广播服务,并且还具有多媒体电视,多媒体信息服务以及双向信息服务的功能。集成服务电视是接收集成数字广播服务的智能终端,观众可以坐在电视前,根据不同的频道,自由选择想看的节目(新闻,天气预报或者是电视剧等等),还可以通过编程实现当满足某种条件时,在几个节目之间自动切换。比如当我们在观看球赛时,可以设定若某个球队得分则立即切换到那个球赛节目上去。这种应用可以在任何时候提供新闻和天气预报,实现视频音频点播,并能够提供SDTV和HDTV节目和电子节目导航,而且还可以通过智能代理实现自动录制。
  集成数字广播服务系统主要应用了MPEG-4编码技术的如下特点:
  ★视频质量高
  ★编码效率高
  ★时域的随机访问
  ★基于对象的时域空域可调性与灵活性
  ★多种媒体(视频,音频,图形,文本)数据的复合
  ★视频及音频的同步等
  2.2 协作的房屋内部设计(Collaborative Interior Design)
  有没有想过在给我的office添置家具前,先预览一下房屋内部的整体效果?基于MPEG-4的这种应用一一协作的房屋内部设计可以给我们提供这种便利,它使客户和生产商或设计者可以坐在异地的电脑前共同参与房屋的内部设计。比如说我们要给office购置家具,只需先将空房子的视频数据流传送给设计者,然后设计者就可以按照他的意愿在房间的不同位置添加不同的3D合成对象,来代表各种家具,并且可以改变"家具"的尺寸和颜色。这整个的过程所有的参与者都可以看到,并且这些参与者可以通过视频会议进行交流与讨论,所以客户还可以根据自己的需求及喜好要求设计者修改设计,直到满意为止。
  协作的房屋内部设计主要应用了MPEG-4技术的如下特点:
  ★多视频音频流的高效编码
  ★多种媒体数据的复合
  ★基于内容的编码和交互
  ★编码灵活性
  ★3D合成等
  2.3 家中购物(Home Shopping)
  顾名思义 ,家中购物就是足不出户就可以逛商场,逛超市,下定单,网上结帐,直到送货上门,整个过程都可以通过网络再加上机顶盒来完成。由于MPEG-4技术以对象为导向,故这种家中购物跟现在的网上购物相比,有很大优势,因为它能够让商品更加全面而生动地展现在顾客的面前。例如,我们可以看到商品各个角度的静态画面,并且可以由售货员亲自向我们讲述商品的性能及功用,配之以文本形式的商品信息。这样的家中购物,岂不是很有身临其境之感?
  2.4 无线多媒体(Wireless Multimedia)
  所谓无线多媒体就是通过无线信道来传输多媒体数据流,这样我们不仅可以像现在一样在无线信道上传输语音,而且可以在它之上传输视频和音频信息,那么我们就能够在打电话的同时看到对方的音容笑貌,并可以通过移动终端点播视频和音频,这无疑会使我们的生活变得更加方便而生动。但是无线传输面临的主要问题,即带宽受限,恶劣的信道条件和实时性,使得MPEG-4以前的编码标准,如MPEG-2和H.263,都不能够很好地支持这一应用。那么为什么MPEG-4技术适合于无线多媒体传输呢?这主要是因为:
  a.MPEG-4能够实现高性能压缩
  b.MPEG-4能够实现编解码复杂度的可调性,可以权衡质量,性能和价格等因素而采用不同的时域空域分辨率。
  c.MPEG-4能够实现在无线环境下对视频音频对象的交互操作
  d.MPEG-4提供了多种有效的抗差错措施
  无线多媒体主要应用了MPEG-4编码技术的如下特点:
  ★支持低比特率模式
  ★解码复杂度较低
  ★编码效率高
  ★抗噪声性能良好
  ★视频音频对象的同步
  ★各种媒体数据的复用
  ★时域的随机访问等
  MPEG-4编码技术的特点及其优势使生产和生活中的多种应用成为可能,我们期待着技术的革命能够带给人们更加方便,快捷,丰富多彩的生活。
责任编辑:冬天来了
【字号: 】【去论坛讨论】【发表评论】【打印本文】【告诉好友】【关闭窗口

姓名:

验证码: 点击刷新