IPTV编码器的设计与实现.docx
《IPTV编码器的设计与实现.docx》由会员分享,可在线阅读,更多相关《IPTV编码器的设计与实现.docx(25页珍藏版)》请在三一办公上搜索。
1、1. 刖言IPTV编码器是一种用于广播或者电视转播项目的专业音视频数据处理设备,由音视频压 缩编解码器芯片、输入输出通道、网络接口、音视频接口、串行接口控制、协议接口控制、 系统软件管理等构成,通过串行接口控制摄像头和麦克风录制音频和视频信号,并对其进行 编码,完成声音图像数据的采集和复原等。IPTV编码器输出的主要是基于MPEG-4或H.264 的图像数据以及音频数据。目前国际上主流的IPTV编码器是针对媒体传输和IPTV解决方案的第四代实时MPEG-4 AVC/H.264编码器。它们大多采用MPEG-4 AVC/H.264压缩技术,这基本是标清广播采集、分 配和IPTV应用的理想选择。它们
2、能以不到2Mbps的码流传输全分辨率最高质量的视频oMPEG-4 编码技术在宽带接入日益普及的环境下,在网上观看、下载电影成为很多用户非常熟悉的应 用。压缩电影的背后是MPEG-4技术,而MPEG-4背后有一条不平凡的发展道路。运动图像专家组这个名称对很多人来说还很陌生,但提到它的英文简称MPEG(Moving Picture Experts Group),便几乎是尽人皆知了。MPEG是隶属于ISO/IEC的一个专家工作组, 主要负责为数字音视频编码算法开发和制定标准。MPEG组织始建于1988年,并于1992年制 定出MPEG0-1标准,它能将视频数据压缩成1-2Mpbs的标准数据流,工业产
3、品VCD机和MP3 播放器都是以该标准为基础衍生出来的。随后的1994年,该组织制定出MPEG-2标准,它是 为了获得更高的分辨率(720*486)、提供广播级视频和CD品质的音频而产生的高质量音视频 编码标准,传输速率在3-10Mbps,它也是数字电视、DVB和DVD所遵循的压缩标准。随着研究工作的深入发展,ISO又公布了 “超低比特率活动图像和语音压缩标准”,排序 MPEG-4。1998年10月批准第一版,1994年4月又公布了第二版及其校验模型(VM)。MPEG-4 正式编号是ISO/IEC国际标准14496,它是一种新型的多媒体标准。与前标准一个重要区别 就在于,它是一个基于对象的视频
4、编码压缩标准,它所定义的码率控制的目标就是获得在给 定码率下的最优质量,它为互联网上传输高质量的多媒体视频提供了很好的技术平台。2. 总体方案设计随着视频技术和MPEG4应用领域更加广泛,国内对IPTV编解码器研究探索也将步入更高 层次的阶段,从应用现状和市场需求的角度来看,对MPEG4编解码器的研究和开发更是重点。 目前实现IPTV编码器的方式主要有三种,分别是纯硬件方式、软件方式和基于DSP的方式, 三种方式各有特点。2.1各方案论证(1)纯硬件方式纯硬件方式就是使用专用集成芯片来实现视频编码,随着VLSI(超大规模集成电路)技 术的发展,各大VLSI厂商相继推出了各种高性能的视频图像处理
5、专用芯片,如Philips公司 的Trimedia系列、IBM公司的MPEG S系列等。这种方式将视频压缩算法固化在芯片中,特 点是开发周期短,压缩率高,运算速度快,图像质量和系统实时性较好,缺点是一旦视频编 码方案固定,则系统升级与更新比较困难,而且专用芯片造价比较高,通用性差,不易推广。(2)软件方式软件方式就是利用PC机通过基于计算机操作系统的软件来实现视频编码,虽然比较容易 实现软件的升级,但系统性能受PC机处理器运算能力所限,最大缺陷为速度慢,实时处理视 频信号不容易实现,其主要是用于前期仿真,验证算法的正确性。(3)基于DSP的方式基于高速DSP实现视频编码是应用最多的一种方法。利
6、用DSP的高速信号处理能力,使 用软件实现的算法在其上运行时可以大大缩短执行时间,获得高压缩率,同时由于数字视频 的标准广泛,产品的更新要求更多,采用DSP做产品将更加具有优势,当进行软件升级或使 用新的编码标准的时候,只需要对代码进行修改和调整DSP的配置就可以实现。该方案易升 级,应用灵活,通用性强,具有更加实际的产品发展前景。随着DSP向高速、低功耗、多媒 体化、多处理器的方向发展,使得用DSP实现视频编码更加方便,图像质量也更好。我的设计主要是通过对MPEG4编码标准原理和算法进行深入分析,以MPEG4的公开参考 源代码XVID-1.1.0为基础,对基于PC的软件代码进行调整,结合DS
7、P的硬件和指令结构特 性,在以TI公司的TMS320DM642 DSP为核心的硬件平台上实现了 MPEG4视频编码器,并通过软件优化等方法,使编码器基本满足实时性要求。2.2方案比较通过对上述三种方案的分别论述可知:纯硬件方式实现容易,并且各方面参数都能到达 理想值,但是其方案一旦固定就无法更改,因此系统的升级和更新困难,而且芯片造价高, 性价比较低,这就给产品的推广造成了阻碍;方案二阐明了软件方式的优缺点,虽然比较容 易实现升级,但其运算速度慢,一般仅用于前期的仿真处理。方案三是基于DSP的方式,它 不仅能高速的处理信号,而且具有良好的兼容性,软件更新和使用新的编码标准时易实现, 具有更多实
8、际产品的发展前景。2.3方案选择我的设计意义在于通过基于DSP的MPEG4编码器的研究,全面剖析了 MPEG标准的核心算 法,总结讨论了基于DSP的软件开发和优化方法,尤其是在视频编码器方面,可作为今后对 MPEG4编码算法改进和研究其它视频标准编码器在DSP平台上实现的基础和借鉴。本课题的 研究成果可应用于实现脱离计算机独立工作的脱机图像处理系统,使MPEG4的应用更加灵活 方便,可以将MPEG4应用于更加多样化的领域和不同的工作环境。而且鉴于目前市场上专用 视频编码芯片价格昂贵,本方案可以大大降低实现MPEG4应用的成本,与同类产品相比将具 有较强的市场竞争力。近年来,随着网络和多媒体技术
9、的发展,视频信息通信的重要性和需求急剧增长,而其 中的关键就在于视频压缩编码技术的应用。ITU和ISO制订的这一系列视频编码标准,都在 原来的技术上不断地完善和升级,从而极大地推动了视频多媒体技术的实用化和产业化。 MPEG4是一种可应用于通信、广播和计算机等诸多领域的通用视频编码标准,它基于对象的 编码方式可以使图像主观质量、交互性更好,同时具有很好的容错性和时间、空间伸屈性, 具有适应各种带宽的强大能力,能够使视频数据在多媒体环境中对视频目标进行高效存储、 传输和操纵。MPEG4已经在数字电视、视频会议、实时多媒体监控、低比特率下的移动多媒 体通信、Internet上的视频流与可视游戏、D
10、VD上的交互多媒体应用、电视点播等方面有了 广泛的应用,目前是视频压缩编码应用的主流,从而成为国内外视频编码研究和应用的热点。 同其他IPTV编码标准相比,MPEG4的特点和所支持的新功能主要表现在以下三个方面:(1) 基于内容的交互性(Content-based Interactivity)a. MPEG4最大的特点是基于内容、基于对象进行编码,支持无须编码就可进行基于内容 的操作与比特率编辑,而不是像MPEG1、MPEG2基于视频帧的编码。例如:使用者可在图像或 比特流中选择一具体的对象(例如图像中的某个人、建筑物等等),随后改变它的某些特性。 这些对象可以使单声道、立体声和多声道音频,二
11、维和三维或者单目、立体或多目视频、计 算机图形、动画、文字等。对每一个对象的编码形成一个对象码流层,该码流中包含着对象 的形状、位置、纹理以及其他方面的属性等。对一幅图像编码所形成的码流就由一系列这样 的对象层码流所构成。用户可以直接对“对象层”进行存取操作,也可以自行选择场景中的 物体的解码质量。b. 支持自然与合成数据的混合编码,提供将自然视频图像同合成数据(如文本、图形等) 有效结合的方式,包括混合编码以及同步,同时支持交互性操作。c. 增强的时间域,随机存取。提供有效的随机存取方式,在有限的时间间隔内,可按帧 或任意形状的对象,对音频、视频序列进行随机存取。例如以一序列中的某个音、视频
12、对象 为目标进行“快进”搜索。(2) 高压缩率(Compression)a. 提高编码效率。在可比拟速率下,MPEG4提供的主观视频质量要好于已有的或是其它 在制定中的标准。一般的说,MPEG4的理论压缩倍数高达100倍。这一功能可望在迅速发展 的移动通信网中获得应用,但值得注意的是,提高编码效率不是MPEG4唯一的主要目标。b. 对多个并发数据流编码。MPEG4将提供对一景物的有效多视角编码,加上多伴音声道 编码及有效的视听同步。在立体视频应用方面,MPEG4将利用对同一景物的多视点观察所造 成的信息冗余。MPEG4的这一功能在足够的观察视点条件下,将有效地描述三维自然景物。(3) 通用存取
13、(Universal Access)a.错误易发环境中的鲁棒性和纠错性。MPEG4将提高抗误码能力,尤其是在易发生严重 错误的环境下的低比特率应用中(移动通信链路)实现安全的低码率编码和传输。它采用3 个策略来达到此目的:再同步(resynchroniaztion)、数据恢复(data recovery)、错误隐 藏(error concealment)。再同步工具在检测到误码时重新再解码器和码流间建立同步点, 前一个同步点和新建立的同步点间的码流就是发生误码的数据;数据恢复是通过标准中提供 的一种可逆变一一长编码技术来恢复两个同步点之间的数据;错误隐藏通过空间的纹理相关 性和视频前后帧的相关
14、性对错误的图像区域进行隐藏。b.基于内容的尺度可变性。内容尺度可变性给图像中的各个对象分配优先级,对重要性 不同的对象在从视频码流解码时用不同的时间或空间分辨率表示。MPEG4提供了两种基本分 级工具,即时域分级和空域分级,可实现时间、空间的尺度可变性,此外还支持时域和空域 的混合分级。每一种分级编码都至少有两层,低层称为基本层(b ase-layer),高层称为增强 层(enhancement-layer)。基本层提供了视频序列的基本信息,增强层提供了视频序列更高 的分辨率和细节。基于内容的尺度可变性是MPEG4的核心,因为图像中所含对象的目录相应 的优先级确定后,其他的基于内容的功能就比较
15、容易实现了。对甚低比特率应用,可伸缩性 是一个关键的因素,它提供了自适应使用可用资源的能力,可以最有效的利用有限资源。3. IPTV的编码标准长期以来,基于像素的第一代编码技术一直是图像编码的主流方法。它从消除图像数据 的时间、空间相关冗余出发,编码实体是像素或像素块,以显示器件为图像/视频系统的最后 环节,没有考虑人眼视觉特性对编码图像的影响。20世纪80年代初人们就认识到这种基于 数据统计的编码技术的不足,特别是在低速率视频编码时有严重的局限性。20世纪80年代中后期,相关学科的迅速发展和新兴学科的不断出现为视频编码的发展 注入了新的活力,同时关于人类的视觉生理、心理特性的研究成果也拓展了
16、人们的视野。 M.Kunt于1985年提出了利用人眼视觉特性的第二代图像编码的思想。图像编码中的对象不 再是像素或像素块,而是考虑到人眼是图像/视频信号的最终接受者,根据人类视觉对图像轮 廓纹理较为敏感的特点将图像数据进行分割,即按图像内容来划分编码区域。基于内容的第 二代编码技术是视频编码的新一代技术,是目前视频编码研究中最为活跃的一个领域。ISO/IEC下的运动图像专家组(MPEG)对MPEG4标准的讨论最早开始于1991年,其初衷 是为了研究满足视频会议、可视电话等极低比特率应用的编码方案,并定名为音视频对象的 编码技术。但是由于传统的基于像素分块的DCT变换和运动补偿技术的第一代编码方
17、法已达 到了视频压缩的极限,同时为了满足当今世界越来越多的视听信息要求以数字形式进行相应 的变换而产生的种种新的需求,适应多媒体数据压缩技术的发展趋势,1994年7月的Grimstad MPEG会议上,MPEG4的目标发生了根本的变化,转而致力于成为可以适应各种传输码率的通 用标准,为多媒体的数据压缩提供一个更为广阔的平台,它更多定义的是一种格式和框架, 而不再是具体的算法,为实际开发者提供自由的开发空间,实际应用中可根据要求的不同来 现场配置解码器。MPEG4编码系统是完全开放的,可以随时加入各种新的算法模块。同时, MPEG4提供了一个包含各种工具和算法的工具箱,给出各种任意形状可是对象的
18、高效表达式, 可用于各种图像和视频的高效压缩。在此背景下,MPEG工作组于1999年推出了 MPEG4标准 的第一版,并于2000年初正式成为国际标准(ISO/IEC14496),之后陆续有第二版的制订和 增补工作。MPEG4标准的主要特征是基于对象(object-based)的编码。所谓的对象就是在一个场 景中能够访问和操纵的实体,具体到一幅图像中,对象就是能表征有含义的实体的一组区域。 对象的划分可以根据其独特的纹理、运动、形状、模型和高层语义为依据,语音、图像、视频等都可以作为单独的对象,也可以集成为更高级的对象场景。MPEG4除了采用变换编 码、运动估计与运动补偿、量化、熵编码等第一代
19、视频编码核心技术外,采用基于对象的编 码理念,即在压缩之前将每个场景定义成一幅背景图和一个或者多个前景音视频对象,然后 对背景和前景分别进行编码,再经过复用传输到接收端,然后再对背景和前景分别解码,从 而组成需要的音视频。随着网络、有线和无线通信系统的迅猛发展,多媒体网络技术的日趋 成熟与完善,交互式计算机和交互性电视技术普遍应用,以及视频、音频数据综合服务等应 用的发展,通过应用MPEG4视频编码技术基于对象的特点,人们对多媒体信息特别是视频信 息的应用可以从单纯的播放转向基于内容的访问和操作,从对多媒体信息被动的接受方式转 向自由操作多媒体信息。从MPEG4编码技术特点来看,其应用前景将是
20、非常广阔的。MPEG4标准必将广泛应用于 数字电视、动态图像、万维网(WWW)、实时多媒体监控、低比特率下的移动多媒体通信、内 容存储和检索多媒体系统、Internet或Internet上的视频流与可视游戏、基于面部表情模 拟的虚拟会议、DVD上的交互多媒体应用、基于计算机网络的可视化合作实验室场景应用、 演播电视等。3.1 IPTV编码模块的介绍3.1.1 IPTV编码技术模块DMIF(Delivery Multimedia Integrtion Framework)主要解决交互网络中、广播环境下 以及磁盘中多媒体应用的操作问题,通过传输多路合成比特信息,建立客户端和服务器端的 连接和传输。
21、传输接口层在MPEG4中使用DMIF传输基本流,面向应用将网络实现的细节包装。 DMIF使用服务和会话的概念,通过信道处理媒体基本流。对信道的处理是由DMIF所产生的 信道标识决定的,即告诉用户在哪儿能得到所需的信息。使用复接器将几路同步的基本流通 过一个信道进行传输,因此MPEG4系统处理媒体流,而DMIF处理传输,它不需要知道媒体流 的特性。对客户与服务器之间的控制是通过DMIF应用接口(DAI)。实际上,DMIF相当于OSI 的会话层的功能,DAI表示会话服务存取点。传输接口层对媒体不透明,而对传输是透明的。3.1.2 AV对象编码模块MPEG4引入一个关键的概念:AV对象。MPEG4技
22、术是对运动图像中的内容进行编码,其 具体的编码对象就是图像中的音频和视频,术语称为“AV对象”。为了支持基于对象的交互, 系统将图像视为由若干个AV对象组成的场景,AV对象变成了系统编码、存取和传输的最小 单位,也是用户所能操纵的最小单位。AV对象是听觉,视觉或者视听内容的表示单元。其中 最基本的单元是原始AV对象,它可以使自然的或合成的声音、图像。原始AV对象又可以进 一步组成符合AV对象。整个MPEG4是围绕如何高效编码AV对象,如何有效组织和传输AV对 象而编制的。因此,AV对象的编码是MPEG4的核心编码技术。AV对象的提出,使多媒体通信 具有高度的交互能力和很高的编码效率。3.1.3
23、 VOP视频编码模块为实现基于视频对象的编码,MPEG4引入了视频对象面VOP(Video Object Plane)的概 念。MPEG4假定输入视频序列的每帧都被分割成了一系列的形状不规则的图像区域,即VOP, 每个区域由感兴趣的特定图像或视频内容构成,不再局限于MPEG1和MPEG2所必须要求的矩 形形状。由任意形状的VOP图像区域所构成的输入视频,其帧与帧之间的VOP的形状和位置 又可以不同,而一系列连续的属于同一场景同一物理对象的VOP构成了视频对象(VO),同一 视频对象的VOP序列的形状、运动和纹理信息被编码传输,或者编码为一个隔离的视频对象 层 VOL (Video Object
24、 Layer)o构成VOP的信息包括纹理信息、运动信息和形状信息。对运动信息和纹理信息的编码, MPEG4沿袭了 MPEG1和MPEG2中的技术,在保持图像质量的条件下可以达到很高的压缩比。 算法采用基于宏块(Micro block)的带运动补偿的预测编码以减少时间冗余度,预测误差则 进一步采用DCT(离散余弦变换)压缩以消除空间冗余度,最后再使用变长编码法(如Huffman 编码)产生最后的代码。而形状的表示有2种方法。自然的视频场景中,VOP可按照一定的 语义通过分割视频对象产生,在该情况下,形状是二进制(binary),0表示在对象内部,1 表示在对象外部。而在混合的场景中,形状被表示为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- IPTV 编码器 设计 实现
链接地址:https://www.31ppt.com/p-4885453.html