《多媒体技术》讲稿第6章.ppt
《《多媒体技术》讲稿第6章.ppt》由会员分享,可在线阅读,更多相关《《多媒体技术》讲稿第6章.ppt(101页珍藏版)》请在三一办公上搜索。
1、第六章 多媒体数据压缩标准,主要内容,失真度量音频压缩标准图象压缩压缩视频压缩标准,6.2几种典型的音频压缩标准,声音压缩标准 按质量,音频信号可分为电话质量的语音、调幅广播质量的音频信号和高保真立体声信号。三种音质压缩标准对比。如下表所示。,三种音质的压缩标准表,名称,对比项,几种典型的音频压缩标准,G.711 PCM,采样8KHz,-64KbpsG.721 ADPCM,64kbps-32kbpdG.722 高质量,SB-ADPCM,量化比特14bitG.728 参数编码,矢量量化G.729 低码率的音频压缩标准-8kbpsG.723.1-5.3kbps,6.3kbps,用在电话网、移动网、
2、Intenet 的语音通信MPEG1AC-3用于音响,HDTV.对6个声道压缩-320kbps。采样48KHz 返回,6.3 典型的图像(视频)压缩标准,几种典型的图像(视频)压缩标准(1)JPEG静态图像压缩标准(2)JBIG标准(二值图像标准)(3)MPEG动态图像压缩标准(4)P64标准的视频编码标准(5)AVS标准 返回,6.3典型图像的压缩标准,JPEG静态图像压缩标准(Joint Picture Experts Group-联合图象专家组)1992年正式被采纳成为国际标准,JPEG标准,有损图像压缩方法在图像区域内,相邻图像的内容变化较缓慢,即存在大量的空间冗余心理学实验证明,人眼
3、对高频分量的感知能力远低于对低频分量的感知能力人眼对灰度分量的感知能力远高于对彩色分量的感知能力,两种基本压缩算法(混合)1。基于DPCM的无失真算法(无量化器)图2。基于 DCT的有失真算法,JPEG标准,下面介绍JPEG标准的基于 DCT的有失真算法压缩原理:JPEG算法 基本步骤:JPEG算法操作可分成以下三个步骤:通过离散余弦变换(DCT)去除数据冗余;使用量化表对以DCT系数进行量化;对量化后的DCT系数进行编码使其熵达到最小。基于离散余弦变换(DCT)的有失真压缩编码的编码过程如下图所示,JPEG标准,JPEG标准,A.离散余弦变换 JPEG采用88子块的二维离散余弦变换算法。1)
4、DCT的实质与特点:利用正交变换实现图象数据压缩的实质,是通过图象取样信息从空间域转到变换域,其能量集中,保持且近似于不相关,从而保留能量集中部分即可使频带压缩。DCT的均方误差编码性能在理论上最接近于在马尔科夫模型假定下的最佳统计匹配正交变换(KLT)。DCT可用快速算法来实现。,基于DCT的JPEG算法离散余弦变换示意图,88的子图像块的变换示意图,基于DCT的JPEG算法DCT的可分离性图示,JPEG标准,FDCT输出64个基信号的幅值称作“DCT系数”,即DCT变换系数值。64个变换系数中包括一个代表直流分量的“DC系数”和63个代表交流分量的“AC”系数。IDCT是FDCT的逆过程,
5、它把64个DCT变换系数经逆变换运算,重建一个64点的输出图象。在所用设备的计算精足够高的前提下,且系数未经过量化,原始的64点信号就能够精确地恢复。,3)量化 基于DCT编、解码框图为了压缩数据,对DCT系数要作量化处理,量化的作用是在保持一定质量前提下,丢弃图像中对视觉效果影响不入的信息。量化处理是一个多到1的映射,是造成DCT编解码信息丢失的根源之一。JPEG中采用线性非均匀量化器,量化定义为对64个DCT系数除以量化步长,四舍五入取整.,JPEG标准,量化表的尺寸与64个变换系数一一对应(64个),量化表元素随DCT系数的位置和彩色分量的不同有不同值。它可由用户规定(JPEG给出参考值
6、),并作为编码器的一个输入。量化表中每个元素值为1到255间任意整数,其值规定了它所对应的DCT系数的量化器步长。,JPEG标准,量化的作用是在一定的主观保真度图象质量前提下,丢掉那些对视觉影响不大的信息,不同频率的余弦函数对视觉影响不同,可以根据不同频率的视觉阈值来选择量化表中的元素值的大小。这样通过心理视觉实验,去确定对应于不同频率的视觉阈值,以确定不同频率的量化器步长。,JPEG标准,JPEG给出量化特性表(示范),根据心理视觉加数函数而得到亮度分量量化矩阵。同时还给出根据心理视觉加权函数而得出的色度分量量化矩阵。这是JPEG给出的参考值。,基于DCT的JPEG算法亮度量化表和色度量化表
7、,亮度分量量化矩阵、色度分量量化矩阵(JPEG中给出的参考值),JPEG标准,每一个 量化表右下角的值较大,目的在于更多的减少高频分量色度量化表的值较亮度分量表大,目的在于更多的减少色度分量,可以给量化矩阵乘以比例值来改变压缩率JPEG给用户提供质量因子(quality factor),本质上和比例因子联系在一起100%的质量因子对应无损压缩JPEG允许定制量化表,并存储在压缩码流头部,JPEG标准,4)系数编码 64个变换系数经量化后,坐标U:V=0的DC系数是直流分量,即64个空域图象采样值的平均值。相邻块(88)之间的DC系数相关性强,JPEG对DC系数采用DPCM(差分编码)方法,即D
8、IFF=DCJ-DCj-1。即对相邻像素块之间的L系数的差值进行编码。,基于DCT的JPEG算法对DC系数的编码,根据DC系数的特点,JPEG算法使用了差分脉冲调制编码(DPCM)技术,即对相邻块之间的DC系数的差值:DIFF=DCi-DCi-1进行编码。,JPEG标准,其余63个交流系数(AC系数)采用行程编码从左上方Aco1开始,沿对角线方向,以“Z”字形(Zig-Zag)行程扫描,直至AC77扫描结束。量化后的AC系数通常会有许多零值,以“Z”字形路经进行行程编码,可增加行程中连续零的个数,63个AC系数行程编码的码字甚至可用两个字节表示.,JPEG标准,5)熵编码 为了进一步压缩数据,
9、可对DC和AC行程编码的码字再作基于统计特性的熵编码,JPEG建议用哈夫曼(Huffman)或自适应二进制算术编码。熵编码步骤:熵编码中的中间格式表示 可变长度熵编码,压缩比与恢复图像质量的关系,返回,针对基于DCT的JPEG压缩算法,在原始图像每像素采用8比特编码条件下,定量描述压缩比与恢复图像质量的关系,如下表所示。,工作模式,JPEG图像压缩的四种工作模式:a.基于DPCM的无失真压缩:从左到右、从上到下扫描信号,为每个图像元素编码。DPCM,Huffman,无量化。b.基于DCT顺序工作方式:对变换时间长的扫描器,以复合扫描顺序进行图像编码。c.累进(渐进)工作方式:保证准确恢复图像所
10、有样本值的图像编码。由粗到细,多次扫描,先传低频,再传高频分量(细节)。d.分层(分级)工作方式:以多种分辨率进行图像编码,可直接获得低分辨率图像,重建复原全图。,JPEG标准,顺序模式默认的JPEG模式,对灰度图或彩色图像分量进行从左往右,从上往下的扫描并编码渐进模式首先快速传送低质量的图像,接着传送高质量的图像所需要增加的部分信息类似于GIF图像格式适合于网络带宽不高的应用,JPEG标准,渐进模式主要的步骤(变换、量化)和顺序模式相同通过两种方式实现渐进1.频谱选择利用DCT系数的频谱特性,频率高的AC系数提供的是细节信息第一次扫描:DC系数和前几个AC分量第二次扫描:下几个AC分量,JP
11、EG标准,2.连续近似对于所用的DCT系数同时编码,按照重要性的高低在不同的扫描中编码不同的比特位第一次扫描:前几个比特位编码,如比特7,6第二次扫描:对重要性稍低的比特编码,如比特5,JPEG标准,分级模式分级JPEG对处于不同分辨率层次中的图像进行编码基本层,增强层低分辨率的编码图像通过低通滤波器得到更高分辨率的图像提供更多的细节信息和渐进JPEG类似,分级JPEG也可以通过多次扫描,渐进改善图像质量,多媒体数据压缩的标准,JPEG2000小波Motion JPEG只进行帧内编码 返回,MPEG动态图像压缩标准(Motion Picture Experts Group)MPEG-1、2、4
12、、7 MPEG-1 是一个面向家庭电视质量级的视频、音频压缩标准;如VCD。MPEG-2 是面向演播级的视频、音频压缩标准。该类数据要求的清晰度较高。如DVD、HDTV。MPEG-4 是基于内容的数据压缩标准。MPEG-7 是基于内容的描述语言和格式的标准。返回,MPEG运动图像编解码标准,标准的内涵 MPEG的国际标准分为三个部分,即Systems,Video,audio。Systems将分别的audio与Video合成为单一数据流。Video和Audio的技术指标给出了两者编码位流的句法与语义。,MPEG流 MPEG1流结构 MPEG1的流具有两层:System层包含定时与其它信息,去解复
13、用audio和Video流,并在回放时同步audio与Video。压缩层包括压缩audio和Video流。,下图表示了MPEG1的解码系统,系统解复用抽取定时信息,并传到系统的有关单元去。,系统层支持以下五个基本功能:1)解码时多条压缩流的同步;2)多条压缩流交织为一个单一流;3)为启动解码而对缓冲区进行初始化;4)连续的缓冲区管理;5)时间标识。,MPEG-2流结构 MPEG-2定义了两类系统流:Program(节目流)和transport(传输流)。两者的复用流组成了Video与audio的基本的流,两者均被分别捆包传送。,一个传输流包括一或多个节目。视频与音频基本流由访问单元组成。节目流
14、编码层允许将具有一个或多个基本流的一个节目组合成一个单一流。来自于各基本流的数据与那些允许节目中的基本流同步播放的信息复用一起。一个节目流包含来自于一个节目的复用在一起的一个或多个基本流。基本流数据携带于PES分组包中,PES分组包由分组头及其后的分组包数据组成。,视频流数据层次 MPEG-1与MPEG-2标准定义了视频流数据结构的层次如下图所示。,比特流的语法层及其功能,其中包括:VIDEO Sequence它由一系列的头,一个或多个图片组,和一个序列结束码组成,它是前面所定义的视频数据流的另一个术语。Group of pictures它是一个或多个图片系列。允许随机访问其序列。Pictur
15、e一个视频序列的基本编码单元,图片由三个正交的本色组成,包括亮度Y,两个色度CbCr的值,,Slice一个或多个结构宏块、在Slice里宏块的顺序是从左到右,从上到下。在差错处理时Slice是很重要。如果位流有一个错误、解码器可以是下一个Slice的起点,这有利于改善图像质量。Mocroblock一个16-pixel X 16-line的亮度成分区和相应的色度分量的8-pixel X 8-line区。Block,帧间图像编码(Inter-Picture Coding)图片类型 MPEG标准专门定义3种图片类型:intra,predicted和Bidirectional。,Intra-Pictu
16、res即称图,编码时仅使用本图信息,图提供所有可能的随机访问点进入压缩的视频数据,图仅使用变换编码,因此它提供适度的压缩倍数,典型的约每象素2位为宜。,Predicted Pictures称为P图,它被编码时考虑最接近的前面的或P图,这种技术称之为朝前预测,如下图,Bidirectional Pictures称为B图,它使用过去的或前面的图为参考,这种技术称为双向预测,如下面图所示,B类图提供最大的压缩并不会产生误差,因为它从不用为参考图,双向预测还减少了噪声的影响,由于它对两帧起了平均作用。,视频流典型布局MPEG算法允许编码时选择频率并定位图,这种选择基于对随机访问性在应用时的需要,并定位
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体技术 讲稿
链接地址:https://www.31ppt.com/p-6526932.html