体数据压缩编码标准.ppt
《体数据压缩编码标准.ppt》由会员分享,可在线阅读,更多相关《体数据压缩编码标准.ppt(123页珍藏版)》请在三一办公上搜索。
1、1,第4讲 多媒体数据压缩编码标准,2,4.1 静态图像压缩标准 JPEG,3,4.1.1 JPEG标准的主要内容,ISO/IEC 10918号标准“多灰度连续色调静态图像压缩编码”即JPEG标准,选定ADCT作为静态图像压缩的标准化算法。该标准为保证通用性,包含以下两种方式:空间方式 可逆编码 空间方式对于基本系统和扩展系统来说,被称为独立功能。DCT方式 非可逆编码,包含基本系统(必须保证的功能)和扩展系统(扩充功能),4,基本系统是实现DCT编码与解码所需的最小功能集,大多数的应用系统只要用此标准,就能基本上满足要求。扩展系统是为了满足更为广阔领域的应用要求而设置的。,5,4.1.2 J
2、PEG静态图像压缩算法 1.基于DPCM的无失真编码,预测器,熵编码器,表说明,无失真编码器,源图像数据,压缩图像数据,图1 无失真编码简化框图,6,基于DPCM的无失真编码优点是硬件易实现,重建图像质量好。缺点是压缩比太低,大约为2:1。,7,工作原理是对X的预测值X,将X-X进行无失真熵编码。对X的求法见图给出的预测方式。,(a)X邻域,(b)预测方式,图2 预测器,8,2.基于DCT的有失真压缩编码,离散余弦变换量化处理DC系数的编码和AC系数的行程编码 熵编码,9,图3 基于DCT编码过程,FDCT,熵编码器,表说明,无失真编码器,源图像数据,压缩图像数据,量化器,表说明,88块,(Y
3、UV每个分量),10,图4 解码过程,熵解码器,IDCT,表说明,解码器,逆量化器,表说明,88块,压缩图像数据,恢复的图像数据,11,离散余弦变换,(1)首先把原始图像顺序分割成88子块;(2)采样精度为P位(二进制),把0,2P-1范围的无符号数变换成-2P-1,2P-1范围的有符号数,作为离散余弦正变换(FDCT)的输入;(3)在输出端经离散余弦逆变换(IDCT)后又得到一系列88子块,需将数值范围-2P-1,2P-1变换回0,2P-1来重构图像。,12,这里用的88 FDCT的数学定义为:F(u,v)=(1/4)C(u)C(v)x=07y=07 f(x,y)cos(2x+1)u/16)
4、cos(2y+1)v/16)88 IDCT的数学定义为:f(x,y)=(1/4)u=07v=07 C(u)C(v)F(u,v)cos(2x+1)u/16)cos(2y+1)v/16)其中:C(u),C(v)=1/2 当u,v=0 C(u),C(v)=1 其他下面的编码针对FDCT输出的64个基信号的幅值(F(0,0),F(7,7)称作DCT系数)来进行,13,量化处理,量化是一个“多到一”的过程,失真原因关键是找最小量化失真的量化器,JPEG采用线性均匀量化器,定义为对64个DCT系数除以量化步长,然后四舍五入取整:FQ(u,v)=Integer RoundF(u,v)/Q(u,v)Q(u,v
5、)是量化器步长,它是量化表的元素。量化表元素随DCT系数的位置和彩色分量不同有不同的值,量化表尺寸为88与64个变换系数一一对应。这个量化表应由用户规定(JPEG给出参考值-见后面表格),并作为编码器的一个输入。,14,表1 亮度量化表,15,表2 色度量化表,16,量化的作用是在一定主观保真度图像质量前提下,丢掉那些对视觉影响不大的信息,通过量化可调节数据压缩比。,17,DC系数的编码,64个变换系数经量化后,坐标u=v=0的F(0,0)称DC系数(直流分量),它即64个空域图像采样值的平均值。相邻88块之间DC系数有强相关性。JPEG对量化后的DC系数采用DPCM 编码,即对DIFF=DC
6、i-DCi-1编码。,blocki-1,blocki,DCi-1,DCi,DC系数差分编码,18,AC系数的行程编码,其余63个交流系数(AC)采用行程编码。从左上方AC0,1开始沿对角线方向“Z”字形扫描直到AC7,7扫描结束,这样可增加行程中连续0的个数。AC系数编码的码字用两个字节表示,如图所示:,图5 Z字形扫描,19,图6 AC系数行程编码码字,两个非0值间连续0的个数,表示下一个非0值需要的bit数,下一个非0实际值,7,4,3,0,字节1,字节2,例子:对“,3,0,0,0,0,0,12,0,0,”编码,(5,4),(12),.,20,熵编码,为了进一步压缩数据,需对DC码和AC
7、行程编码的码字再做基于统计特性的熵编码。JPEG建议的熵编码是Huffman编码和自适应二进制算术编码。熵编码可分成两步进行:把DC码和AC行程码转换为中间符号序列给这些符号赋以变长码字,21,AC系数熵编码的中间格式,熵编码的中间格式由两个符号组成:符号1:(行程,尺寸)符号2:(幅值)第一个信息参数“行程”表示前后两个非0的AC系数之间连续0的个数。第二个信息参数“尺寸”是后一个非0的AC系数幅值编码所需比特数。,22,行程取值范围为115,超过15时用扩展符号1(15,0)来扩充,63个AC系数最多增加3个扩展符号1。编码结束时用(0,0)表示。“尺寸”取值范围为010。“幅值”用以表示
8、非0的AC系数的值,范围为-210,210-1(最长10bit),结构形式如下表所示。,23,1-1,12-3.-2,2.33-7.-4,4.74-15.-8,8.1567 89-511.-256,25651110-1023.-512,5121023,表3 符号2结构,24,DC系数的熵编码,对于直流分量DC也有类似于AC系数的编码格式符号1:(尺寸)符号2:(幅值)“尺寸”表示DC差值的幅值编码所需的比特数,而“幅值”表示DC差值的幅值,范围为-211,211-1。可在表3中多加一级,幅值尺寸以1到11比特表示。将63个AC系数表示成为符号1和符号2序列,其中连续0的长度超过15时,有多个符
9、号1;块结束(EOB)时仅有一个符号1(0,0)。,25,“4,0,0,0,0,0,0,0,0,3,0”.4,3之间有31个0.(15,0),(15,0),(1,0),(3)可变长度熵编码就是对上述序列进行变长编码。对DC系数、AC系数中的符号1采用Huffman表中的变长码编码(VLC),这里Huffman变长码表必须作为JPEG编码器输入。符号2用码字长度在表3中给出的变长整数VLI码编码。VLI是变长码,但不是Huffman码。VLI的长度存放在VLC中,JPEG提供VLI码字表供用户使用,26,JPEG提供2套Huffman码表:亮度和色度。每套又有DC表和AC表各1个。共有4个表。表
10、定义(亮度DC系数码表)16B说明码字长度:X00 01 05 01 01 01 01 01 01 00 00 00 00 00 00 00 第i个(1-16)元素值表示长度为i的Huffman码个数。紧跟一组值说明亮度表分类:X00 01 02 03 04 05 06 07 08 09 0A 0B,27,表4 亮度DC系数表,28,表5 色度DC系数表,29,表6 JPEG压缩效果评价,30,3.基于DCT的累进操作方式编码,顺序方式:每个图像分量的编码一次扫描完成的;累进方式:图像分量编码要经过多次扫描才完成。累进方式 第一次扫描只进行一次粗糙图像的扫描压缩,以相对于总的传输时间快得多的时
11、间传输粗糙图像,并重建一帧质量较低的可识别图像;在随后的扫描中再对图像作较细的压缩,这时只传递增加的信息,可重建一幅质量提高一些的图像。这样不断累进,直到满意的图像为止。,31,需在量化器的输出与熵编码的输入之间,增加一个足以存储量化后DCT系数的缓冲区,对缓冲区中存储的DCT系数多次扫描,分批编码。有以下两种累进方式:频谱选择法 扫描中只对64个DCT变换系数中某些频带的系数进行编码、传送,随后对其他频带编码、传送,直到全部系数传送完毕为止。按位逼近法 沿着DCT量化系数有效位(表示系数精度的位数)方向分段累进编码。如第一次扫描只取最高有效位的n位编码、传送,然后对其余位进行编码、传送。,3
12、2,4.基于DCT的分层操作方式,分层方式是对一幅原始图像的空间分辨率,分成多个分辨率进行“锥形”的编码方法,水平(垂直)方向分辨率的下降以2的倍数因子改变。,图7 分层操作方式,33,分层操作方式的过程,(1)把原始图像空间分辨率降低。(2)对已降低分辨率的图像采用基于DCT的顺序方式、累进方式或无失真预测编码中的任何一种编码方法进行编码。(3)对低分辨率的图像解码,重建图像,使用插值滤波器,对它插值,恢复图像的水平和垂直分辨率。(4)把分辨率已升高的图像作为原始图像的预测值,对它们的差值采用基于DCT的顺序方式、累进方式或用无失真方式进行编码。(5)重复(3)、(4)直到图像达到完整的分辨
13、率编码。,34,4.1.2 JPEG2000简介,基于Internet网络的多媒体应用,给图像编码提出了新的要求.2000年12月公布的新的JPEG 2000标准(ISO 15444),其目标是在高压缩率的情况下,如何保证图像传输的质量。JPEG中采用DCT变换考察整个时域过程的频域特征或整个频域过程的时域特征。JPEG2000采用以小波变换为主的多分辨率编码方式。JPEG2000统一了面向静态图像和二值图像的编码方式,是既支持低比率压缩又支持高比率压缩的通用编码方式。,35,该算法主要特点如下:(1)高压缩率。与JPEG相比,可修复约30的速率失真特性。JPEG和JPEG2000在压缩率相同
14、时,JPEG2000的信噪比将提高30左右;(2)无损压缩。预测编码作为对图像进行无损编码的成熟方法被集成在JPEG2000中;(3)渐进传输。JPEG2000可实现以空间清晰度和信噪比为首的各种可调节性,从而实现渐进传输,即具有“渐现”特性.(4)感兴趣区域压缩。JPEG2000 支持所谓的“感兴趣区域”。,36,4.2 运动图像压缩标准MPEG,37,4.2.1 MPEG标准简介,MPEG标准是面向运动图像压缩的一个系列标准。最初MPEG专家组的工作项目是3个,即在1.5Mbps,10Mbps,40Mbps传输速率下对图像编码,分别命名为MPEG-1,MPEG-2,MPEG-3。MPEG-
15、3后被取消.为了满足不同的应用要求,MPEG又将陆续增加其他一些标准MPEG-4,MPEG-7,MPEG-21。,38,MPEG算法编码过程和解码过程是一种非镜象对称算法(不对称),解码过程要比编码过程相对简单些。MPEG-1和MPEG-2只规定了解码的方案,重点将解码算法标准化。因而用硬件实现MPEG算法时,人们首先实现MPEG的解码器,如C-Cube公司CL450解码器系列。最近几年,随着MPC性能的提高,软件解压功能也逐渐得到支持。,39,4.2.2 MPEG-1系统,“用于数字存储媒体运动图像及其伴音速率为1.5Mbps的压缩编码”简称MPEG-1,作为ISO/IEC 11172号建议
16、于1992年通过。主要用于在CD-ROM存储运动视频图像,它针对标准分辨率(NTSC制为352240;PAL制为352288)的图像进行压缩,每秒30帧画面,具备CD音质。它还用于数字电话网络上的视频传输,如非对称数字用户线路(ADSL)、视频点播、教育网络等。使用MPEG-1的压缩算法,可将一部120分钟长的电影压缩到1.2GB左右。因此,它被广泛地应用于VCD制作。,40,MPEG-1分为5个部分,(1)MPEG系统(11172-1),定义音频、视频及有关数据的同步;(2)MPEG视频(11172-2),定义视频数据的编码和重建图像所需的解码过程,亮度信号分辨率为360240,色度信号分辨
17、率为180120;(3)MPEG音频(11172-3),定义音频数据的编码和解码;(4)一致性测试(11172-4);(5)软件模拟(11172-5)。,41,图2.15 MPEG-1解码器原型,42,MPEG-1编解码器原型:多路复合而成的码流假设以介质特定格式存储在数字存储介质(DSM)或网络上,标准不规定介质特定格式。系统解码器从输入多路复合流中抽取定时信息,并对输入流进行分流处理,输出两个基本流分别给视频和音频解码器。视频和音频解码器分别解码输出视频和声音信号。,43,系统、视频、音频和介质4个解码器之间用定时信息进行同步。多路复合流构造为2层:系统层和压缩层。系统解码输入的是系统层;
18、而视频、音频解码器输入的是压缩层。,44,系统解码器执行两类操作:一类是作用在整个多路复合流上的操作,称为复合流操作;另一类是作用在单个基本流上的操作,称为特定流操作。系统层分为两个子层:一个子层称为包(pack),是复合流操作对象;另一个子层称为组(packet),它用于特定流操作。,45,MPEG音频标准的特点:音频信号采样率可以是32kHz,44.1kHz或48kHz。压缩后的比特流可以按以下4种模式之一支持单声道或双声道:提供给单音频通道的单声道模式;提供给两个独立的单音频通道的双-单声道模式;提供给立体声通道的立体声模式;联合立体声模式,利用立体声通道之间的关联或通道之间相位差的无关
19、性,或者对两者同时利用。,46,MPEG音频标准提供3个独立的压缩层次,用户可在复杂性和压缩质量之间权衡选择。层1最简单,使用比特率384kbps,主要用于DCC;层2的复杂度中等,使用比特率192kbps左右,主要应用于数字广播的音频编码、CD-ROM上的音频信号以及CD-I和VCD。层3最为复杂,使用比特率64kbps,尤其适用于ISDN上的音频传输,有损压缩但音质保持逼真效果。MP3音乐 是利用 MPEG Audio Layer 3 的技术,声音采用 1:10 甚至 1:12 的压缩率,47,压缩后的比特流具有预定义的比特率之一。MPEG音频标准也支持用户使用预定义的比特率之外的比特率。
20、编码后的比特流支持循环冗余校验(CRC)。MPEG音频标准还支持在比特流中载带附加信息。,48,MPEG视频数据流的结构,图2.16 MPEG-1数据体系结构,运动图像序列,图片组,图片,图片切片,宏块,块,8像素,49,运动序列 图像组 图像信号分3个部分:一个亮度信号Y和两个色度信号U、V。,50,图2.17 色度和亮度的位置关系 4:2:0采样结构亮度信号Y由偶数个行和偶数个列组成,色度信号U、V分别取Y信号在水平、垂直方向的1/2。如图所示,黑点代表色度U、V位置,亮度Y位置用白圈表示。,51,4:2:2采样结构,52,4:2:4采样结构,53,块:一个块由一个88的亮度信息或色度信息
21、组成。宏块一个宏块由四个Y块,一个Cb色差块和一个Cr色差块组成,如图所示。图2.18 宏块的组成图像切片 由一个或多个连续的宏块构成。,Y,U,V,8X8,8X8,0,1,2,3,4,5,54,块:一个块由一个88的亮度信息或色度信息组成。宏块一个宏块由四个Y块,两个Cb色差块和两个Cr色差块组成,如图所示。,Y,U,V,0,1,2,3,4,5,6,7,4:2:2宏块结构,55,Y,U,V,0,1,2,3,块:一个块由一个88的亮度信息或色度信息组成。宏块一个宏块由四个Y块,两个Cb色差块和两个Cr色差块组成,如图所示。,4:4:4宏块结构,56,4.2.4 MPEG-1视频编码技术,主要问
22、题:一方面无法达到很高的压缩比,另一方面用单一的静止帧内编码方法能最好地满足随机存取的要求。解决方法:对这两个方面做了折衷考虑。即为了减少时间上冗余性的基于块的运动补偿技术和基于DCT变换的减少空间上冗余性的ADCT技术,57,在MPEG中将图像分为3种类型:I图像 利用图像自身的相关性压缩,提供压缩数据流中的随机存取的点。P图像 用最近的前一个I图像(或P图像)预测编码得到(前向预测)。B图像 B图像在预测时,既可使用前一个图像作参照,也可使用下一个图像做参照或同时使用前后两个图像作为参照图像(双向预测)。,58,图2.19 帧间预测,1I,2B,3B,4B,5P,6B,7B,8B,1I,前
23、向预测,双向预测,59,运动序列流的组成,图2.20 典型的图像类型的显示次序,1秒,参照帧间有2个B图像,每0.5秒1帧I图像,I B B P B B P B B P B B P B B I B B P B B P B B P B B P B B,60,传输顺序,MPEG编码器需对上述图像重新排序,以便解码器高效工作,因为参照图像必须先于B图像恢复之前恢复。上述17帧图像重排后图像组次序为:,4,2,1,3,7,5,6,I,P,B,B,P,B,B,61,运动补偿技术,运动补偿技术主要用于消除P图像和B图像在时间上的冗余性提高压缩效率。在MPEG方案中,运动补偿技术工作在宏块一级。B图像宏块有
24、4种类型 帧内宏块,简称I块;前向预测宏块,简称F块;后向预测宏块,简称B块;平均宏块,简称A块。对于P图像,其宏块只有I块和F块两种。,62,无论B图像和P图像,I块处理技术都与I图像中采用技术一致即ADCT技术。对于F块、B块和A块,MPEG都采用基于块的运动补偿技术。F块预测时其参照为前一个I图像或P图像B块预测时其参照为后一个I图像或P图像对于A块预测其参照为前后两个I图像或P图像,63,基于块的运动补偿技术,基于块的运动补偿技术,就是在其参照帧中寻找符合一定条件,当前被预测块的最佳匹配块。找到匹配块后,有两种处理方法:一是在恢复被预测块时,用匹配块代替;二是对预测的误差采用ADCT技
25、术编码,在恢复被预测块时,用匹配块加上预测误差。,64,表2.8 宏块的预测方式,65,4.MPEG-1视频系统,图2.21 简化的视频编码框图,66,图2.22 基本的视频解码器框图,67,4.2.5 MPEG-2标准,MPEG-2(ISO/IEC 13818)标准制定于1994年。它利用网络提供的3100Mbps的数据传输率来支持具有更高分辨率图像的压缩和更高的图像质量。MPEG-2可支持交迭图像序列,支持可调节性编码,多种运动估计方式,提供一个较广的范围改变压缩比,以适应不同画面质量、存储容量和带宽的要求。它与MPEG-1兼容的基础上实现了低码率和多声道扩展:MPEG-2可以将一部120
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据压缩 编码 标准
链接地址:https://www.31ppt.com/p-4894985.html