图像压缩与编码.ppt

资源ID：5949595 资源大小：8.20MB 全文页数：93页
资源格式： PPT 下载积分：15金币

快捷下载

会员登录下载

三方登录下载：

下载资源需要15金币

邮箱/手机：
温馨提示：	用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）
支付方式：
验证码：	换一换

加入VIP免费专享

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

图像压缩与编码.ppt

本章重点：图像编码与压缩的基本概念、理论及其编码分类。常用的无损压缩方法。常用的有损压缩方法。,第8章图像编码与压缩,图像编码的必要性与可能性,图像编码的必要性数字图像的庞大数据对计算机的处理速度、存储容量都提出过高的要求。因此必须把数据量压缩。从传送图像的角度来看，则更要求数据量压缩。在信道带宽、通信链路容量一定的前提下，采用编码压缩技术，减少传输数据量，是提高通信速度的重要手段。,图像编码的可能性,组成图像的各像素之间，无论是在图像的行方向还是在列方向，都存在着一定的相关性。常见的静态图像数据冗余包括：空间冗余，结构冗余，知识冗余，视觉冗余，图像区域的相同性冗余，纹理的统计冗余。,图像编码分类,根据解压重建后的图像和原始图像之间是否具有误差，可以将图像编码与压缩方法分为无误差(亦称无失真、无损、信息保持)编码和有误差(有失真或有损)编码两大类。根据编码作用域划分，图像编码分为空间域编码和变换域编码两大类。若从具体编码技术来考虑，又可分为预测编码、变换编码、统计编码、轮廓编码、模型编码等。,8.1图像编码基础,概述数据压缩冗余相对冗余 R=1-(1/C)冗余种类编码冗余像素间冗余心理冗余,图像信息衡量表示一幅图像究竟要多少位？信息论理论：熵熵在数字图像中的含义,图像编码评价准则,在图像压缩编码中，解码图像与原始图像可能会有差异，因此，需要评价压缩后图像的质量。描述解码图像相对原始图像偏离程度的测度一般称为保真度(逼真度)准则。常用的准则可分为两大类：客观保真度准则和主观保真度准则。,（1）客观保真度准则,最常用的客观保真度准则是原图像和解码图像之间的均方根误差和均方根信噪比两种。均方根误差:,均方信噪比:,对上式求平方根，就得到均方根信噪比。,（4-2）,（4-3）,（2）主观保真度准则,具有相同客观保真度的不同图像，人的视觉可能产生不同的视觉效果。这是因为客观保真度是一种统计平均意义下的度量准则，对于图像中的细节无法反映出来。一种常用的方法是对一组(不少于20人)观察者显示图像，并将他们对该图像的评分取平均，用来评价一幅图像的主观质量。,例如可用-3，-2，-1，0，1，2，3来代表主观评价很差，较差，稍差，相同，稍好，较好，很好。,表8.1 电视图像质量评价尺度,图像编码模型,一个图像压缩系统包括两个不同的结构块：编码器和解码器。图像f（x，y）输入到编码器中，编码器可以根据输入数据生成一组符号。在通过信道进行传输之后，将经过编码的表达符号送入解码器，经过重构后，生成输出图像。,一个常用于图像压缩系统模型,(1)信源编码器和信源解码器,信源编码器的任务是减少或消除输入图像中的编码冗余、像素间冗余或心理视觉冗余。从原理来看主要分为三个阶段:第一阶段将输入数据转换为可以减少输入图像中像素间冗余的数据的集合。第二阶段设法去除原图像信号的相关性。第三阶段是找一种编码方式。信源解码器包含两部分：符号解码器和反向转换器。,(2)信道编码器和解码器,当信道带有噪声或易于出现错误时，信道编码器和解码器就在整个译码解码处理中扮演了重要的角色。信道编码器和解码器通过向信源编码数据中插入预制的冗余数据来减少信道噪声的影响最有用的种信道编码技术是由RwHamming提出的。这种技术是基于这样的思想，即向被编码数据中加入足够的位数以确保可用的码字间变化的位数最小。,图像编码与压缩标准,8.2基本编码方法霍夫曼编码,一个事件集合x1,x2,xn,处于一个基本概率空间，其相应概率为p1,p2,pn，且p1+p2+pn=1。每一个信息的信息量为:如定义在概率空间中每事件的概率不相等时的平均不肯定程度或平均信息量叫作熵H，则：,1.理论基础,（4-9）,（4-10）,Huffman编码是1952年由Huffman提出的一种编码方法。这种编码方法根据信源数据符号发生的概率进行编码。在信源数据中出现概率越大的符号，相应的码越短；出现概率越小的符号，其码长越长，从而达到用尽可能少的码符号表示源数据。它在变长编码方法中是最佳的。,2.Huffman编码,设信源A的信源空间为：其中，现用r个码符号的码符号集对信源A中的每个符号（i1，2，N)进行编码。具体编码的方法是:(1)把信源符号按其出现概率的大小顺序排列起来；(2)把最末两个具有最小概率的元素之概率加起来；(3)把该概率之和同其余概率由大到小排队，然后再把两个最小概率加起来，再重新排队；(4)重复(2)直到最后只剩下两个概率为止。,Huffman编码具体方法：,例:设有编码输入其频率分布分别为现求其最佳霍夫曼编码。解:Huffman编码过程下图所示：,符号概率 x1 0.4x2 0.3x3 0.1x4 0.1x5 0.06x6 0.04,1 0.40.30.10.10.1,20.40.30.20.1,30.40.30.3,40.60.4,本例中对0.6赋予0，对0.4赋予1，0.4传递到x1，所以x1的编码便是1。0.6传递到前一级是两个0.3相加，大值是单独一个元素x2的概率，小值是两个元素概率之和，每个概率都小于0.3，所以x2赋予0，0.2和0.1求和的0.3赋予1。所以x2的编码是00，而剩余元素编码的前两个码应为01。0.1赋予1，0.2赋予0。以此类推，最后得到诸元素的编码如下：,经霍夫曼编码后，平均码长为：=0.41+0.302+0.13+0.14+0.065+0.045=2.20(bit)该信源的熵为H2.14 bit，编码后计算的平均码长为2.2 bit,非常接近于熵。可见Huffman编码是种较好的编码。,注意:短码不作长码的起始部分。Huffman编码是最佳的，其平均码长相同，不影响编码效率和数据压缩性能。由于Huffman码的码长参差不齐，因此，存在一个输入、输出速率匹配问题。解决的办法是设置一定容量的缓冲存储器 Huffman码在存储或传输过程中，如果出现误码，可能会引起误码的连续传播 Huffman编码对不同信源其编码效率也不尽相同。Huffman编码应用时，均需要与其他编码结合起来使用，才能进一步提高数据压缩比。,Huffman编码实现,哥伦布编码（Golomb codes）,8.2.3 算术编码,理论上，用Huffman方法对源数据流进行编码可达到最佳编码效果。但由于计算机中存储、处理的最小单位是“位”，因此，在一些情况下，实际压缩比与理论压缩比的极限相去甚远。算术编码没有延用数据编码技术中用一个特定的代码代替一个输入符号的一般做法，它把要压缩处理的整段数据映射到一段实数半开区间0，1内的某一区段，构造出小于1且大于或等于0的数值。这个数值是输人数据流的唯可译代码。,对一个5符号信源Aa1,a2,a3,a3,a4，各字符出现的概率和设定的取值范围如下：字符概率范围a1 0.20.0，0.2）a2 0.20.2，0.4）a3 0.40.4，0.8)a4 0.20.8，1.0)“范围”给出了字符的赋值区间。这个区间是根据字符发生的概率划分的。具体把a1、a2、a3、a4分配在哪个区间范围，对编码本身没有影响，只要保证编码器和解码器对字符的概率区间有相同的定义即可。为讨论方便起见，假定有,式中Ns为新于区间的起始位置；Fs为前子区间的起始位置，当前符号的区间左端；Ne为新子区间的结束位置；Fe为前子区间的结束位置；当前符号的区间右端；L为前子区间的长度。按上述区间的定义，若数据流的第一个字符为a1，由字符概率取值区间的定义可知，代码的实际取值范围在0.2，0.4之间，即输入数据流的第一个字符决定了代码最高有效位取值的范围。继续对源数据流中的后续字符进行编码。每读入一个新的符号，输出数值范围就进一步缩小。读入第二个符号a2取值范围在区间的0.4，0.8内。由于第一个字符a1已将取值区间限制在0.2，0.4的范围中，因此a2的实际取值是在前符号范围0.2，0.4的0.4，0.8处，从而字符a2的编码取值范围在0.28，0.36，而不是在0，1整个概率分布区间上。,编码,1.LZ77 算法 LZ77 是Jacob Ziv 和Abraham Lempel 在1977 年发表的一篇论文中提出的。利用该算法进行数据压缩、解压缩的过程，就像一个窗口在原始数据中滑动过程，故也常称为基于滑动窗口的自适应的字典压缩方法。2 LZ78 算法 LZ78 是Jacob Ziv 和Abraham Lempel 在1978 年发表的另一篇论文中提出的。LZ78 算法不同于LZ77 算法，它放弃了窗口概念，采用树形结构构造字典和保存短语，从而确保文件中的内容均能反映到字典中。,3 LZW 算法 1984 年，Terry A.Welch 在LZ78 的基础上进行了改进，这就是著名的LZW 压缩算法。LZW压缩算法是一种基于字典算法的编码方法.他的基本思想是建立一个编码表(转换表)也称串表,将输入字符串映射成定长的码子输出,通常码长设为12bit.12 位可以有4 096个不同的12 位代码,这就是说,转换表有4 096个表项,其中256 个表项用来存放已定义的字符,剩下3 840个表项用来存放前缀,LZW编码算法的具体执行步骤如下:步骤1:开始时的词典包含所有可能的根(Root),而当前前缀P 是空的;步骤2:当前字符(C):=字符流中的下一个字符;步骤3:判断缀2符串P+C 是否在词典中(1)如果“是”:P:=P+CPP(用C 扩展P);(2)如果“否”把代表当前前缀P 的码字输出到码字流;把缀2符串P+C 添加到词典;令P:=CPP(现在的P 仅包含一个字符C);步骤4:判断码字流中是否还有码字要译(1)如果“是”,就返回到步骤2;(2)如果“否”把代表当前前缀P 的码字输出到码字流;结束.,例：下列子图像中 39 39 126 126 39 39 126 126 39 39 126 126 39 39 126 126用LZW编码。,游程编码,游程编码(RLC)是一种利用空间冗余度压缩图像的方法，属于统计编码类。设图像中的某一行或某一块像素经采样或经某种变换后的系数为：某一行或某一块内像素值可分为k段，长度为的连续串，每个串具有相同的值，那么，该图像的某一行或某一块可由下面偶对来表示：其中为每个串内的代表值，为串的长度。串长就是游程长度(Runlength)，简写为RL，即由灰度值构成的数据流中各灰度值重复出现而形成的长度。如果给出了灰度值、对应长度及位置，就能很容易地恢复出原来的数据流。,游程编码分为定长游程编码和变长游程编码两类。定长游程编码是指编码的游程所使用位数是固定的，即RL位数是固定的。如果灰度连续相同的个数超过了固定位数所能表示的最大值，则进入下一轮游程编码。变长游程编码是指对不同范围的游程使用不同位数的编码，即表示RL位数是不固定的。,例：BMP中的游程编码,一维CCITT压缩编码在一维CCITT第三组压缩方法中，图像的每一条线都可以用一系列变长编码码字编码，这些码字代表从左到右扫描线条过程中，白色和黑色交替的行程长度。码字本身分两类。如果行程长度小于63，则使用表8.14中修正的霍夫曼编码得到的一个终结编码。如果行程长度大于63，则根据表8.15得到最大可能出现的组成编码(不超过行程长度)，将它与一个终结编码一起使用进行编码，终结编码用于表示组成编码和实际行程长度之间的差异。这个标准要求每条线都从一个白色行程长度码字开始，事实上它们可能是00110101，这个编码表示一个零长度的白色行程。最后，惟一的行尾(EOL)码字000000000001用于结束每一行，同时标记每幅新图像的第一行。一个图像序列的结尾使用6个连续的EOL标记。,二维压缩为CCITT第三组和第四组标准所采用的二维压缩方法采用的是逐线方法，这种方法在每个黑色转白色或白色转黑色的扫描转换位置上均参考基准元素a0进行编码，基准元素a0被设定在当前的编码线上。前面提到的编码线称为基准线；对每幅新图像的第一条线设定的基准线是一条虚构的白色线条。,图8.44显示了对一条单扫描线的基本编码过程。注意，这个过程的初始步骤在于对几个关键的转换或变化元素的定位：a0,a1,a2，b1和b2。变化元素定义为在同一条直线上与前一个像素值不同的像素。最重要的变化元素是a0(基准元素)，这个元素被设定在虚构的白色变化元素的位置上，而这个虚构变化元素的位置在每条新编码线的第一个像素的左边，或者a0可以根据以前的编码模式确定。在a0的位置确定了之后，a1作为在当前编码线上a0右边的下一个变化元素的位置，a2作为在当前编码线上a1右边的下一个变化元素的位置，b1作为具有(a0的)相反值的变化元素，位于基准线(或前一条线)上a0的右边。b2作为下一个变化元素位于基准线上b1的右边。如果这些变化元素中的任何一个没有被检测到，则这些元素被设一定在适当线上最后一个像素右边的一个虚构像素位置上。图8.45给出了在不同变化元素之问一般关系的两种说明。,字符编码（Symbol-Based Coding）,基本原理：子图像编码（字符）每个字符存储其图像码和其在字典中的代码。而图像的数据以三维形式出现。如下图所示,JBIG2压缩,基本思想：将图像分割成三类子区域(1)文字区域(2)半色调图像区域(3)普通区域,位平面编码 Bit-plane coding,思想：将图像分成一系列的二值图像，然后用上述二值图像的压缩等好方法压缩。,子图像块的变换编码（Block Transform Coding）,思想：先将图像分割成子图像，然后进行线性变换，再进行量化和编码。,变换选择,（1）傅里叶变换,（2）walsh-Hadamard transform(WHT),离散余弦变换（Discrete cosine transform）,例：三种变换比较,JPEG图像编码压缩标准,JPEG(Joint Photographic Expert Group，简称JPEG)是联合图像专家小组的英文缩写。其中“联合”的含意是指，国际电报电话咨询委员会CCIITI和国际标淮化协会(ISO)联合组成的一个图像专家小组。JPEG算法被确定为JPEG国际标准，它是国际上彩色、灰度、静止图像的第一个国际标准。JPEG标准适于静图像的压缩，电视图像序列的帧内图像的压缩编码也常采用JPEG压缩标准。,(1)JPEG的工作模式,JPEG对每一个图像分量单独编码。JPEG对每个不同的图像分量可以采用不同的量化参数和熵编码的码表对于一个图像分量，JPEG提供4种工作模式。顺序编码：每一个图像分量按从左到右，从上到下扫描，一次扫描完成编码。累进编码：图像编码在多次扫描中完成。无失真编码：解码后能精确地恢复源图像采样值，其压缩比低于有失真压缩编码方法。分层编码：图像在多个空间分辨率进行编码。,(2)基本工作模式,基于DCT JPEG编码的过程框图,解码过程框图,JPEG采用的是88大小的子块的二维离散余弦变换(DCT)。在编码器的输入端，把原始图像顺序地分割成一系列88的子块，设原始图像的采样精度为P位，是无符号整数，输入时把0，2P范围的无符号整数变成-2P-1，2P-1-1范围的有符号整数，以此作为离散余弦正变换的输入。在解码器的输出端经离散余弦逆变换(IDCT)后，得到一系列8 8的图像数据块，需将其数值范围由-2P-1，2P-1-1再变回到0，2P范围内的无符号整数，来获得重构图像。,为了达到压缩数据的目的，对DCT系数需作量化处理。量化处理是一个多到一的映射，它是造成DCT编解码信息损失的根源。在JPEG中采用线性均匀量化器，量化定义为对64个DCT系数除以量化步长，四舍五入取整。量化的作用是在一定的主观保真度图像质量前提下，丢掉那些对视觉效果影响不大的信息。,例:给定Lena图像的一个平坦区域（88子块）如下：,给出DCT变换系数量化过程。,如下是它的DCT变换系数，可以看到能量集中在少数低频系数:660.1250 47.0496 25.9980 10.3993 7.8750 8.4866 5.6025 1.317617.3267 2.6749 5.2236 1.3234 0.5222 0.2914 0.2800 2.2810.0280 0.6463 0.9545 0.9620 2.4730 1.9783 0.316 2.17412.3003 0.4542 2.2403 3.5559 1.2907 1.0024 0.1580 0.97472.3750 0.1038 3.2220 0.9653 1.3750 2.2258 0.3875 3.52360.9294 1.3282 2.4256 0.9828 1.9317 0.6972 0.1253 1.8560.3943 2.6640 0.5669 3.4168 0.8891 1.6182 2.545 1.7322.1666 1.7238 0.3335 0.4808 2.6253 0.9699 1.4854 1.183,用JPEG的亮度量化矩阵式对每个系数进行均匀量化，量化器输出为：41 4 3 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0,反量化后，进行DCT反变换，得到的解码图像为：80 75 71 72 78 85 89 9080 75 71 72 78 85 89 9080 76 72 73 79 86 90 9181 77 72 74 80 87 91 9282 77 73 74 81 87 91 9383 78 74 75 81 88 92 9383 79 75 76 82 89 93 9484 79 75 76 82 89 93 94,88子块的64个变换系数经量化后，按直流系数DC和交流系数AC分成两类处理。坐标u=v=0的直流系数DC实质上就是空域图像中64个像素的平均值。相邻的88子块之间的DC系数有强的相关性，JPEG对DC系数采用DPCM编码，即对相邻块之间的DC系数的差值DIFFDCi-DCi-1编码。,其余63个系数称为交流系数（AC系数）采用行程编码。由于低频分量多呈圆环形辐射状向高频率衰减，因此可看成按Z字形衰减，如下图所示。因此，AC系数按Z字形扫描读数。,对这63个AC系数采用非常简单和直观的行程编码，行程编码采用两个字节表示。JPEG使用1字节的高4位表示连续“0”的个数，而使用它的低四位来表示下一个非“0”系数所需要的位数，跟在它后面的是量化AC系数的数值。AC系数的行程编码如下图所示：,下一个非零值的实际值,为了进一步达到压缩数据的目的，可以对DPCM编码后的DC码和RLE编码后的AC码的码字再作熵编码。JPEG建议使用两种熵编码方法：哈夫曼(Huffman)编码和自适二进制算术编码。熵编码可分成两步进行，首先把DPCM编码后的DC码DC系数和行程编码的AC系数转换成中间符号序列,然后给这些符号赋以变长码字。,例 JPEG标准编码和解码考虑下列88子图像，使用JPEG基本标准进行压缩和重构：52 55 61 66 70 61 64 7363 59 66 90 109 85 69 7262 59 68 113 144 104 66 7363 58 71 122 154 106 70 6967 61 68 104 126 88 68 70 79 65 60 70 77 68 58 75 85 71 64 59 55 61 65 83 87 79 69 68 65 76 78 94,原图像包含256个可能的灰度级，因此，编码过程从对原子图像的像素层次移动-128或128个灰度级开始。得到的移住阵列为：-76-73-67-62-58-67-64-55-65-69-62-38-19-43-59-56-66-69-60-15 16-24-62-55-65-70-57-6 26-22-58-59-61-67-60-24-2-40-60-58-49-63-68-58-51-65-70-53-43-57-64-69-73-67-63-45-41-49-59-60-63-52-50-34,对N=8，正向DCT，变换的阵列为：-415-29-62 25 55-20-l 3 7-21-62 9 11-7-6 6-46 8 77-25-30 10 7-5-50 13 35-15-9 6 0 311-8-13-2-1 1-4 1-10 1 3-3-1 0 2-1-4-l 2-l 2-3 1 2-1-1-1-2-1-l 0-1,如果用JPEG推荐的标准化阵列对变换阵列进行量化，则进行按比例舍入后的系数是：-26-3 6 2 2 0 0 0 1-2-4 0 0 0 0 0-3 1 5-l-10 0 0-4 1 2-10 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0,变换和标准化处理过程产生了大量的零值系数。按z形模式对这些系数进行重新排列的时候，得到的一维系数序列是：-26-3 1-3-2-6 2-4 1 4 1 1 5 0 2 0 0-1 2 0 0 0 0 0 1-1 EOB这里，EOB字符代表块结尾标志。使用的专用EOB霍夫曼码字(1010)表明在重新排列的序列中系数余项均为0。DC系数编码（DPCM）设前一个DC系数是-17，得到的DPCM差为-26-(-17)或-9 查找JPEG系数编码分类表,对一个类4的差的合理基础编码是101(一个3比特编码)，而经过完整编码的类4系数的总长度应有7比特。余下的4比特应该根据差值的最低有效位(ISB)生成。对一个一般的DC差异类(如，类K)，需要额外的K比特，并将正差或负差的K个LSB进行减1运算。对差为-9的值，合理的LSB为(0111)-1或0110，且完整的DPCM编码的DC码字是1010110。重排阵列的非零AC系数根据JPEG系数编码分类表和JPEG默认AC编码表可以进行类似的编码。主要差别在于每个默认的AC霍夫曼码字依赖于前述对非零系数编码后的零值系数的数目，以及非零系数的量级分类,第一个重排阵列的非零AC系数(-3)的编码为0100。第二个系数（1）的编码为001；第三个系数（-3）的编码为0100。.第17个AC系数（-1）编码为 110110继续使用这种方法，完整的编码(重排列)阵列为：1010110 0100 001 0100 0101 100001 0110 100011 001 100011 001 001 100101 11100110 10110 0110 11110100 000 1010,

注意事项

本文（图像压缩与编码.ppt）为本站会员（牧羊曲112）主动上传，三一办公仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三一办公（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。