图像压缩编码的分类课件.ppt
10.1 图像压缩编码基础10.2 图像的熵编码 10.3 图像的变换压缩编码 10.4 图像的量化压缩编码 10.5 图像的预测编码10.6 混合压缩编码,学习目标,了解图像压缩编码的基本理论掌握熵编码的基本理论和方法掌握图像的变换压缩编码方法掌握图像的量化压缩编码方法掌握图像的预测编码编码方法了解图像的混合压缩编码方法,图像编码的研究背景 通信方式改变带来的需求,信息传输方式发生了很大的改变通信方式的改变文字+语音图像+文字+语音通信对象的改变人与人人与机器,机器与机器,图像编码的研究背景 通信方式改变带来的需求,由于通信方式和通信对象的改变带来的最大问题是: 传输带宽、速度、存储器容量的限制。给我们带来了一个难题,也给了我们一个机会: 如何用软件的手段来解决硬件上的物理极限。,数码图像的普及,导致了数据量的庞大。图像的传输与存储,必须解决图像数据的压缩问题。,图像编码的研究背景 海量数据带来的需求,实时传输: 在10M带宽网上实时传输的话,需要压缩到原来数据量的0.045, 即1.08 bit/pixel。存储: (按1张光盘可存640M计算) 如果不进行压缩,1张CD则仅可以存放2.89秒的数据。存2小时的信息则需要压缩到原来数据量的0.0004,即:0.003bit/pixel。,彩色视频数据量分析,如果只传送2值图像,以200dpi的分辨率传输,一张A4稿纸的数据量为: 1654*2337*1=3888768bit =3900K按目前14.4K的电话线传输速率,需要传送的时间是:270秒(4.5分),传真数据量分析,图像通信系统模型,10.1 图像压缩编码基础,10.1.1 图像压缩编码的必要性 随着信息技术的发展,图像信息已经成为通信和计算机系统中一种重要的处理对象。图像的最大特点也是最大难点就是海量数据的表示与传输,如果不对数据进行压缩处理,数量巨大的数据就很难在计算机系统及网络上存储、处理和传输,所以必须对图像进行压缩编码。图像编码与压缩从本质上来说就是对要处理的图像源数据按一定的规则进行变换和组合,从而达到以尽可能少的代码(或符号)来表示尽可能多的数据信息。,10.1.2 图像压缩编码的可能性 我们知道,之所以可以进行压缩编码,是因为原始的数据包含一定的冗余。在图像的数据文件中包含有大量的冗余信息,换句话说,在实际获取的原始数据中,包含有多余信息。这些冗余来自于数据之间的相关性,或者来自于人的视觉特性,这就为压缩数据提供了可能。 数据压缩的理论基础是信息论。从信息论的角度看,压缩就是去除信息中的冗余,减少承载信息的数据量,用一种更接近信息本质的描述来代替原有冗余的描述。,1.冗余的概念 我们从一个互动游戏来体会数据冗余的概念。在下面的例子中,用一种最好的方式来发送一封电报。你的妻子,Helen,将于明天晚上6点零5分在上海的虹桥机场接你。 (23*2+10=56个半角字符)你的妻子将于明天晚上6点零5分在虹桥机场接你 (20*2+2=42个半角字符) Helen将于明晚6点在虹桥接你 (10*2+6=26个半角字符),结论:只要接收端不会产生误解,就可以减少承载信息的数据量。,描述方式: 1)这是一幅2*2的图像,图像的第一个像素是红的,第二个像素是红的,第三个像素是红的,第四个像素是红的。 2)这是一幅2*2的图像,整幅图都是红色的。,由此我们知道,整理图像的描述方法可以达到压缩的目的。,2.图像中的冗余,图像冗余无损压缩的原理,从原来的16*3*8=384bits压缩为:(1+3)*8=32bits,压缩比为:12:1,图像冗余有损压缩的原理,实际图像中冗余信息的表现(灰度图),图像的视觉冗余 (彩色),(248,27,4),(251,32,15),(248,27,4),(248,27,4),一般来说,图像数据中存在着以下几种冗余: (1)编码冗余 如果一个图像的灰度级编码,使用了多于实际需要的编码符号,就称该图像包含了编码冗余。例如,在以BMP位图形式存储一幅数字图像时,该数据文件形式主要考虑的是结构形式统一。如果存储一幅灰度图像,首先调色板部分就是冗余的。另外,如果某一幅图像只有小于8bit(256灰度级)的量化级别,如只有3bit(8灰度级)灰阶,但是仍旧采用标准8bit存储一个像素,就有了编码冗余。编码冗余通常是为了以某个标准格式(例如,固定大小的最大灰度级定义)进行图像描述时产生的。,(2)像素冗余 图像信号相比于其他信号有一个非常明显的特点,就是像素之间存在非常大的相关性。由于存在相关性,因此任何给定的像素值,原理上都可以通过它的邻接像素预测得到。换句话说,单个像素所携带的信息相对是小的。这样,对一幅图像,如果描述每个像素的数据量是相等的,并且是相互独立的。则由于像素相关性是的该数据对视觉的贡献一定存在一定的冗余,称这种像素之间的内在相关性所导致的冗余为像素冗余。,像素的相关性示例,上图是一幅灰度图像,将原图中的一个局部子块的数据取出显示,该子块的灰度值十分接近,分布在100左右,而且还存在有许多相等的值,如96,这表明在图像中像素之间的相关性很强。 若采用灰度图的描述方式,这个子块所需要的数据量为258=200bit,若将这个子块以最小的数据,以及与之偏差的数据流形式来描述为:103及25个偏差7,7,4,1,2,0,2,4,4,7,0,1,5,7,7,1,4,6,7,7,4,4,4,5,5。显然,这25个偏差值的大小范围为07,可以以一个较小的灰度级(如3bit,8灰度级)来描述,则数据量为8+253=83bit,是原始数据量的41.5%。由此便可以看到像素冗余的特点。,(3)视觉心理冗余 最终观测图像的对象是人,而人的视觉寻在一定的主观心理冗余。例如比较明显的是,人的视觉对颜色的感知就存在着冗余,“异谱同色”就是指数据取值不同的颜色,在视觉上被认为是相同的颜色的现象。另外,当人在观察一幅图像时,一些信息在一般视觉处理中比其他信息的相对重要程度要小,因此这部分信息往往被忽视。将这种对视觉感知影响很小的信息称为视觉心理冗余。产生这种冗余的原因在于人眼视觉系统的非均匀性。,(a)256灰度级 (b)64灰度级,视觉心理冗余示例,由于一幅图像存在一定的数据冗余(即编码冗余和像素冗余)和主观视觉冗余,所以图像的压缩编码可以从以下两个方面来展开。 因为有数据冗余是由于描述图像的方式所导致的,所以若改变图像信息的描述方式,就可以压缩数据冗余。基于数据统计特征的传统的信源编码方式,如行程编码、预测编码、变换编码等,都是针对这类数据冗余所提出的有效压缩方法。,因图像中存在主观视觉心理冗余,编码时忽略一些视觉感知不太明显的微小差异,可进行所谓的“有损”压缩。20世纪80年代后,所提出的突破信源编码理论的压缩方法,如结合分形、模型基、神经网络、小波变换等数学工具,充分利用视觉系统生理心理特性和图像信源的各种特性进行编码的方法,包括子带编码、分层编码、分型编码、模型编码等,就是考虑了这类冗余而提出的图像压缩编码方法。,根据解压重建后的图像与原始图像之间是否具有误差,图像压缩编码分为无损编码和有损编码两大类。 无损编码:这类压缩算法中删除的仅仅是图像数据中冗余的信息,因此在解压缩时能精确地恢复原图像。无损编码用于要求重建后图像严格地与原始图像保持相同的场合,例如复制、保存十分珍贵的历史和文物图像等。 有损编码:这类算法把不相干的信息也删除了,因此在解压缩时只能对原始图像进行近似地重建,而不能精确地复原,有损编码适合大多数用于存储数字化的模拟数据。,10.1.3 图像压缩编码的分类,根据编码原理,图像压缩编码分为熵编码、预测编码、变换编码和混合编码等。 熵编码:这是纯粹基于信号统计特性的编码技术,是一种编码。熵编码的基本原理是给出现概率较大的符号赋予一个短码字,而给出现概率较小的符号赋予一个长码字,从而使得最终的平均码长很小。常见的熵编码方法有行程编码、哈夫曼编码和算术编码。 预测编码:它是基于图像数据的空间或时间冗余特性,用相邻的已知像素(或像素块)来预测当前像素(或像素块)的取值,然后再对预测误差进行量化和编码。预测编码可以分为帧内预测和帧间预测,常用的预测编码方法有差分脉码调制(DPCM)和运动补偿。,变换编码:通常将空间域上的图像经过正交变换映射到另一个变换域上,使变换后的系数之间的相关性降低。图像变换本身并不能压缩数据,但变换后图像的大部分能量只集中到少数几个变换系数上,再采用适当的量化和熵编码就可以有效地压缩图像了。 混合编码:是指综合了熵编码、变换编码和预测编码的编码方法,例如常用的几种国际编码标准,JPEG标准、MPEG标准、H.263标准以及H.264标准,都是采用了多种编码技术的混合编码方式。,1.压缩比 压缩比是衡量数据压缩程度的指标之一。至今尚无压缩比的统一定义。目前常用的压缩比Pr定义为: 式中:Ls为源代码长度;Ld为压缩后的代码长度。 压缩比的物理意义是被压缩掉的数据占源数据的百分比。一般来说,压缩比越大,说明被压缩掉的数据量越多。当压缩比接近100%时,压缩效率最理想。,10.1.4 图像压缩效率的评估,2.保真度 在图像压缩编码中,解码图像与原始图像可能会存在差异,因此,需要评价压缩后图像的质量。描述解码图像相对原始图像偏离程度的测度一般称为保真度(逼真度)准则。 最常用的客观保真度准则是原图像与解码图像之间的均方根误差和均方根信噪比两种。令f(x,y)表示原图像, 表示f(x,y)先压缩又解压缩后得到的f(x,y)的近似。对任意x和y, f(x,y)和 之间的误差定义为:,若f(x,y)和 大小均为 ,则它们之间的均方根误差erms为: 如果将 看做原始图像f(x,y)和噪声信号e(x,y)的和,则解压缩图像的均方根信噪比为SNRms: 对上式求平方根,则得到均方根信噪比SNRms 。,10.2.1 行程编码(RLE)行程编码是一种最简单的,在某些场合是非常有效的一种无损压缩编码方法。虽然这种编码方式的应用范围非常有限,但是因为这种方法中所体现出的编码设计思想非常明确,所以在图像编码方法中都会将其作为一种典型的方法来介绍。,10.2 图像的熵编码,通过改变图像的描述方式,来实现图像的压缩。将一行中灰度值相同的相邻像素,用一个计数值和该灰度值来代替。,行程编码 基本原理,举例说明: aaaa bbb cc d eeeee fffffff 4 3 2 1 5 7 (共22*8=176 bits) 4a3b2c1d5e7f (共12*8=96 bits) 压缩比为:176:96=1.83:1,行程编码 实现方法,行程编码 传真中的应用方法,传真件中一般都是白色比较多,而黑色相对比较少。所以可能常常会出现如下的情况: 500W 3b 470w 12b 4w 3b 3000w 上面的行程编码所需用的字节数为: 因为:204830004096 所以:计数值必须用12 bit来表示,对于: 500W 3b 470w 12b 4w 3b 3000w 编码为: 500, 3, 570, 12, 4, 3, 3000 编码位数为:12, 12, 12, 12, 12,12,12需要的数据量为: 12*7=84 bit 压缩比为: 168:84=2:1,因为只有白或黑,而且排版中一定要留出页边距,因此,一般情况下,可以只传输计数值即可。,现在,根据传真件的特点,对其进行改进。既然已经可以预知白色多黑色少,所以可对白色和黑色的计数值采用不同的位数。以这个例子,可以定义: 白色:12 bit,黑色:4 bit,编码为: 500,3,470,12,4,3,3000 编码位数为: 12, 4, 12, 4,12,4, 12所需字节数为:4*12+3*4=60bit压缩比为: 168:60=2.8:1,比原来的RLE方式168bit减少到了60bit,相当于又提高了压缩比为 168/60=2.8:1 。,二维行程编码 基本概念,二维行程编码要解决的核心问题是: 将二维排列的像素,采用某种方式转化成一维排列的方式。之后按照一维行程编码方式进行编码。,二维行程编码的排列方式,(a)排序方式1 (b)排序方式2,二维行程编码示例,例:,数据量:64*8=512(bit),如果按照行扫描的顺序排列的话,数据分布为:,130,130,130,129,134,133,129,13130,130,130,129,134,133,130,130;130,130,130,129,132,132,130,130;129,130,130,129,130,130,129,129;127,128,127,129,131,129,131,130;127,128,127,128,127,128,132,132;125,126,129,129,127,129,133,132;127,125,128,128,126,130,131,131,一维行程编码后为:,(3,130),(1,129),(1,134),(1,133),(1,129),(4,130),(1,129),(1,134),(1,133),(5,130),(1,129),(2,132),(2,130),(1,129),(2,130),(1,129),(2,130),(2,129),(1,127),(1,128),(1,127),(1,129),(1,131),(1,129),(1,131),(1,130),(1,127),(1,128),(1,127),(1,128),(1,127),(1,128),(2,132),(1,125),(1,126),(2,129),(1,127),(1,129),(1,133),(1,132),(1,127),(1,125),(2,128),(1,126),(1,130),(2,131),数据量为:46*(3+8)=506(bit)压缩比为:512:506=1.01:1,如果按照列扫描的顺序排列的话,数据分布为:,130,130,130,129,127,127,125,127;130,130,130,130,128,128,126,125;130,130,130,130,127,127,129,128;129,129,129,129,129,128,129,128;134,134,132,130,131,127,127,126;133,133,132,130,129,128,129,130; 129,130,130,129,131,132,133,131;130,130,130,129,130,132,132,131,一维行程编码为:,数据量为:42*(3+8)=462(bit) 压缩比为:512:462=1.11:1,(3,130),(1,129),(2,127),(1,125),(1,127),(4,130),(2,128),(1,126),(1,125),(4,130),(2,127),(1,129),(1,128),(5,129),(1,128),(1,129),(1,128),(2,134),(1,132),(1,130),(1,131),(2,127),(1,126),(2,133),(1,132),(1,130),(1,129),(1,128),(1,129),(1,130), (1,129),(2,130),(1,129),(1,131),(1,132),(1,133),(1,131),(3,130),(1,129),(1,130),(2,132),(1,131),如果按照方式(a)扫描的顺序排列的话,数据分布为:,130,130,130,130,130,130,130,130;130;129,129,129,129,130,130,129;127,128,127,129,131,130,132,134;134;133,133,132,130,129,128,127;128,127,128,127,125,126,129,129;127,129,133,132,131,129,130,130;129,130,130,130,129,130,132,132;131,131,130,126,128,128,125,127,数据量为:44*(3+8)=484(bit) 压缩比为:512:484=1.06:1,一维行程编码为:,(7,130),(2,130),(4,129),(2,130),(1,129),(1,127),(1,128),(1,127),(1,129),(1,131),(1,130),(1,132),(2,134),(2,133),(1,132),(1,130),(1,129),(1,128),(1,127),(1,128),(1,127),(1,128),(1,127),(1,125),(1,126),(2,129),(1,127),(1,129),(1,133),(1,132),(1,131),(1,129),(2,130),(1,129),(3,130),(1,129),(1,130),(2,132),(2,131),(1,130),(1,126),(2,128),(1,125),(1,127),10.2.2 哈夫曼(Huffman)编码行程编码要获得好的压缩率的前提是有比较长的相邻像素的值是相同的。熵是指数据中承载的信息量。所谓的熵编码是指在完全不损失信息量前提下最小数据量的编码。,Huffman编码 基本原理,为了达到大的压缩率,提出了一种方法就是将在图像中出现频度大的像素值,给一个比较短的编码,将出现频度小的像数值,给一个比较长的编码。,例: aaaa bbb cc d eeeee fffffff 4 3 2 1 5 7如果不进行特殊的编码,按照图像像素的描述,需要的数据量为: 22*8=176 bits,aaaa bbb cc d eeeee fffffff 4 3 2 1 5 7按照熵编码的原理进行编码: f=0 e=10 a=110 b=1111 c=11100 d=11101这里的编码规则是长短不一的异字头码,由:f=0 e=10 a=110 b=1111 c=11100 d=11101 aaaa bbb cc d eeeee fffffff 11011011011011111111111111100111001110110101010100000000 数据量:7*1+5*2+4*3+3*4+2*5+1*5=56 bit,压缩比为:176:56=3.14:1,首先求出图像中灰度分布的灰度直方图;根据该直方图,对其按照分布概率从小到大的顺序进行排列;每一次从中选择出两个概率为最小的节点相加,形成一个新的节点,构造一个称为“Huffman树”的二叉树;对这个二叉树进行编码,就获得了Huffman编码码字。,Huffman编码 算法,Huffman编码示例,例:对数据序列 aaaa bbb cc d eeeee fffffff 其概率分布为: a:4/22 b:3/22 c:2/22 d:1/22 e:5/22 f:7/22 概率大小的排序为: d, c, b, a, e, f 1/22 2/22 3/22 4/22 5/22 7/22,c,b,a,f,e,7/22,5/22,4/22,2/22,1,0,f=11 e=01 a=00 b=101 c=1001 d=1000,d,1/22,3/22,6/22,22/22,13/22,9/22,3/22,1,0,1,0,1,0,1,0,对这个例子,计算出经过Huffman编码后的数据为: 10101010001001001000100010000111111111101010101010101 共 7*2+5*2+4*2+3*3+2*4+1*4=53 bit,压缩比为176:53=3.32:1,Huffman编码 压缩效率,我们知道,对一幅图像进行编码时,如果图像的大小大于256时,这幅图像的不同的码字就有可能是很大,例如极限为256个不同的码字。 这时如果采用全局Huffman编码则压缩效率不高。甚至有可能与原来的等长编码的数据量相同。,Huffman编码 图像压缩中的应用,常用的且有效的方法是: 将图像分割成若干的小块,对每块进行独立的Huffman编码。例如:分成 的子块,就可以大大降低不同灰度值的个数(最多是64而不是256)。,8*8分块的编码压缩比为2.12:1,16*16分块的编码压缩比为1.64:1,全图的编码压缩比为1.09:1,10.2.3 算术编码 算术编码是20世纪80年代发展起来的一种熵编码方法,这种方法不是将单个信源符号映射成一个码字,而是把整个信源表示为实数线上的0-1之间的一个区间,其长度等于该序列的概率;再在该区间内选择一个代表性的小数,将其转化为二进制作为世纪的编码输出。信息序列中的每个元素都要缩短为一个区间,信息序列中元素越多,所得到的区间就越小。当区间变小时,就需要更多的数位来表示这个区间。采用算术编码,每个符号的平均编码长度可以为小数。,算术编码有两种模式:一种是基于信源概率统计特性的固定编码模式;另一种是针对未知信源概率模型的自适应模式。自适应模式中各个符号的概率初始值都相同,它们依据出现的符号而相应地改变。只要编码器和解码器都是用相同的初始值和相同的改变值的方法,那么它们的概率模型将保持一致。上述两种形式的算术编码均可用硬件实现,其中自适应模式适用于不进行概率统计的场合。有关实验数据表明,在未知信源概率分布的情况下,算术编码一般要优于哈夫曼编码。,10.3 图像的变换压缩编码,行程编码与Huffman编码的设计思想都是基于对信息表述方法的改变,属于无损压缩方式。虽然无损压缩可以保证接收方获得的信息与发送方相同,但是其压缩率一定有极限。因此,采用忽略视觉不敏感的部分进行有损压缩是提高压缩率的一条好的途径。,变换编码 就是将原来空间域上描述的图像信号,通过一种数学变换,变换到变换域中进行描述,达到改变能量分布的目的。 将图像能量在空间域的分散分布变为在变换域的能量的相对集中分布,达到去除相关的目的,再经过适当的方式量化编码,进一步压缩图像。,变换编码 设计思想,信息论研究表明,正交变换不改变信源的熵值,变换前后图像的信息量并无损失,完全可以通过反变换得到原来的图像值。 但统计分析表明,图像经过正交 变换后,把原来分散在原空间的图像数据在新的坐标空间中得到集中,对于大多数图像,大量的变换系数很小,只要删除接近于0的系数,并且对较小的系数进行粗量化,而保留包含图像主要信息的系数,以此进行压缩编码。,正交变换,逆变换,原图像,除以量化系数,取整,1)编码过程:,2)解码过程:,压缩图像,乘以量化系数,取整,压缩图像,解压图像,变换编码 方法,理论上,K-L变换是最有的正交变换,它能完全消除子图像块内像素间的线性相关性。但K-L变换的基对不同图像是不同的,这种不确定性使其应用不方便。 DCT变换的性能仅次于K-L变换,所以被认为是一种准最佳变换。而且DCT变换矩阵与图像内容无关,也有快速算法,所以二维DCT在图像编码中常常被使用。 沃尔什变换与DCT变换相比,算法简单,速度快,适用于高速实时系统以及硬件实现,但性能比DCT差一些。,变换编码 变换的选择,在实用中变换编码并不是对整幅图像进行变换和编码,而是将图像分成若干个nn的子图像后分别处理,原因有: 小图像的变换计算容易; 距离较远的像素之间的相关性比距离较近的像素之间的相关性小。,变换编码 子图像尺寸的选择,实践证明,子图像取44,88,1616适合图像的压缩,这是因为: 如果子图像尺寸取得太小,虽然计算速度快,实现简单,但压缩能力有限; 如果子图像尺寸取得太大,虽然去相关效果好,但由于图像本身的相关性很小,反而使其压缩效果不明显,而且增加了计算的复杂度。,对图像经过变换后,保留变换后的哪些系数用作编码和传输将直接影响信号恢复的质量,变换系数的选择原则是保留能量集中的、方差大的系数。 系数选择通常有: 变换区域编码; 变换阈值编码,变换编码 变换系数的选择,对设定形状的区域内的变换系数进行量化编码就,区域外的系数被舍去; 变换后的系数较大的会集中在区域的左上部,即低频分量都集中在此部分,保留的也是这一部分。其他部分的系数被舍去,在恢复信号时再对它们补0; 由于保留了大部分图像信号能量,恢复信号后,其质量不会产生显著变化; 变换区域编码的明显缺陷,是高频分量的完全丢失。,变换区域编码,变换阈值编码是根据实际情况设定某一大小幅度的阈值,若变换系数超过该阈值,则保留这些系数进行编码传输,其余的补0; 多数低频成分被编码输出,少数超过阈值的高频成分也将被保留进行编码输出; 需要解决两个问题: 需要增加“地址”编码比特数,码率较高; “阈值”需要通过实验来确定,复杂度较高。,变换阈值编码,DCT变换,cr=0.5;initialimage=imread(baboon512x512.bmp);imshow(initialimage);initialimage=double(initialimage);t=dctmtx(8);dctcoe=blkproc(initialimage,8,8,P1*x*P2,t,t);coevar=im2col(dctcoe,8,8,distinct);coe=coevar;y,ind=sort(coevar);m,n=size(coevar);sum=64-64*cr;for i=1:n coe(ind(1:sum),i)=0;endb2=col2im(coe,8,8,512,512,distinct);i2=blkproc(b2,8,8,P1*x*P2,t,t);i2=uint8(i2);figureimshow(i2),变换压缩编码实例,原图,DCT压缩后,Huffman:42bits; 压缩比为3.05:1,Huffman:16bits;压缩比为:8:1,例:,原图像为:,除以量化系数,取整,DCT变换编码实例,原图,解压图,图像的量化方法有两种:标量量化和矢量量化。矢量量化与标量量化思路的不同点是,标量量化充分利用了像素的视觉冗余,将视觉上不敏感的灰度级进行归并,矢量量化则是利用了图像相邻像素的相关性来实现的。因为描述图像的数据来源于每个像素,如果描述像素的数据量减少,则可以使描述图像的数据量减少。这样,可以通过对图像量化间隔取大,进行重新量化后,就可以获得减少描述像素的数据量。这就是图像标量量化的基本设计思路。标量量化的方法有很多,本节主要介绍一种基于直方图均衡化的非均匀量化方法。,10.4 图像的量化压缩编码,下面,给出基于直方图均衡化的非均匀量化算法。 统计原图像的灰度分布,设为 (假设原图为8bit的数字图像)。其中,hi为灰度级i在图像中的发生概率。 计算原图像的累计概率,设为 显然 。令 。 设压缩图像的灰度级定为m(m256),则压缩图像的灰度分布范围为0,m-1,计算在此灰度分布范围下的线性映射: ,其中,int( )表示取整函数。,因为hg的下标排序,恰好对应着原图的灰度取值, hg的值对应着压缩图的取值,因此,根据hg的下标与取值的对应关系,即可得到压缩图像的灰度取值。设原图像为 f=fi,j,压缩图像为g=gi,j ,令fi,j =k,则gi,j = hg (k)。,设原图像为 是一个8灰度级(3bit)的图像,其灰度分布概率为,基于灰度直方图的非均匀量化压缩方法示例,累计分布为 设压缩图像为4灰度级(2bit)的图像,则 根据hg建立了原图像的灰度值与压缩图像灰度值的映射关系,即当hg建立了原图像的灰度值与压缩图像灰度值的映射关系,即当fij=0时,gij=0;当fij=1,2时, gij=1 ;当fij=3,4时, gij=2 ;当时fij=5,6,7, gij=3。,因此,压缩图像为 最后,将其进行标准化(取值范围与原图相同)为,一般情况下,图像数据经过DCT变换后的系数矩阵的数字为小数,为了进行后面的编码,还需要对F进行量化处理,使系数量化为整数后进行后续的编码。量化间隔的大小决定了量化的精度,在JPGE中提供了两组量化系数矩阵,当然,读者也可根据实际的需要进行相应的设计。,JPEG推荐的两个量化矩阵分别为亮度分量的量化矩阵FY,和颜色(色差)分量的量化矩阵FC。具体矩阵值如下: 将经过DCT变换之后的系数阵中的所有元素,除以量化矩阵中相应位置上的量化值后取整,然后对其结果进行后续的编码。,一个88图像矩阵为f,对其进行DCT变换后得到系数矩阵F.,例题,将其用 进行量化,即将F的每个元素与相应位置上的值相除,得,最后对其进行取整运算得到的结果为 之后就可以对其进行后续的编码,如行程编码等,从而达到压缩的目的。,预测编码是建立在信号(语音,图像等)数据的相关性基础之上的,根据某一模型利用以往的样本值对新样本进行预测,减少数据在时间和空间上的相关性,已达到压缩数据额目的。预测方法有多种,其中差分脉冲编码调制(DPCM)是一种具有代表性的编码方法。下面来介绍DPCM编码的基本原理。 根据图像的统计特性可知,相邻像素之间具有较强的相关性,即相邻像素的灰度值相同或者相近,因此,某像素的值可根据以前已知的几个像素值来估计,猜测。正是由于像素间的相关性,才使预测称为可能。,10.5 图像的预测编码,预测编码的基本思想是通过提取每个像素中的新信息,并对它们编码来消除像素间的荣誉,这里的一个像素的新信息定义为该像素的当前或现实值与预测值的差,利用这种具有预测性的差值,再对其进行量化、编码、传输,其效果更佳,这一方法称为DPCM。预测编码通常不直接对信号编码,而是对预测误差编码。,DPCM系统原理框图,设xN在tN时刻输入信号的亮度采样值; 根据tN时刻以前已知的像素亮度采样值x1,x2,x3,xN-1对xN所做的预测值; eN表示差值信号,也称为误差信号,其值为: qN表示量化器的量化误差,eN表示量化器输出信号,则有:,由此可见,在DPCM系统中,误差的来源是发送端的量化器,而与接收端无关。 如果去掉量化器,那么eN= eN ,则qN=0 , xN- xN =0。这样就可以完全不失真地恢复输入信号xN,从而实现信息保持型编码。 如果qN0 ,那么输入信号xN和复原信号输出xN之间就一定存在误差,从而产生图像质量的某种降质。这样的DPCM系统实现的是保真度编码,在这样的DPCM系统中就存在一个如何能使误差尽可能减少的问题。,接收端输出为xN ,则有: 那么在接收端恢复的像素值xN与发送端的原输入像素值xN之间的误差为:,所谓混合压缩编码方法,就是将若干种编码方法巧妙的结合在一起,以此来达到更高的压缩率。这种混合编码的方法已经广泛应用于各种图像压缩编码标准中,下面介绍几种常用的图像压缩编码国际标准。,10.6 混合压缩编码,回顾一下讲过的几个内容的特点:行程编码:擅长于重复数字的压缩。Huffman编码:擅长于像素个数分布不均匀情况下的编码。DCT变换: 擅长分离视觉敏感与不敏感的部分。,混合编码 可能性及有效性分析,混合编码 例题,例: aaaa bbb cc d eeeee fffffff(共22*8=176 bits) 4 3 2 1 5 7 行程编码:4a3b2c1d5e7f (共6*(8+3)= 66Bits ),176,66,aaaa bbb cc d eeeee fffffff (共22*8=176 bits) 4 3 2 1 5 7 Huffman编码: f=01 e=11 a=10 b=001 c=0001 d=000010101010001001001000100010000111111111101010101010101 (共 7*2+5*2+4*2+3*3+2*4+1*4=53 bits),176,66,53,aaaa bbb cc d eeeee fffffff (共22*8=176 bits) 4 3 2 1 5 7 Hufman与行程编码混合: 41030012000110000511701 (共:3+2+3+3+3+4+3+4+3+2+3+2=35 bits),176,66,53,35,1:1,2.67:1,3.32:1,5.03:1,10.6.1 JPEG JPEG(Joint Photographic Experts Group)是是联合图像专家小组的缩写,是在国际标准化组织(ISO)领导之下制定静态图像压缩标准的委员会,第一套国际静态图像压缩标准ISO 10918-1(JPEG)就是该委员会制定的。由于JPEG优良的品质,使他在短短几年内获得了极大的成功,被广泛应用于互联网和数码相机领域,网站上80%的图像都采用了JPEG压缩标准,JPEG压缩原理如下图所示。,JPEG编码原理框图,JPEG本身只有描述如何将一个影像转换为字节的数据串流(streaming),但并没有说明这些字节如何在任何特定的储存媒体上被封存起来。 *.jpeg/*.jpg是最常用的图像文件格式,由一个软件开发联合会组织制定,是一种有损压缩格式,能够将图像压缩在很小的储存空间,图像中重复或不重要的资料会被丢失,因此容易造成图像数据的损伤。 JPEG压缩技术十分先进,它用有损压缩方式去除冗余的图像数据,。JPEG格式压缩的主要是高频信息,对色彩的信息保留较好,适合应用于互联网,可减少图像的传输时间,可以支持24bit真彩色,也普遍应用于需要连续色调的图像。,JPEG格式的应用非常广泛,特别是在网络和光盘读物上,都能找到它的身影。目前各类浏览器均支持JPEG这种图像格式,因为JPEG格式的文件尺寸较小,下载速度快。 JPEG2000作为JPEG的升级版,其压缩率比JPEG高约30%左右,同时支持有损和无损压缩,编码原理如下图所示。,JPEG2000编码原理框图,JPEG2000的压缩优越性跟它的先进的编码技术是密切相关的。大体说来分为六个方面: (1)JPEG2000可以方便地实现渐进式传输,这是JPEG2000的重要特征之一。看到这种特性,我们就会联想到GIF格式的图像可以做到在WEB上实现渐现效果。也就是说,它先传输图像的大体轮廓,然后逐步传输其他数据,不断地提高图像质量。这样图象就由朦胧到清晰显示出来,从而节约、充分利用有限的带宽。而传统的JPEG无法做到这一点,只能是从上到下逐行显示。 (2)JPEG2000既支持有损压缩,也支持无损压缩方式。而JPEG只能做到有损压缩,压缩后数据不能还原。因此JPEG2000在保存不可以丢失原始信息,而又强调较小的图象文档尺寸的情况下能扮演很重要的角色。,(3)JPEG2000另外一个非常有趣而又实用的特征,就是它支持对你希望的特定区域进行特别的压缩处理。你可以指定图像上任意区域的压缩质量,还可以指定哪个部份先进行解压处理。这在大大降低图象尺寸方面起到很大作用。 (4)实际上,JPEG2000作为JPEG家族的继承者,就不能不追求很高的压缩比。在具有和传统JPEG类似质量的前提下,JPEG2000的压缩率比JPEG高20%-40%左右。也就是说,假如有一天我们的JPEG图片全部换成JPEG2000编码方式,在同样的网络带宽下,我们的对于图片下载的等待时间将大大缩短。,(5)JPEG2000在颜色处理上,具有更优秀的内涵。与JPEG相比,JPEG2000同样可以用来处理多达256个通道的信息。而JPEG仅局限于RGB数据。也就是说,JPEG2000可以用单一的文件格式来描述另外一种色彩模式,比如CMYK模式 (6)JPEG2000能使基于WEB方式多用途图象简单化。由于JPEG2000图象文件在它从服务器下载到用户的WEB页面时,能平滑地提供一定数量的分辨率基准,WEB设计师们处理图象的任务就简单了 。例如我们经常会看到一些提供图片欣赏的站点,在一个页面上用缩略图来代理较大的图象。浏览者只需点击该图象,就可以看到较大分辨率的图象。不过这样WEB设计师们的任务就在无形中加重了。因为缩略图与它链接的图象并不是同一个图象,需要另外制作与存储。而JPEG2000只需要一个图象就可以了。用户可以自