图像压缩编码的分类课件.ppt
《图像压缩编码的分类课件.ppt》由会员分享,可在线阅读,更多相关《图像压缩编码的分类课件.ppt(128页珍藏版)》请在三一办公上搜索。
1、10.1 图像压缩编码基础10.2 图像的熵编码 10.3 图像的变换压缩编码 10.4 图像的量化压缩编码 10.5 图像的预测编码10.6 混合压缩编码,学习目标,了解图像压缩编码的基本理论掌握熵编码的基本理论和方法掌握图像的变换压缩编码方法掌握图像的量化压缩编码方法掌握图像的预测编码编码方法了解图像的混合压缩编码方法,图像编码的研究背景 通信方式改变带来的需求,信息传输方式发生了很大的改变通信方式的改变文字+语音图像+文字+语音通信对象的改变人与人人与机器,机器与机器,图像编码的研究背景 通信方式改变带来的需求,由于通信方式和通信对象的改变带来的最大问题是: 传输带宽、速度、存储器容量的
2、限制。给我们带来了一个难题,也给了我们一个机会: 如何用软件的手段来解决硬件上的物理极限。,数码图像的普及,导致了数据量的庞大。图像的传输与存储,必须解决图像数据的压缩问题。,图像编码的研究背景 海量数据带来的需求,实时传输: 在10M带宽网上实时传输的话,需要压缩到原来数据量的0.045, 即1.08 bit/pixel。存储: (按1张光盘可存640M计算) 如果不进行压缩,1张CD则仅可以存放2.89秒的数据。存2小时的信息则需要压缩到原来数据量的0.0004,即:0.003bit/pixel。,彩色视频数据量分析,如果只传送2值图像,以200dpi的分辨率传输,一张A4稿纸的数据量为:
3、 1654*2337*1=3888768bit =3900K按目前14.4K的电话线传输速率,需要传送的时间是:270秒(4.5分),传真数据量分析,图像通信系统模型,10.1 图像压缩编码基础,10.1.1 图像压缩编码的必要性 随着信息技术的发展,图像信息已经成为通信和计算机系统中一种重要的处理对象。图像的最大特点也是最大难点就是海量数据的表示与传输,如果不对数据进行压缩处理,数量巨大的数据就很难在计算机系统及网络上存储、处理和传输,所以必须对图像进行压缩编码。图像编码与压缩从本质上来说就是对要处理的图像源数据按一定的规则进行变换和组合,从而达到以尽可能少的代码(或符号)来表示尽可能多的数
4、据信息。,10.1.2 图像压缩编码的可能性 我们知道,之所以可以进行压缩编码,是因为原始的数据包含一定的冗余。在图像的数据文件中包含有大量的冗余信息,换句话说,在实际获取的原始数据中,包含有多余信息。这些冗余来自于数据之间的相关性,或者来自于人的视觉特性,这就为压缩数据提供了可能。 数据压缩的理论基础是信息论。从信息论的角度看,压缩就是去除信息中的冗余,减少承载信息的数据量,用一种更接近信息本质的描述来代替原有冗余的描述。,1.冗余的概念 我们从一个互动游戏来体会数据冗余的概念。在下面的例子中,用一种最好的方式来发送一封电报。你的妻子,Helen,将于明天晚上6点零5分在上海的虹桥机场接你。
5、 (23*2+10=56个半角字符)你的妻子将于明天晚上6点零5分在虹桥机场接你 (20*2+2=42个半角字符) Helen将于明晚6点在虹桥接你 (10*2+6=26个半角字符),结论:只要接收端不会产生误解,就可以减少承载信息的数据量。,描述方式: 1)这是一幅2*2的图像,图像的第一个像素是红的,第二个像素是红的,第三个像素是红的,第四个像素是红的。 2)这是一幅2*2的图像,整幅图都是红色的。,由此我们知道,整理图像的描述方法可以达到压缩的目的。,2.图像中的冗余,图像冗余无损压缩的原理,从原来的16*3*8=384bits压缩为:(1+3)*8=32bits,压缩比为:12:1,图
6、像冗余有损压缩的原理,实际图像中冗余信息的表现(灰度图),图像的视觉冗余 (彩色),(248,27,4),(251,32,15),(248,27,4),(248,27,4),一般来说,图像数据中存在着以下几种冗余: (1)编码冗余 如果一个图像的灰度级编码,使用了多于实际需要的编码符号,就称该图像包含了编码冗余。例如,在以BMP位图形式存储一幅数字图像时,该数据文件形式主要考虑的是结构形式统一。如果存储一幅灰度图像,首先调色板部分就是冗余的。另外,如果某一幅图像只有小于8bit(256灰度级)的量化级别,如只有3bit(8灰度级)灰阶,但是仍旧采用标准8bit存储一个像素,就有了编码冗余。编码
7、冗余通常是为了以某个标准格式(例如,固定大小的最大灰度级定义)进行图像描述时产生的。,(2)像素冗余 图像信号相比于其他信号有一个非常明显的特点,就是像素之间存在非常大的相关性。由于存在相关性,因此任何给定的像素值,原理上都可以通过它的邻接像素预测得到。换句话说,单个像素所携带的信息相对是小的。这样,对一幅图像,如果描述每个像素的数据量是相等的,并且是相互独立的。则由于像素相关性是的该数据对视觉的贡献一定存在一定的冗余,称这种像素之间的内在相关性所导致的冗余为像素冗余。,像素的相关性示例,上图是一幅灰度图像,将原图中的一个局部子块的数据取出显示,该子块的灰度值十分接近,分布在100左右,而且还
8、存在有许多相等的值,如96,这表明在图像中像素之间的相关性很强。 若采用灰度图的描述方式,这个子块所需要的数据量为258=200bit,若将这个子块以最小的数据,以及与之偏差的数据流形式来描述为:103及25个偏差7,7,4,1,2,0,2,4,4,7,0,1,5,7,7,1,4,6,7,7,4,4,4,5,5。显然,这25个偏差值的大小范围为07,可以以一个较小的灰度级(如3bit,8灰度级)来描述,则数据量为8+253=83bit,是原始数据量的41.5%。由此便可以看到像素冗余的特点。,(3)视觉心理冗余 最终观测图像的对象是人,而人的视觉寻在一定的主观心理冗余。例如比较明显的是,人的视
9、觉对颜色的感知就存在着冗余,“异谱同色”就是指数据取值不同的颜色,在视觉上被认为是相同的颜色的现象。另外,当人在观察一幅图像时,一些信息在一般视觉处理中比其他信息的相对重要程度要小,因此这部分信息往往被忽视。将这种对视觉感知影响很小的信息称为视觉心理冗余。产生这种冗余的原因在于人眼视觉系统的非均匀性。,(a)256灰度级 (b)64灰度级,视觉心理冗余示例,由于一幅图像存在一定的数据冗余(即编码冗余和像素冗余)和主观视觉冗余,所以图像的压缩编码可以从以下两个方面来展开。 因为有数据冗余是由于描述图像的方式所导致的,所以若改变图像信息的描述方式,就可以压缩数据冗余。基于数据统计特征的传统的信源编
10、码方式,如行程编码、预测编码、变换编码等,都是针对这类数据冗余所提出的有效压缩方法。,因图像中存在主观视觉心理冗余,编码时忽略一些视觉感知不太明显的微小差异,可进行所谓的“有损”压缩。20世纪80年代后,所提出的突破信源编码理论的压缩方法,如结合分形、模型基、神经网络、小波变换等数学工具,充分利用视觉系统生理心理特性和图像信源的各种特性进行编码的方法,包括子带编码、分层编码、分型编码、模型编码等,就是考虑了这类冗余而提出的图像压缩编码方法。,根据解压重建后的图像与原始图像之间是否具有误差,图像压缩编码分为无损编码和有损编码两大类。 无损编码:这类压缩算法中删除的仅仅是图像数据中冗余的信息,因此
11、在解压缩时能精确地恢复原图像。无损编码用于要求重建后图像严格地与原始图像保持相同的场合,例如复制、保存十分珍贵的历史和文物图像等。 有损编码:这类算法把不相干的信息也删除了,因此在解压缩时只能对原始图像进行近似地重建,而不能精确地复原,有损编码适合大多数用于存储数字化的模拟数据。,10.1.3 图像压缩编码的分类,根据编码原理,图像压缩编码分为熵编码、预测编码、变换编码和混合编码等。 熵编码:这是纯粹基于信号统计特性的编码技术,是一种编码。熵编码的基本原理是给出现概率较大的符号赋予一个短码字,而给出现概率较小的符号赋予一个长码字,从而使得最终的平均码长很小。常见的熵编码方法有行程编码、哈夫曼编
12、码和算术编码。 预测编码:它是基于图像数据的空间或时间冗余特性,用相邻的已知像素(或像素块)来预测当前像素(或像素块)的取值,然后再对预测误差进行量化和编码。预测编码可以分为帧内预测和帧间预测,常用的预测编码方法有差分脉码调制(DPCM)和运动补偿。,变换编码:通常将空间域上的图像经过正交变换映射到另一个变换域上,使变换后的系数之间的相关性降低。图像变换本身并不能压缩数据,但变换后图像的大部分能量只集中到少数几个变换系数上,再采用适当的量化和熵编码就可以有效地压缩图像了。 混合编码:是指综合了熵编码、变换编码和预测编码的编码方法,例如常用的几种国际编码标准,JPEG标准、MPEG标准、H.26
13、3标准以及H.264标准,都是采用了多种编码技术的混合编码方式。,1.压缩比 压缩比是衡量数据压缩程度的指标之一。至今尚无压缩比的统一定义。目前常用的压缩比Pr定义为: 式中:Ls为源代码长度;Ld为压缩后的代码长度。 压缩比的物理意义是被压缩掉的数据占源数据的百分比。一般来说,压缩比越大,说明被压缩掉的数据量越多。当压缩比接近100%时,压缩效率最理想。,10.1.4 图像压缩效率的评估,2.保真度 在图像压缩编码中,解码图像与原始图像可能会存在差异,因此,需要评价压缩后图像的质量。描述解码图像相对原始图像偏离程度的测度一般称为保真度(逼真度)准则。 最常用的客观保真度准则是原图像与解码图像
14、之间的均方根误差和均方根信噪比两种。令f(x,y)表示原图像, 表示f(x,y)先压缩又解压缩后得到的f(x,y)的近似。对任意x和y, f(x,y)和 之间的误差定义为:,若f(x,y)和 大小均为 ,则它们之间的均方根误差erms为: 如果将 看做原始图像f(x,y)和噪声信号e(x,y)的和,则解压缩图像的均方根信噪比为SNRms: 对上式求平方根,则得到均方根信噪比SNRms 。,10.2.1 行程编码(RLE)行程编码是一种最简单的,在某些场合是非常有效的一种无损压缩编码方法。虽然这种编码方式的应用范围非常有限,但是因为这种方法中所体现出的编码设计思想非常明确,所以在图像编码方法中都
15、会将其作为一种典型的方法来介绍。,10.2 图像的熵编码,通过改变图像的描述方式,来实现图像的压缩。将一行中灰度值相同的相邻像素,用一个计数值和该灰度值来代替。,行程编码 基本原理,举例说明: aaaa bbb cc d eeeee fffffff 4 3 2 1 5 7 (共22*8=176 bits) 4a3b2c1d5e7f (共12*8=96 bits) 压缩比为:176:96=1.83:1,行程编码 实现方法,行程编码 传真中的应用方法,传真件中一般都是白色比较多,而黑色相对比较少。所以可能常常会出现如下的情况: 500W 3b 470w 12b 4w 3b 3000w 上面的行程编
16、码所需用的字节数为: 因为:204830004096 所以:计数值必须用12 bit来表示,对于: 500W 3b 470w 12b 4w 3b 3000w 编码为: 500, 3, 570, 12, 4, 3, 3000 编码位数为:12, 12, 12, 12, 12,12,12需要的数据量为: 12*7=84 bit 压缩比为: 168:84=2:1,因为只有白或黑,而且排版中一定要留出页边距,因此,一般情况下,可以只传输计数值即可。,现在,根据传真件的特点,对其进行改进。既然已经可以预知白色多黑色少,所以可对白色和黑色的计数值采用不同的位数。以这个例子,可以定义: 白色:12 bit,
17、黑色:4 bit,编码为: 500,3,470,12,4,3,3000 编码位数为: 12, 4, 12, 4,12,4, 12所需字节数为:4*12+3*4=60bit压缩比为: 168:60=2.8:1,比原来的RLE方式168bit减少到了60bit,相当于又提高了压缩比为 168/60=2.8:1 。,二维行程编码 基本概念,二维行程编码要解决的核心问题是: 将二维排列的像素,采用某种方式转化成一维排列的方式。之后按照一维行程编码方式进行编码。,二维行程编码的排列方式,(a)排序方式1 (b)排序方式2,二维行程编码示例,例:,数据量:64*8=512(bit),如果按照行扫描的顺序排
18、列的话,数据分布为:,130,130,130,129,134,133,129,13130,130,130,129,134,133,130,130;130,130,130,129,132,132,130,130;129,130,130,129,130,130,129,129;127,128,127,129,131,129,131,130;127,128,127,128,127,128,132,132;125,126,129,129,127,129,133,132;127,125,128,128,126,130,131,131,一维行程编码后为:,(3,130),(1,129),(1,134),(
19、1,133),(1,129),(4,130),(1,129),(1,134),(1,133),(5,130),(1,129),(2,132),(2,130),(1,129),(2,130),(1,129),(2,130),(2,129),(1,127),(1,128),(1,127),(1,129),(1,131),(1,129),(1,131),(1,130),(1,127),(1,128),(1,127),(1,128),(1,127),(1,128),(2,132),(1,125),(1,126),(2,129),(1,127),(1,129),(1,133),(1,132),(1,12
20、7),(1,125),(2,128),(1,126),(1,130),(2,131),数据量为:46*(3+8)=506(bit)压缩比为:512:506=1.01:1,如果按照列扫描的顺序排列的话,数据分布为:,130,130,130,129,127,127,125,127;130,130,130,130,128,128,126,125;130,130,130,130,127,127,129,128;129,129,129,129,129,128,129,128;134,134,132,130,131,127,127,126;133,133,132,130,129,128,129,130;
21、129,130,130,129,131,132,133,131;130,130,130,129,130,132,132,131,一维行程编码为:,数据量为:42*(3+8)=462(bit) 压缩比为:512:462=1.11:1,(3,130),(1,129),(2,127),(1,125),(1,127),(4,130),(2,128),(1,126),(1,125),(4,130),(2,127),(1,129),(1,128),(5,129),(1,128),(1,129),(1,128),(2,134),(1,132),(1,130),(1,131),(2,127),(1,126),
22、(2,133),(1,132),(1,130),(1,129),(1,128),(1,129),(1,130), (1,129),(2,130),(1,129),(1,131),(1,132),(1,133),(1,131),(3,130),(1,129),(1,130),(2,132),(1,131),如果按照方式(a)扫描的顺序排列的话,数据分布为:,130,130,130,130,130,130,130,130;130;129,129,129,129,130,130,129;127,128,127,129,131,130,132,134;134;133,133,132,130,129,1
23、28,127;128,127,128,127,125,126,129,129;127,129,133,132,131,129,130,130;129,130,130,130,129,130,132,132;131,131,130,126,128,128,125,127,数据量为:44*(3+8)=484(bit) 压缩比为:512:484=1.06:1,一维行程编码为:,(7,130),(2,130),(4,129),(2,130),(1,129),(1,127),(1,128),(1,127),(1,129),(1,131),(1,130),(1,132),(2,134),(2,133),(
24、1,132),(1,130),(1,129),(1,128),(1,127),(1,128),(1,127),(1,128),(1,127),(1,125),(1,126),(2,129),(1,127),(1,129),(1,133),(1,132),(1,131),(1,129),(2,130),(1,129),(3,130),(1,129),(1,130),(2,132),(2,131),(1,130),(1,126),(2,128),(1,125),(1,127),10.2.2 哈夫曼(Huffman)编码行程编码要获得好的压缩率的前提是有比较长的相邻像素的值是相同的。熵是指数据中承载
25、的信息量。所谓的熵编码是指在完全不损失信息量前提下最小数据量的编码。,Huffman编码 基本原理,为了达到大的压缩率,提出了一种方法就是将在图像中出现频度大的像素值,给一个比较短的编码,将出现频度小的像数值,给一个比较长的编码。,例: aaaa bbb cc d eeeee fffffff 4 3 2 1 5 7如果不进行特殊的编码,按照图像像素的描述,需要的数据量为: 22*8=176 bits,aaaa bbb cc d eeeee fffffff 4 3 2 1 5 7按照熵编码的原理进行编码: f=0 e=10 a=110 b=1111 c=11100 d=11101这里的编码规则是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 图像 压缩 编码 分类 课件
链接地址:https://www.31ppt.com/p-1571680.html