图像压缩的理论.ppt
《图像压缩的理论.ppt》由会员分享,可在线阅读,更多相关《图像压缩的理论.ppt(108页珍藏版)》请在三一办公上搜索。
1、第8章图像压缩,8.1基本概念8.2图像压缩模型8.3信息论基础8.4 方法,第8章 图像压缩,图像压缩的必要性,计算机图像处理中的数字图像其灰度多数用8bit来量化,一幅最简单的黑白照片,若按512512点阵取样,表示这幅图像的二进制数据量:而医学图像处理和其他科研应用的图像的灰度量化可用到12bit以上,所需数据量:遥感图像如SAR图像用8bit量化,100公里*100公里,10m分辨率的图像的大小为1000010000。这样一个地区的图像需108B=100MB以上。这无疑对图象的存储、处理、传送带来很大的困难。,动态视频数据量更大。数字高清:1080i/50Hz1920*1080*24*
2、50=2 488 320 000=2.5Gb/s视频信号的传输率约为2.5GB/s这样大的数据量不仅超出了计算机的存储和处理能力,更是当前通信信道的传输速率所不及的。因此,为了存储、处理和传输这些数据,必须进行压缩。,传输 存储,主要目的,第8章 图像压缩,在保持一定图像质量的条件下,以尽可能少的比特数表示图像。,图像压缩的理论基础,信息论图像处理的概念和技术,压缩方法预测编码方法(对应空域方法)变换编码方法(对应频域方法),第8章 图像压缩,8.1基础知识,数据冗余的概念,数据是用来表示信息的。如果不同的方法表示等量的信息使用了不同的数据量,那么使用较多数据量的方法中,有些数据必然是代表了无
3、用的信息,或者是重复地表示了其它数据已表示的信息,这就是数据冗余的概念。,第8章 图像压缩,同量的数据可表达不同量的信息同量的信息可用不同量的数据表达,冗余 数据表达了无用的信息 数据表达了已表达的信息,8.1基础知识,数据冗余的数学量化,如果b和b代表两个表示相同信息的数据集合中所携载信息单元的数量,则b表示的数据集合的相对数据冗余R定义为:,第8章 图像压缩,相对数据冗余和压缩率的一些特例,例如:,意味着:压缩后的数据集中的一个信息携载单元对应压缩前的10个信息携载单元,即:压缩前的数据集中有90%的数据是冗余的;,三种基本的数据冗余,8.1.1编码冗余8.1.2 空间和时间冗余8.1.3
4、心理视觉冗余(不相关信息),如果能减少或消除上述三种冗余的1种或多种冗余,就能取得数据压缩的效果,第8章 图像压缩,典型图像的数据量,8.1.1 编码冗余,如果一个图像的灰度级编码,使用了多于实际需要的编码符号,就称该图像包含了编码冗余,黑白二值图像编码,如果用8位表示该图像的像素,我们就说该图像存在编码冗余,因为该图像的像素只有两个灰度,用一位即可表示。,第8章 图像压缩,nk是第k个灰度级在图像中出现的次数,MN是图像中的像素总数,L是灰度级数。,表示不同的灰度级值的平均码字长度;对MN的图像进行编码所需的比特数为:MNL avg,8.1.1 编码冗余,编码时,每个像素所需的平均比特数,如
5、果用于表示每个rk值的比特数为l(rk),则表达每个像素所需的平均比特数为:,练习:求下表所示每个像素所需的平均比特数,灰度级,出现概率,编码1,比特数1,编码2,比特数2,等长编码(自然二进制编码):,8.1.1 编码冗余,思考:编码方式,不管灰度出现的频率如何,为图像中出现的每个灰度级分配相同的比特数(该比特数由图像中出现的灰度级数目决定);等长编码总会存在编码冗余;,变长编码:,用尽量少的比特数表达尽可能多的灰度级(以实现数据压缩);如何实现:短码字赋给出现频率高(高概率)的灰度级;,基本思想:,8.1.1 编码冗余,霍夫编码,根据符号出现概率大小进行编码,出现概率越大的符号,分配的码字
6、越短,出现概率越小的符号,分配的码字越长,哈夫曼编码步骤:,(1)缩减信源符号数量:信源符号按出现概率从大到小排列,然后结合,8.1.1 编码冗余,霍夫编码,哈夫曼编码步骤:,(2)对每个信源符号赋值从(消减到)最小的信源开始,逐步回到初始信源,哈夫曼编码结果平均长度 信源熵 编码效率,哈夫曼编码,练一练,采用huffman编码对信号:abcde 进行编码,写出编码结果。(要求画出huffman树,以及huffman树的形成过程)。,Huffman编码的性能,优点:实现Huffman编码的基础是统计源数据集中各信号的概率分布。Huffman编码在无失真的编码方法中效率优于其他编码方法,是一种最
7、佳变长码,其平均码长接近于熵值。缺点:当信源数据成分复杂时,庞大的信源集致使Huffman码表较大,码表生成的计算量增加,编译码速度相应变慢不等长编码致使硬件译码电路实现困难。上述原因致使Huffman编码的实际应用受到限制。,图像的Huffman编译码系统,反映静止图像中像素之间的空间相关(结构、几何关系等)和视频序列中相邻帧之间的时间相关;如果图像中像素之间存在空间相关,则任何给定像素的值可以根据与这个像素相邻的像素进行预测,所以单个像素携带的信息相对较少对于一幅图像,很多单个像素对视觉的贡献是冗余的。它的值可以通过与它相邻的像素值为基础进行预测,8.1.2 空间和时间冗余,例:原图像数据
8、:234 223 231 238 235,压缩后数据:234-11 8 7-3,像素间冗余,思考:图a和c哪个图像的冗余大?,像素间冗余,通过观测直方图特征,可以用变长编码减少编码冗余。但编码处理不会改变图像像素之间的相关性级别。也就是说用于表示每幅图像的灰度级的编码与像素之间的相关性无关,这些相关来自于图像中对象之间的结构或几何关系。相关性反映了图像中像素间的直接关系。,所以,消除象素间冗余常用的方法:用相邻象素间的差异来描绘图像!,像素间冗余,所以,消除象素间冗余常用的方法:用相邻象素间的差异来描绘图像!-预测编码,像素间冗余,所以,消除象素间冗余常用的方法:用相邻象素间的差异来描绘图像!
9、-预测编码,8.1.3 心理视觉冗余,什么是心理视觉冗余?,人眼感觉到的图像区域亮度不仅取决于该区域的反射光,例如根据马赫带效应,在灰度值为常数的区域也能感觉到灰度值的变化,这是由于眼睛对所有视觉信息感受的灵敏度不同。在正常视觉处理过程中各种信息的相对重要程度不同,有些信息在通常的视觉过程中与另外一些信息相比并不那么重要,这些信息被认为是心理视觉冗余的,去除这些信息并不会明显降低图像质量,由于消除心理视觉冗余数据会导致一定量信息的丢失,所以这一过程通常称为量化心理视觉冗余压缩是不可恢复的,它表示从一个范围很宽的输入集合到一个有限个输出值的集合的映射,这种映射是不可逆的,所以结果导致了数据的有损
10、压缩。,33K,15K,8.1.3 心理视觉冗余,心理视觉冗余压缩,例8.3 通过量化进行压缩,a)256灰度级原图像:8bit/像素b)量化为16级后图像:4bit/像素,8.1.3 心理视觉冗余,采用IGS量化方法,c)利用人类视觉特性进行量化后图像,回顾:位平面编码,改进的灰度级(IGS)量化方法,IGS利用眼睛对边缘固有的敏感性,通过一个伪随机数加到每个像素上将这些边缘拆散。这个伪随机数是在对结果进行量化之前,根据表示相邻像素灰度级的原编码的低位生成的。由于低位完全是随机的,所以这样做等于增加了通常与伪轮廓相关的人工边缘随机性的灰度级。,8.1.3 心理视觉冗余,8.2信息论基础:图像
11、信息的度量,显示一幅图像需要多大的数据量?有没有描述一幅图像且没有信息丢失的最小数据量?,一、信息测量,对一个随机事件E,如果它的出现概率是,那么它包含的信息量定义为:,称为E的自信息,又叫信息熵。,8.2信息论基础:图像信息的度量,显示一幅图像需要多大的数据量?有没有描述一幅图像且没有信息丢失的最小数据量?,一、信息测量,随机事件E所包含的信息量决定了该随机事件发生的不确定性有多大;如果P(E)=1(即事件总发生),那么I(E)=0,即:该随机事件发生的不确定性为0;I(E)的单位由对数的底数决定。当以2为底数时,单位为:比特/符号,信源熵(零记忆信源输出的平均信息)定义为:,信息度量,也是
12、:每个符号的平均自信息量,单位:比特/符号,如果信源符号的出现是等可能性的,则上述熵被最大化,此时信源具有最大不确定性(不能确定到底哪个信源符号会出现!),二、信源的数学描述,一幅图像看作是一个零记忆“灰度”信源的输出;其信源熵为:,三、Shannon第一定理(无噪声编码定理),信息度量,编码:信源输出 用一个码字表示的,码字的长度 为不小于其自信息量的最小整数,对第n次扩充后得到的信源输出进行编码所需的平均码长定义为:,将代入可得:,香农第一定理:,这一定理说明了:,任何编码策略的编码效率可以定义为:,当信道和通信系统中不存在噪声的时候,通信系统的主要功能是用尽可能简洁的方法表示信源,在这种
13、情况下无噪声编码定理给出了可以达到的每个信源符号的最小平均码字长度。,通过对无限扩充的信源进行编码可以令 无限接近。,四、编码效率,具有256个灰度值的”灰度“信源的第n次扩展有256n个可能的n元象素块(一个n元象素块对应于n个邻近象素组);在对统计独立的象素直接编码时,式(8.1-7)提供了可以达到的压缩的下界;,8.2.2 保真度准则,保真度准则,图像压缩可能会导致信息损失,如去除心理,视觉冗余数据,需要评价信息损失的测度以描述解码图像相对于原始图像的偏离程度,这些测度称为保真度准则,常用保真度准则分为两大类:,客观保真度准则主观保真度准则,客观保真度准则当所损失的信息量可以用编码输入图
14、像与编码输出图像的函数表示时,它就是基于客观保真度准则的。,均方根误差,保真度准则,常用的客观保真度准则:,均方信噪比,其中:,均方根信噪比 SNR rms为,客观保真度准则当所损失的信息量可以用编码输入图像与编码输出图像的函数表示时,它就是基于客观保真度准则的,平均码长和编码效率,保真度准则,常用的客观保真度准则:,峰值信噪比,信息熵,客观保真度准则当所损失的信息量可以用编码输入图像与编码输出图像的函数表示时,它就是基于客观保真度准则的,归一化信噪比,保真度准则,常用的客观保真度准则:,4,6,主观保真度准则,评分1235,评价优秀良好可用刚可看差不能用,说明图像质量非常好,如同人想象出的最
15、好质量图像质量高,观看舒服,有干扰但不影响观看图像质量可接受,有干扰但不太影响观看图像质量差,干扰有些妨碍观看,希望改进图像质量很差,妨碍观看的干扰始终存在,几乎无法观看图像质量极差,不能使用,图像编码主、客观评价的内在关系,8.3 图像压缩模型,一个图像压缩系统包括两个不同的模块:编码器和解码器一般来讲如果输出图像是输入的准确复制,系统就是无误差的或具有信息保持编码的系统。,编码器,解码器,编码器由一个消除输入冗余的信源编码器和一个用于增强信源编码器输出的抗噪能力的信道编码器构成。如果编码器和解码器之间的信道是无噪的,则信道编、解码器可以省去。,8.3.1 信源编码器和信源解码器,信源编码器
16、:减少或消除输入图像中的编码冗余、像素间冗余及心理视觉冗余转换器:减少像素间冗余。例如:行程编码中的沿每条水平扫描线将图像象素转换为长度序列量化器:减少心理视觉冗余,该步操作是不可逆的符号编码器:减少编码冗余(利用各种编码方式)并不是每个图像压缩系统都必须包含这3种操作,如进行无误差压缩时,必须去掉量化器,信源编码器,图像压缩模型,8.3.1 信源编码器和信源解码器,符号解码器:进行符号编码的逆操作反向转换器:进行转换器的逆操作为什么没有反向量化器?,信源解码器:如何有效地传递信息?,图像压缩模型,因为量化操作是不可逆的!,8.3.2信道编码器和信道解码器,在有噪声的或易产生误差时,信道编码器
17、和信道解码器对整个编解码过程非常重要信道编码器和解码器通过向信源编码数据中插入预制的冗余数据来减少信道噪声的影响(代价:降低了“压缩率”)。由于信源编码器几乎不包含冗余,所以如果没有附加这种预制的冗余,它对噪声传送会有很高的敏感性。因此,信道编码是解决可靠性问题,尽量使处理过的信号在传输过程中不出错或少出错,即使出错也要有能力尽量纠正错误。信道编码技术:比如汉明(Hamming)编码。在编了码的码字后面增加足够的比特位以保证各个正确的码字之间至少有一定数量的比特位不相同,图像压缩模型,如何可靠地传递信息?,汉明(Hamming)码:,汉明码(Hamming Code),是在电信领域的一种线性调
18、试码,以发明者Richard Hamming的名字命名。汉明码在传输的消息流中插入验证码(又叫冗余码),以侦测并更正单一比特位错误;当传送端与接收端的比特样式的汉明距离(Hamming distance)小于或等于1时(仅有 1 bit 发生错误),可实现可靠的通信;在一个7位的信息中,单个位出错有7种可能,因此3个错误控制位就足以确定是否出错及哪一位出错了。简单的奇偶检验码除了不能纠正错误之外,也只能侦测出奇数个的错误。,图像压缩模型,汉明验证码的位数与待编码的数据流的位数之间的关系。,比如4位数据,加上1就是5,而能大于5的2的幂数就是3(23=8,22=4)。这样,我们就能算出任何数据位
19、时所需要的验证码位数:7位数据时需要4位验证码(244+7+1),64位数据时就需要7位验证码(2764+7+1),大家可以依此推算。此时,它们的编码规则也与4位时不一样了。,其中:k代表验证码的个数,n代表数据位的个数。,汉明(7,4)码(1950年):,其编码由4数据比特到7位,增加三个奇偶校验码。汉明(7,4)可以检测并纠正单比特错误,且也能检测双比特错误;,图像压缩模型,原数据流(4bit):,原数据流的hamming码(7bit):,其中:组成冗余码,“一位错误”效验字 的值就是错误发生的位置!,汉明(7,4)码应用举例:,图像压缩模型,原数据流(4bit):,原数据流的hammin
20、g码(7bit):,如果第3个(从左到右算起)数据位在传输途中因干扰而变成了1,即,检测时,,纠错代码 从高到低排列为二进制编码110,换算成十进制就是6,也就是说第6位(从左到右算起)数据错了,而数据第3位(从左到右算起)在汉明码编码后的位置正好是第6位。,8.4 图像压缩方法,1.无损压缩(Lossless Compression):香农信息保持编码定理:,8.4 图像压缩方法,1.无损压缩(Lossless Compression):举例:算术编码,在信源各符号概率接近的条件下,算术编码是一种优于Huffman编码的方法。对整个符号序列编码,而不是对单个符号编码。信源符号序列算术码字(0
21、至1之间的实数间隔),0.068,最终二进制码为?,算术编码,练一练根据信源的概率分布进行算术编码。已知信源的概率分布为 求二进制序列011的编码。,8.4 图像压缩方法,2.有损压缩(Lossy Compression):举例1:预测编码,利用邻近像素之间的相关性,预测像素的灰度值,对实际值与预测值之间的误差值进行编码差分脉冲编码调制Differential Pulse Code Modulation,DPCM(帧内预测编码),DPCM系统的组成,通过分析可以得出以下结论:,图像的相关性越强,压缩效果越好。当某个阶数已使EeN,eN 1 0时,即使再增加预测点数,压缩效果也不可能继续提高。,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 图像 压缩 理论
链接地址:https://www.31ppt.com/p-5252664.html