数字图像处理第八章ppt课件.ppt
《数字图像处理第八章ppt课件.ppt》由会员分享,可在线阅读,更多相关《数字图像处理第八章ppt课件.ppt(170页珍藏版)》请在三一办公上搜索。
1、第八章 数字图像的压缩编码,8.1 概述 8.2 预测编码 8.3 统计编码 8.4 变换编码 8.5 位平面编码 8.6 图像压缩的国际标准,数字图像处理过程,图像变换,图像增强,灰度分割,边缘检测,区域分割,图像特征,图像恢复,图像描述,图像分析,8.1 概述,问题1:数字图像的特点?数据量大:5125128bit(灰度)256KB 256KB25帧/秒6400KB=6.25MB占用的频带较宽:电视图像的带宽56MHz,而语言带宽4KHz,频带越宽,技术实现难度越大像素相关性大:压缩潜力大评价受人的影响大,8.1 概述,图像的特点 数据量大,为其存储、传输带来困难,需压缩 例:电话线传输速
2、率一般为56kbit/s(波特率) 一幅彩色图像64048024bit = 7Mbit大小 1传输一幅图像:时间约2分钟左右 如压缩20倍,传一幅图6s左右,可以接受,实用 2实时传送:64048024bit25帧/s=175Mbit/s, 时间为50min左右,8.1 概述,实时,要专用信道(卫星、微波网、专线网等技术) 另外,大量资料需存储(遥感、医学CT、MR),4如果以200dpi的分辨率传输,一张A4稿纸内容的数 据量为(200210/25.4)(200297/25.4bit) =3866948 bit, 需要传送的时间是67s,31T硬盘,1000000MB8175Mbit/s=约
3、12.7小时,8.1 概述,图像的数据量特别大,同时现在对图像需求的增长超过了网络带宽的限制,所以压缩是图像传输和存储的一个关键技术。由于图像压缩的巨大商业潜力,激励着人们提高现有的技术或发现新的技术。Internet上的大量图像、视频数字图书馆视频点播、数字互动电视视频会议、视频聊天,8.1.1 图像压缩编码的必要性,火星腐蚀.jpg400400,10.9KB,原图像数据468KB,BMP是一种与设备无关的位图格式。256256,65KB 一般采用非压缩模式,8.1.1 图像压缩编码的必要性,植被指数遥感图.bmp,原图像数据9767202MB,8.1.1 图像压缩编码的必要性,Buaa.j
4、pg,0.98MB ,原图像数据190015608.5MB,8.1.1 图像压缩编码的必要性,Water.tiff,640480,905KB,无损,8.1.1 图像压缩编码的必要性,GIF(Graphics Interchange Format)是由为了方便网络传送图像数据而制定的一种图像文件格式,主要采用无损数据压缩方法中压缩效率较高的LZW(字典压缩)算法。214155 12帧 43.1KB原图像数据1166KB,8.1.1 图像压缩编码的必要性,PNG是Fireworks的文件格式,专门针对网页设计的一种无损压缩图像文件格式 。PNG使用从LZW派生的无损数据压缩算法 。 1024768
5、 1.62MB 原图像数据2.36MB,8.1.1 图像压缩编码的必要性,AVI(Audio Video Interleave)同样是以AVI为后缀的视频文件,其采用的压缩算法可能不同,需要相应的解压软件才能识别和回放该AVI文件 AVI文件目前主要应用在多媒体光盘上,用来保存电影、电视等各种影像信息,有时也出现在Internet上,供用户下载、欣赏新影片的精彩片断。,视频大小:1280720 帧率:29.915fps 持续时间:30.854s 总帧数:923f原始码流:661672kbit/s 视频平均码流: 4644kbit/s 压缩比:142.5,8.1.1 图像压缩编码的必要性,ASF
6、是ADVANCED STEAMING FORMAT的缩写。它是一种采用流式传输方式在Internet播放的媒体格式,它可以将整个媒体文件分压成一个个的数据包,再由视频服务器向用户计算机进行连续、实时的传送。,视频大小:640480 帧率:25fps 持续时间:32.04s 总帧数:801f原始码流:184320kbit/s 视频平均码流: 847kbit/s 压缩比:217.6,8.1.1 图像压缩编码的必要性,WMV是一种ASF格式升级延伸来得。在同等视频质量下,WMV格式的体积非常小,因此很适合在网上播放和传输。 WMV格式的主要优点包括:本地或网络回放、可扩充的媒体类型、部件下载、可伸缩
7、的媒体类型、流的优先级化、多语言支持、环境独立性、丰富的流间关系以及扩展性等 。,视频大小:640480 帧率:23.976fps 持续时间:40.04s 总帧数:960f原始码流:176770kbit/s 视频平均码流: 828kbit/s 压缩比:213.5,8.1.1 图像压缩编码的必要性,RM格式:Real Networks公司所制定的音频视频压缩规范称为Real Media,主要用来在低速率的广域网上实时传输活动视频影像,可以根据网络数据传输速率的不同而采用不同的压缩比率,从而实现影像数据的实时传送和实时播放。优点:可以把比较大的电影压缩成比较小的文件。缺点:文件模糊不清,没有收藏价
8、值。,8.1.1 图像压缩编码的必要性,RMVB格式:这是一种由RM视频格式升级延伸出的新视频格式,比RM多了VB两字,在这里VB是VBR(Variable Bit Rate-可变比特率)的缩写。打破了原先RM格式那种平均压缩采样的方式,在保证平均压缩比的基础上合理利用比特率资源,在保证了静止画面质量的前提下,大幅地提高了运动图像的画面质量。要想播放这种视频格式,可以使用RealPlayer8.0、RealVideo9.0以上版本的解码器进行播放。,视频大小:640256 帧率:25fps 持续时间:28.48s 总帧数:712f 原始码流:98304kbit/s 视频平均码流: 605.7k
9、bit/s 压缩比:162.3,8.1.1 图像压缩编码的必要性,MOV是美国Apple公司开发的一种视频格式,播放器是QuickTime Player。具有较高的压缩比率和较完美的视频清晰度等特点。MOV也可以作为一种流文件格式。QuickTime能够通过Internet提供实时的数字化信息流、工作流与文件回放功能,视频大小:480288 帧率:23.98fps 持续时间:90.05s 总帧数:2159f原始码流:79546.6kbit/s 视频平均码流: 616.58kbit/s 压缩比:129.0,8.1.1 图像压缩编码的必要性,图像通信系统模型,8.1.1 图像压缩编码的必要性,总之
10、,大数据量的图像信息会给存储器的存储容量、信道的带宽以及计算机的处理速度增加极大的压力。单纯靠增加存储器容量,提高信道带宽以及计算机的处理速度等方法来解决这个问题是不现实的,这时就要考虑压缩。因此,图像数据在传输和存储中,数据的压缩都是必不可少的。,8.1.1 图像压缩编码的必要性,8.1.2 图像压缩编码的可行性,1. 数字图像本身的特征带来数据压缩的可行性 1)空域冗余 (空间冗余、几何冗余) 是一种与像素间相关性直接联系的数据冗余 2)时域冗余 (时间冗余) 视频序列每秒有25-30帧图像,连续播放,相邻帧之间的时间间隔很小;同时实际生活中的运动物体具有运动一致性,使得视频序列图像之间有
11、很强的相关性。,3)频域冗余 将空域的图像变换到频域中,使得大量的信息能用较少的数据来表示,从而达到压缩的目的。 4)信息熵冗余 图像中像素灰度出现的不均匀性,造成图像信息熵冗余。即用同样长度比特表示每一个灰度,则必然存在冗余。若将出现概率大的灰度级用长度较短的码表示,将出现概率小的灰度级用长度较长的码表示,有可能使编码总长度下降。,8.1.2 图像压缩编码的可行性,2应用环境允许图像有一定程度的失真 1)接收端图像设备分辨率较低,则可降低图像分辨率 2)用户所关心的图像区域有限,可对其余部分图像采 用空间和灰级上的粗化 3)根据人的视觉特性对不敏感区进行降分辨率编码 (视觉冗余),8.1.2
12、 图像压缩编码的可行性,图像无损压缩的原理,从原来的1638bit=284bit 压缩为:(1+3)8bit=32bit,8.1.2 图像压缩编码的可行性,图像有损压缩的原理,25,34,8.1.2 图像压缩编码的可行性,实际图像中冗余信息的表现,8.1.2 图像压缩编码的可行性,实际图像中冗余信息的表现,8.1.2 图像压缩编码的可行性,15K,图像冗余信息分析结论由于一幅图像存在数据冗余和主观视觉冗余,压缩方式从这两方面着手来开展,2)主观视觉冗余:忽略一些视觉不太明显的微小差异,可以进行所谓的“有损”压缩。,1)数据冗余:将图像信息的描述方式改变之后,压缩掉这些冗余。如统计冗余、空域冗余
13、、时域冗余等。,8.1.2 图像压缩编码的可行性,8.1.3 图像压缩编码的分类,压缩编码:在满足一定图像质量前提下,能获得减少数据量的编码,按压缩技术所依据和使用的数据理论和计算方法进行分类: 统计编码(Statistical Coding) 预测编码(Predict Coding) 变换编码(Transform coding),8.1.3 图像压缩编码的分类,冗余度压缩(Redundancy Reduction)完全除去或尽量除去原数据中重复和冗余的部分,保 证不丢失有用信息, 从而保证被压缩了的数据还原后与压缩前的原数据完全一致,称为无损压缩/可逆压缩,又称无失真编码,用于文本、程序等。
14、一般压缩比2,2按压缩过程的可逆性进行分类,熵压缩(Entropy Compression)不可逆,在其压缩过程中,会失掉一部分信息,又叫有损压缩。能取得较高的压缩比,8.1.3 图像压缩编码的分类,3按压缩方法进行分类,静图:静止图像(要求质量高)JPEG 动图:活动的序列图像/视频(相对质量要求低,压缩 倍数要高)MPEG,8.1.3 图像压缩编码的分类,从处理图像的维数出发 行内编码 帧内编码 帧间编码,从图像的光谱特征出发 单色图像编码 彩色图像编码 多光谱图像编码,从图像的灰度层次上 多灰度编码 二值图像编码,8.1.3 图像压缩编码的分类,8.1.4 压缩编码系统评价,图像编码压缩
15、术语 (1)熵每个信源输出的平均信息 按信息论中信源信息熵的定义: 出现的概率 H称为信源熵,它定义了观察到单个信源符号输出时所获得的平均信息量。如果信源各符号的出现概率相等,则上式的熵达到最大。,(2)平均码字长度:,8.1.4 压缩编码系统评价,(3)编码效率,(4) 压缩比 /压缩率,8.1.4 压缩编码系统评价,一般CR在开区间(0, )中取值,实际中常需要通过压缩减少数据量,所以CR应大于1。,其它图像压缩的技术指标:a保真度与用途有关,例如侦察与体育比赛关心的内容不同b误码扩散程度c实时性与压缩算法、系统速度有关d保密性传输中防止被盗,8.1.4 压缩编码系统评价,保真度准则,图像
16、压缩可能会导致信息损失,如去除心理,视觉冗余数据,需要评价信息损失的测度以描述解码图像相,对于原始图像的偏离程度,这些测度称为保真度准则,常用保真度准则分为两大类:,客观保真度准则主观保真度准则,客观保真度准则,当所损失的信息量可以用编码输入图像与编,码输出图像的函数表示时,它就是基于客观保真度准则的。,常用的两种客观保真度准则,均方根误差均方信噪比,主观保真度准则,2压缩编码系统评价 (1)基于压缩编码参数的基本评价,最佳编码:使平均码字长度R等于或很接近于熵H 霍夫曼编码 R H。 R H 会引起失真,丢失信息。 目的:减少R,使 编码效率1,8.1.4 压缩编码系统评价,例 码字 信息
17、Pk 0 0 u1 0.25 1 0 u2 0.25 1 1 u3 0.20 0 0 0 u4 0.150 0 1 0 u5 0.10 0 0 1 1 u6 0.05,8.1.4 压缩编码系统评价,8.1.4 压缩编码系统评价,8.2 预测编码(利用像素间的高相关性) 根据邻近的M个值预测当前值,当前值与预测值之差进行量化编码。(一维、二维、三维预测) 无损预测编码系统,无损预测编码系统预测误差解压图像的像素序列借助预测器可将原来对原始图像序列的编码转换成对预测误差的编码预测误差的动态范围会远小于原始图像序列的动态范围,8.2 预测编码,线性预测器1-D线性预测器一阶1-D线性预测器(前值预测
18、器),8.2 预测编码,预测器根据指定数量的以往样本来生成每个样本的预测值,并四舍五入为最接近的整数。,有损预测编码系统,8.2 预测编码,反馈环,有损预测编码系统,量化器插在符号编码器和预测误差产生处之,间,把原来无损编码器中的整数舍入模块吸收了进来,了有损预测编码中的压缩量和失真量,反馈环的输入是过去预测和与其对应的量化,误差的函数, 量化器将预测误差映射进输出 en 中,en 决定,n, f n en f,8.2 预测编码,德尔塔调制/DM编码简单的有损预测编码预测器量化器a是预测系数(一般小于等于1),c是1个正的常数 ,量化器的输出只有两个值(两级)。由DM方法得到的码率是1比特/像
19、素,DM编码的基本问题,(1)斜率过载 C远小于输入中的最大变化时 若遇到输入信号急剧变化时, 很难跟踪上 的变化,这时就会产生较大的误差,这种现象称为斜率过载。斜率过载现象将使图像中原陡峭轮廓变为缓变的轮廓,从而引起图像边缘的模糊。 解决斜率过载的有效办法是采用自适应增量编码法。,(2)颗粒误差 C远大于输入中的最小变化时 颗粒误差是信号平坦区间来回量化产生的, 表现在图像上为胡椒状颗粒噪声。 为了减小颗粒误差,可采取小量化台阶;但小量化台阶就不能精确地跟上快速上升信号的变化,出现斜率过载误差现象。利用自适应技术,不再采用固定量化台阶,根据输入信号情况的不同,自适应的调整量化台阶-自适应增量
20、编码系统(ADM),最佳线性预测如何设计一个最优的预测器,最佳线性预测如何设计一个最优的预测器,最优准则是最小化均方预测误差,设量化误差可以忽略,并用m个前值的线性组合进行预测。最优预测器设计的问题简化为如何选择m个预测系数以最小化下式的问题:,通常,预测系数的和要小于或等于1。,使预测器的输出落入允许的灰度值范围并减少噪声的影响,最佳线性预测 采用均方预测误差为最小值的准则的最佳线性预测编码即DPCM(差分脉冲编码调制)。对于图像来说,最佳线性预测的关键就是求出各个预测系数,使得预测误差最小,从而使得接收图像和原图像差别最小。定义下列4个预测器:,一阶自适应预测:保持边缘,原图和编码解码图的
21、差,三阶,误差随预测器阶数的增加而减少了,自适应预测编码 一个三阶预测器的预测值计算公式为: 现增加一个可变参数“k”,得,式中k是一个自适应参数,k的取值根据量化误差的大小自适应调整,最优量化,t=q(s)是s的奇函数断点定义了函数的不连续性,被称为量化器的判决和重构级,如果用最小均方量化误差 Es ti 作,最优量化,量化器的设计就是要在给定优化准则和,输入概率密度函数p(s)的条件下选择最优的si和ti,优化准则可以是统计的或心理视觉的准则,为准则,且p(s)是个偶函数,那么最小误差条件为,2,最优量化,根据信号局部区域的特点,自适应地修改和调整量化器参数,包括量化器输出的动态范围,量化
22、器判决电平(量化步长)等。实际上是在量化器分层确定后,当预测误差值小时,将量化器的输出动态范围减小,量化步长减小;当预测误差大时,将量化器的输出范围扩大,量化器步长扩大。,最小误差条件,较细量化缓慢变化区域,较粗量化快速变化区域,L层的Lloyd-Max量化器,最优量化针对单位方差拉普拉斯概率密度的Lloyd-Max量化器,步长(附加约束条件),游程编码霍夫曼编码算术编码,8.3 统计编码,统计编码是指建立在图像统计特性基础之上的一类压缩编码方法,根据信源的概率分布特性,分配不同长度的码字,降低平均码字长度,以提高传输速度,节省存储空间。,8.3 统计编码,原理:aaaa bbb cc d e
23、eeee fffffff (共228=176 bit) 4a3b2c1d5e7f (共128=96 bit),游程编码/行程编码(二值、灰度图像),用长度描绘黑色和白色像素的连续行程对从左到右扫描一行时所遇到的1或0的连接组,使用这些连接组的长度进行编码是传真编码的标准压缩方法(无损)缺点:像素频繁变化时,起源:电报码基本原理 将在图像中出现次数多的像素值给一个短的编码,将出现次数少的像数值给一个长的编码,平均码长最短。举例说明: aaaa bbb cc d eeeee fffffff (共228=176 bit) 4 3 2 1 5 7 f=00 e=10 a=110 b=1111 c=11
24、100 d=11101 110,110,110,110,1111,1111,1111,11100,11100,11101, 10,10,10,10,10,00,00,00,00,00,00,00 (共 72+52+43+34+25+15=63 bit),霍夫曼编码,步骤: 1) Pk由大到小排列 2)最小两个概率相加,形成一个新的概率集合,再 按1)重排,直至只有两个概率 3)分配码字,霍夫曼编码,霍夫曼编码,信源化简次数?编码分配次数?求平均码长?编码是否唯一?,解码通过查询表的方式完成例:编码串010100111100a3 a1 a2a2 a6,霍夫曼编码,解码唯一性、即时性当对大量符号进
25、行编码,构造霍夫曼编码比较复杂对J个信源符号,需要进行J-2次信源化简和J-2次编码分配(对256个灰度级图像,需要254次信源化简和254次编码分配),算术编码,从整个符号序列出发,采用递推形式连续编码在算术编码中,源符号和码字间没有一一对应关系1个算术码字要赋给整个信源符号序列,而码字本身确定0和1之间的一个实数区间。随着符号序列中的符号数量增加,用来代表它的区间减小而表达区间的信息单位数量变大算术编码过程只需用到加法和移位运算,a,b,c,d,0,.,0,1,.,0,a,b,c,d,0.2,0,.,0,a,b,c,d,0,.04,04,0.08,a,b,c,d,0,.,072,0,.,0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字图像 处理 第八 ppt 课件
链接地址:https://www.31ppt.com/p-1917001.html