数字图像的压缩编码.ppt
第8章 数字图像的压缩编码,8.1 概述 8.2 预测编码 8.3 统计编码 8.4 变换编码 8.5 位平面编码 8.6 静止图像压缩编码实例 8.7 图像压缩的国际标准简介,8.1 概述,8.1.1 幅度特征8.1.2 直方图特征8.1.3 变换系数特征,数字图像处理过程,图像变换,图像增强,灰度分割,边缘检测,区域分割,图像特征,图像恢复,图像描述,图像分析,8.1 概述,问题1:数字图像的特点?数据量大:5125128bit256KB 256KB25帧/秒6400KB=6.25MB占用的频带较宽:电视图像的带宽56MHz,而语言带宽4KHz,频带越宽,技术实现难度越大像素相关性大:压缩潜力大评价受人的影响大(军标),8.1 概述,图像的特点 数据量大,为其存储、传输带来困难,需压缩 例:电话线传输速率一般为56kbit/s(波特率)一幅彩色图像64048024bit=7Mbit大小 1传输一幅图像:时间约2分钟左右 如压缩20倍,传一幅图6s左右,可以接受,实用 2实时传送:64048024bit25帧/s=175Mbit/s,时间为50min左右,8.1 概述,实时,要专用信道(卫星、微波网、专线网等技术)另外,大量资料需存储(遥感、医学CT、MR),4如果以200bpi的分辨率传输,一张A4稿纸内容的数 据量为(200210/25.4)(200297/25.4bit)=3866948 bit,需要传送的时间是67s,340G硬盘,40000MB8175Mbit/s=约30min,8.1 概述,图像的数据量特别大,同时现在对图像需求的增长超过了网络带宽的限制,所以压缩是图像传输和存储的一个关键技术由于图像压缩的巨大商业潜力,激励着人们提高现有的技术或发现新的技术,8.1.1 图像压缩编码的必要性,火星腐蚀.jpg400400,10.9KB,原图像数据468KB,debbie.bmpBMP是一种与设备无关的位图格式。256256,65KB 一般采用非压缩模式,8.1.1 图像压缩编码的必要性,2000年5月植被指数遥感图.bmp,原图像数据9767202MB,8.1.1 图像压缩编码的必要性,Buaa.jpg,0.98MB,原图像数据190015608.5MB,8.1.1 图像压缩编码的必要性,Water.tiff,640480,905KB,无损,8.1.1 图像压缩编码的必要性,GIF(Graphics Interchange Format)是由为了方便网络传送图像数据而制定的一种图像文件格式,主要采用无损数据压缩方法中压缩效率较高的LZW(字典压缩)算法。214155 12帧 43.1KB原图像数据1166KB,8.1.1 图像压缩编码的必要性,PNG是Fireworks的文件格式,专门针对网页设计的一种无损压缩图像文件格式。PNG使用从LZW派生的无损数据压缩算法。1024768 1.62MB 原图像数据2.36MB,8.1.1 图像压缩编码的必要性,AVI(Audio Video Interleave)同样是以AVI为后缀的视频文件,其采用的压缩算法可能不同,需要相应的解压软件才能识别和回放该AVI文件 AVI文件目前主要应用在多媒体光盘上,用来保存电影、电视等各种影像信息,有时也出现在Internet上,供用户下载、欣赏新影片的精彩片断。,视频大小:1280720 帧率:29.915fps 持续时间:30.854s 总帧数:923f原始码流:661672kbit/s 视频平均码流:4644kbit/s 压缩比:142.5,8.1.1 图像压缩编码的必要性,ASF是ADVANCED STEAMING FORMAT的缩写。它是一种采用流式传输方式在Internet播放的媒体格式,它可以将整个媒体文件分压成一个个的数据包,再由视频服务器向用户计算机进行连续、实时的传送。,视频大小:640480 帧率:25fps 持续时间:32.04s 总帧数:801f原始码流:184320kbit/s 视频平均码流:847kbit/s 压缩比:217.6,8.1.1 图像压缩编码的必要性,WMV是一种ASF格式升级延伸来得。在同等视频质量下,WMV格式的体积非常小,因此很适合在网上播放和传输。WMV格式的主要优点包括:本地或网络回放、可扩充的媒体类型、部件下载、可伸缩的媒体类型、流的优先级化、多语言支持、环境独立性、丰富的流间关系以及扩展性等。,视频大小:640480 帧率:23.976fps 持续时间:40.04s 总帧数:960f原始码流:176770kbit/s 视频平均码流:828kbit/s 压缩比:213.5,8.1.1 图像压缩编码的必要性,RM格式:Real Networks公司所制定的音频视频压缩规范称为Real Media,主要用来在低速率的广域网上实时传输活动视频影像,可以根据网络数据传输速率的不同而采用不同的压缩比率,从而实现影像数据的实时传送和实时播放。优点:可以把比较大的电影压缩成比较小的文件。缺点:文件模糊不清,没有收藏价值。,8.1.1 图像压缩编码的必要性,RMVB格式:这是一种由RM视频格式升级延伸出的新视频格式,比RM多了VB两字,在这里VB是VBR(Variable Bit Rate-可变比特率)的缩写。打破了原先RM格式那种平均压缩采样的方式,在保证平均压缩比的基础上合理利用比特率资源,在保证了静止画面质量的前提下,大幅地提高了运动图像的画面质量。要想播放这种视频格式,可以使用RealOne Player2.0或RealPlayer8.0加RealVideo9.0以上版本的解码器形式进行播放。,视频大小:640256 帧率:25fps 持续时间:28.48s 总帧数:712f 原始码流:98304kbit/s 视频平均码流:605.7kbit/s 压缩比:162.3,8.1.1 图像压缩编码的必要性,MOV是美国Apple公司开发的一种视频格式,播放器是QuickTime Player。具有较高的压缩比率和较完美的视频清晰度等特点。MOV也可以作为一种流文件格式。QuickTime能够通过Internet提供实时的数字化信息流、工作流与文件回放功能,视频大小:480288 帧率:23.98fps 持续时间:90.05s 总帧数:2159f原始码流:79546.6kbit/s 视频平均码流:616.58kbit/s 压缩比:129.0,8.1.1 图像压缩编码的必要性,图像通信系统模型,8.1.1 图像压缩编码的必要性,总之,大数据量的图像信息会给存储器的存储容量、通信干线信道的带宽以及计算机的处理速度增加极大的压力。单纯靠增加存储器容量,提高信道带宽以及计算机的处理速度等方法来解决这个问题是不现实的,这时就要考虑压缩。因此,图像数据在传输和存储中,数据的压缩都是必不可少的。,8.1.1 图像压缩编码的必要性,图像压缩编码的可能性,1.数字图像本身的特征带来数据压缩的可能性 1)空域冗余 也称为空间冗余或几何冗余,是一种与像素间相关性直接联系的数据冗余 2)时域冗余 又称时间冗余。视频序列每秒有25-30帧图像,连续播放,相邻帧之间的时间间隔很小;同时实际生活中的运动物体具有运动一致性,使得视频序列图像之间有很强的相关性,3)频域冗余 将空域的图像变换到频域中,使得大量的信息能用较少的数据来表示,从而达到压缩的目的 4)信息熵冗余 图像中像素灰度出现的不均匀性,造成图像信息熵冗余。即用同样长度比特表示每一个灰度,则必然存在冗余。若将出现概率大的灰度级用长度较短的码表示,将出现概率小的灰度级用长度较长的码表示,有可能使编码总长度下降,图像压缩编码的可能性,2应用环境允许图像有一定程度失真 1)接收端图像设备分辨率较低,则可降低图像分辨率 2)用户所关心的图像区域有限,可对其余部分图像采 用空间和灰级上的粗化 3)根据人的视觉特性对不敏感区进行降分辨率编码(视觉冗余),图像压缩编码的可能性,图像中数据冗余的例子你的妻子,Helen,将于明天晚上6点零5分在上海的虹桥机场接你。(23*2+10=56个半角字符)你的妻子将于明天晚上 6点零5分在虹桥机场接你。(20*2+3=43个半角字符)Helen将于明晚6点在虹桥机场接你。(10*2+7=27个半角字符),8.1.2 图像压缩编码的可能性,描述语言1“这是一幅 22的图像,图像的第一个像素是红的,第二个像素是红的,第三个像素是红的,第四个像素是红的”。,2“这是一幅22的图像,整幅图都是红色的”,整理图像的描述方法可以达到压缩的目的,8.1.2 图像压缩编码的可能性,图像无损压缩的原理,从原来的1638bit=284bit 压缩为:(1+3)8bit=32bit,8.1.2 图像压缩编码的可能性,图像有损压缩的原理,25,34,8.1.2 图像压缩编码的可能性,实际图像中冗余信息的表现(灰度图),8.1.2 图像压缩编码的可能性,图像冗余信息分析结论由于一幅图像存在数据冗余和主观视觉冗余,压缩方式从这两方面着手来开展,2)主观视觉冗余:忽略一些视觉不太明显的微小差异,可以进行所谓的“有损”压缩,1)数据冗余:将图像信息的描述方式改变之后,压缩掉这些冗余。如统计冗余度、空域冗余度、时域冗余度等,8.1.2 图像压缩编码的可能性,图像压缩编码的分类,图像数字化关键是编码 压缩编码:在满足一定图像质量前提下,能获得减少数据量的编码,研究处理的对象 数据的物理容量 传输某个指定数据序列所需的时间 传输某个指定数据序列所限定的频带宽度,8.1.3 图像压缩编码的分类,按压缩技术所依据和使用的数据理论和计算方法进行分类:统计编码(Statistical Coding)预测编码(Predict Coding)变换编码(Transform coding),图像压缩编码的分类,冗余度压缩(Redundancy Reduction)完全除去或尽量除去原数据中重复和冗余的部分,保 证不丢失有用信息,从而保证被压缩了的数据还原后与压缩前的原数据完全一致,可逆压缩又称无失真编码,用于文本、程序等。,2按压缩过程的可逆性进行分类,熵压缩(Entropy Compression)不可逆,在其压缩过程中,会失掉一部分信息,又叫有损压缩,8.1.3 图像压缩编码的分类,3按压缩方法进行分类,静图:静止图像(要求质量高)动图:活动的序列图像(相对质量要求低,压缩 倍数要高),图像压缩编码的分类,4按失真与否进行分类 无失真压缩:经压缩后再恢复图像与原图像无任何区别,一般压缩倍数 2 有限失真压缩:单帧(静)420倍。图像序列(x、y、t)50200倍,8.1.3 图像压缩编码的分类,7从处理图像的维数出发 行内编码 帧内编码 帧间编码,5从图像的光谱特征出发 单色图像编码 彩色图像编码 多光谱图像编码,6从图像的灰度层次上 多灰度编码 二值图像编码,图像压缩编码的分类,压缩编码系统评价,1图像编码压缩名词术语(1)熵(Entropy)按信息论中信源信息熵的定义:出现的概 率 H表示其像素灰度比特数的统计平均值,即给出了对此输入灰度级集合进行编码时所需要的平均位数的下限。,(2)平均码字长度:,压缩编码系统评价,(3)编码效率,(4)压缩比,压缩编码系统评价,其它图像压缩的技术指标:a保真度与用途有关,例如侦察与体育比赛关心 内容不同b误码扩散程度c实时性与压缩算法、系统速度有关d保密性传输中防止被盗,8.1.4 压缩编码系统评价,2压缩编码系统评价(1)基于压缩编码参数的基本评价,最佳编码:使R等于或很接近于H,霍夫曼编码 R H。R H引起失真,丢失信息。目的:减少R,使 1,r0,压缩编码系统评价,例 码字 信息 Pk 0 0 u1 0.25 1 0 u2 0.25 1 1 u3 0.20 0 0 0 u4 0.150 0 1 0 u5 0.10 0 0 1 1 u6 0.05,压缩编码系统评价,压缩编码系统评价,(2)基于保真度准则的评价 1)客观保真度准则:a)输入图和输出图之间的均方根(rms)误差,b)输入图和输出图的均方根信噪比,压缩编码系统评价,一般2,或PSNR40dB 人眼看不出来PSNR 30 dB 的图像不能用PSNR 在35dB 左右可接受到目前为止,国际上没有一个通用的评价图像压缩的客观标准,压缩编码系统评价,2)主观保真度准则:a)损伤程度:不能察觉、刚察觉、不讨厌、有点讨厌、很讨厌,不能用 b)质量:优、良、中、次、劣 c)比较:2,好的多;1,好;0,同;1,坏;2 坏的多,主观(人判别)专家投票的方法,实用方法。人的视觉的主观亮度是光强的对数函数。人眼对黑暗区误差比明亮区更敏感。人眼对灰度突变边缘比较敏感。,压缩编码系统评价,8.2.1 预测编码的基本原理8.2.2 DPCM编码8.2.3 M编码,8.2 预测编码,8.2 预测编码,预测编码的基本原理 邻近的M个值预测当前值,当前值与预测值之差量化编 码,(一维、二维、三维预测),DPCM编码,1.DPCM系统的基本原理(差分脉冲编码调制),量化器,编码器,预测器,十,解码器,预测器,十,DPCM原理框图,传输信道,2预测编码的类型,邻近的M个值预测当前值,当前值与预测值之差量化编码,(一维、二维、三维预测),DPCM编码,3最佳线性预测 采用均方误差(MSE)为极小值的准则来获得DPCM,称为最佳线性预测,亦即此时预测误差最小。对于图像来说,最佳线性预测的关键就是求出各个预测系数,使得预测误差最小,从而使得接收图像和原图像差别最小。,DPCM编码,4自适应预测编码(1)自适应预测 一个三阶预测器的预测值计算公式为:现增加一个可变参数“k”,得,式中k是一个自适应参数,k的取值根据量化误差的大小自适应调整,DPCM编码,(2)自适应量化,根据信号局部区域的特点,自适应地修改和调整量化器参数,包括量化器输出的动态范围,量化器判决电平(量化步长)等。实际上是在量化器分层确定后,当预测误差值小时,将量化器的输出动态范围减小,量化步长减小;当预测误差大时,将量化器的输出范围扩大,量化器步长扩大,DPCM编码,M编码,1M编码的基本原理,a)编码器原理框图,b)译码器原理框图,M编码,2.M编码的基本问题,(1)斜率过载误差 若遇到输入信号急剧变化时,很难跟踪上 的变化,这时就会产生较大的误差,这种现象称为斜率过载。斜率过载现象将使图像中原陡峭轮廓变为缓变的轮廓,从而引起图像边缘的模糊。解决斜率过载的有效办法是自适应增量编码法,M编码,(2)颗粒误差 颗粒误差是信号平坦区来回量化产生的,表现在图像上为胡椒状颗粒噪声 为了减小颗粒误差,可采取小量化台阶;但小量化台阶就不能精确地跟上快速上升信号的变化,出现斜率过载误差现象。利用自适应技术,不再采用固定量化台阶,根据输入信号情况的不同,自适应的调整量化台阶-自适应增量编码系统(ADM),M编码,8.3.1 游程长度编码8.3.2 霍夫曼编码8.3.3 算术编码,8.3 统计编码,8.3 统计编码,统计编码是指建立在图像统计特性基础之上的一类压缩编码方法,根据信源的概率分布特性,分配不同长度的码字,降低平均码字长度,以提高传输速度,节省存储空间。,游程长度编码,举例说明:aaaa bbb cc d eeeee fffffff(共228=176 bit)4a3b2c1d5e7f(共128=96 bit),霍夫曼编码,基本原理 将在图像中出现次数多的像素值给一个短的编码,将出现次数少的像数值给一个长的编码。举例说明:aaaa bbb cc d eeeee fffffff(共228=176 bit)4 3 2 1 5 7 f=0 e=10 a=110 b=1111 c=11100 d=11101 110,110,110,110,1111,1111,1111,11100,11100,11101,10,10,10,10,10,00,00,00,00,00,00,00(共 72+52+43+34+25+15=63 bit),步骤:1)Pk由大到小排列 2)最小两个概率相加,形成一个新的概率集合,再 按1)重排,直至只有两个概率 3)分配码字,霍夫曼编码,灰度级 pk step1 step2 step3 step4 step5 step6 W1 0.40 0.40 0.40 0.40 0.40 0.40 0.6 1 1 1 1 1 1 0 W2 0.18 0.18 0.18 0.19 0.23 0.37 0.4 001 001 001 000 01 00 1 W3 0.10 0.10 0.13 0.18 0.19 0.23 011 011 010 001 000 01 W4 0.10 0.10 0.10 0.13 0.18 0000 0000 011 010 001 W5 0.07 0.09 0.10 0.10 0100 0001 0000 011 W6 0.06 0.07 0.09 0101 0100 0001 W7 0.05 0.06 00010 0101 W8 0.04 00011,Huffman 编码过程示意图,霍夫曼编码,霍夫曼编码,算术编码,a,b,c,d,0,.,0,1,.,0,a,b,c,d,0.2,0,.,0,a,b,c,d,0,.04,04,0.08,a,b,c,d,0,.,072,0,.,056,a,b,c,d,0.0688,0,.,0624,0.06752,a,b,c,c,d,输入字符,8.4.1 变换编码的基本原理8.4.2 变换编码特性评价8.4.3 变换编码中主要解决的问题8.4.4 变换编码的特点及应用,8.4 变换编码,8.4 变换编码,变换编码基本原理,变换编码特性评价,1残余相关准则 变换域内变换系数具有的相关性称为残余相关性,它代表经过正交变换后图像相关性被削弱的程度2均方误差准则 均方误差准则是一种将解码后的重建图像与未经压缩的原始图像之间的均方误差作为衡量各种正交变换效果的准则 3主观评价准则 主观评价就是以人眼能感觉出来的图像质量的好坏和可接受性作为标准进行的评价。,变换编码中主要解决的问题,图像变换编码中主要解决的问题如下1选择变换方法2确定子块图像的大小3变换系数的编码,变换编码的特点及应用,思想 正变换得到的系数矩阵中,数值较大的方差总是集中在少数系数中。通常,大幅度系数集中在低频率区,而且图像相关性明显下降,对较少的系统可分配少的比特数或不传送。故正交变换本身只是把分布在变换域中的信息变得集中起来,为合理少分配给某些数据比特数提供了可能 块状效应 块状效应是指当压缩比提高到一定程度后,在相邻图像块的边界处,会出现可见的不连续性,这会使观察者有非常不舒服的感觉,块分割,正交变换,量化,编码,解码,反变换,输入,88,1616样本,变换,确定区域取样与阈值取样决定变换系数的取舍,8.4.4 变换编码的特点及应用,8.5.1 位平面分解8.5.2 位平面编码,8.5 位平面编码,8.5 位平面编码,位平面分解 位平面分解就是指将一幅具有m bit灰度级的图象分解 成m幅1bit的二值图象。可以采用如下多项式:,来表示具有mbit灰度级的图像中像素的灰度值。根据上述多项式把1幅灰度图分解成一系列二值图集合的1种简单方法就是把上述多项式的m个系数分别分到m个1 bit的位平面中,固有缺点:是像素点灰度值的微小变化有可能对位平面的复杂度产生明显的影响.为减少这种灰度值微小变化的影响,可用1个mbit的灰度码来表示图像。灰度码可由下式计算:,8.5.1 位平面分解,8.5.2 位平面编码,位平面分解之后,每个位平面都是二值图像,编码方法有1-D游程编码,2-D游程编码,常数块编码和边界跟踪编码等方法,二值图像位平面图,灰度变码位平面图,8.6.1 JPEG基本系统8.6.2 应用举例8.6.3 编码比特率的控制,8.6 静止图像压缩编码实例,8.6 静止图像压缩编码实例,JPEG基本系统 JPEG标准主要采用了基于块的DCT变换编码,综合利用了以上谈到的游程编码、霍夫曼编码等方法,JPEG有损压缩算法编码的流程如图所示,原始图像数据,FDCT,系数编码,量化,量化表,码表,图像分割,压缩的图像数据,系数编码,逆量化,IDCT,量化表,码表,图像拼接,解压的图像数据,JPEG基本系统框图,8.6.1 JPEG基本系统,不同的应用目的,需要不同的编码质量或编码比特率,另外,JPEG编码的输出比特率将随图像局部的特性而变化,而大多数的传输信道是固定比特率的。为此,要求能够控制JPEG的编码质量或编码比特率,以满足用户或信道的需要。,8.6.3 编码比特率的控制,8.7.1 静止图像压缩标准8.7.2 视频压缩编码标准,8.7 图像压缩的国际标准简介,8.7 图像压缩的国际标准简介,用于压缩静止(灰度、彩色)图像用于压缩序列(灰度、彩色)图像,1JPEG 1991年提出,可适用于所有连续色调的静止图像压缩和存储,JPEG定义了三种编码系统:1)基于DCT的有损编码基本系统,可用于绝对多数压 缩应用场合 2)用于高压缩比,高精确度或渐进重建应用的扩展编 码系统 3)用于无失真应用场合的无损系统,静止图像压缩标准,Huffman,静止图像压缩标准,JPEG编码的总体框架,静止图像压缩标准,2JPEG2000 基于小波变换的压缩技术。JPEG2000增加了新功能,目标:是进一步改进目前压缩算法的性能,以适应低带宽、高噪声的环境,以及医疗图像、电子图书馆、传真、Internet网上服务和提供知识产权保护等方面的应用。运用新标准不仅能提高对图像的压缩质量,尤其是低码率时的压缩质量,而且还将得到许多增加了的功能,包括根据图像质量,视觉感受和分辨率进行渐进传输,对码流的随机存取和处理,开放结构,向下兼容等。,静止图像压缩标准,1H.261(H.263)为电视会议等应用而定。也称p64标准(p1,2,3),码流64,128,1920kbit/s,它允许通过T1线路(带宽1.544Mbit/s)以小于150ms的延迟传输运动视频。它将基于DCT的压缩方法进行了扩展,并将帧间冗余的方法包含进来,视频压缩编码标准,步骤:1)对序列中的某参考帧用类似于JPEG的DCT压缩,以减少帧内冗余度 2)估计目标的运动(通过计算当前帧与下一帧间的相关),以确定如何压缩下一帧以减少帧间冗度。,8.7.2 视频压缩编码标准,2MPEG-1(1992年)是一种视频压缩标准,主要用于数字媒体上压缩图像数据的存储和提取,此标准无具体的编码程序,而只是确定了一个标准的编码码流和对应的解码器,允许比T1更高的码率和质量,视频压缩编码标准,3MPEG-2 MPEG-2是继MPEG-1之后推出的视频压缩标准,是面向高质量数字电视的压缩标准。MPEG-2可以说是MPEG-1的扩充,因为它们的基本编码算法都相同。但MPEG-2增加了许多MPEG-1没有的功能,例如:运动补偿既可以基于帧也可以基于场;运动向量的精确度提高到半个像素;离散余弦变换中可选择精度;超前预测模式;质量伸缩性(在同一视频流中可容忍不同质量的图像);增加了隔行扫描电视的编码等。,8.7.2 视频压缩编码标准,4MPEG-4 目标:音频、视频AV:如静止图像、序列图像、计算机图形、3D模型、动画、语言、声音等进行统一有效的编码 MPEG4建立在数字电视,交互图形和万维网www上,为了适应在窄带宽(64kbit/s)通信线路上对动态图像进行传输的要求,视频压缩编码标准,ITU视频压缩编码标准,续上表,作业,8-1 试叙述压缩算法分类?所讲算法的特点?8-2 设某一图像,88,灰度分布如下:,4 4 4 4 4 4 4 04 5 5 5 5 5 4 04 5 6 6 6 5 4 04 5 6 7 6 5 4 04 5 6 7 6 5 4 04 5 5 5 5 5 4 04 4 4 4 4 4 4 04 4 4 4 4 4 4 0,进行huffman编码,计算熵、平均码字长度、冗余度、编码效率和压缩比,8-3 客观保真度准则和主观保真度准则各有什么特点?8-4 数字图像特点?8-5 图像压缩可通过哪两种冗余进行压缩?8-6 解释概念:熵、平均码字长度、编码效率、冗余度、压缩比8-7 简述行程编码、Huffman编码、DPCM、子波编码的原理,作业,