数字图像处理课件.ppt
第十章 图象数据压缩10.1 概述1、图象数据压缩是为了检索、存储、传输的需要 图象经常用到搜索(查找分区、判别边界都要搜索)如何搜索算法。为了提高搜索速度涉及两个问题:存贮分式及存贮结构(图象的数据结构)。存贮方式有两大类:一类为文件管理系统下数据结构,即作为标准的数据文件;另一类为在系统的外部卷,即作为系统驱动程序下直接读写,其卷结构由设计者自己规定,这种结构的优点:1、空间节省(可更充分利用存贮介质);2、读写速度快。,2图象一大特点是数据量大,给存贮、传输带来困难,需压缩 例:电话线传输速率一般为56Kbits/s(波特率)一幅彩色图像51251224bit=6M bits大小。传一幅图象需2分钟左右。实时传送更难:51251224bits25帧/秒=150Mbits/S 如压缩20倍,传一幅图6秒左右,可以接受,实用。实时,要专用信道(卫星、微波网、专线网等技术);另外,大量资料需存贮遥感、故宫、医学CT、MR,需要压缩。,图像数据可压缩性分析:从统计观点出发,简单直观地讲,就是某一象素的灰度值,总是和周围其他象素灰度值有某种关系,应用某种编码方法提取并减少这些相关特性,便可实现图象信息的数据压缩。图象数据压缩的目的可以是节省图象存贮器容量,也可以是减少传输信道容量,还可以是为了缩短图象加工处理的时间。,编码例子:8个灰级,总计64*64=4096像素的图像,编码1 平均码长:3bits;编码2 平均码长:2.7bits,(1)压缩方法:按时间分:静图:静止图象(要求质量高)动图:活动的序列图象(相对质量要求低,压缩倍数要高)压缩比未压缩的图象的存贮字节数压缩后图象存贮字节数 按失真与否分:无失真压缩:经压缩后再恢复图象与原图象无任何区别,一般 压缩倍数 2 有限失真压缩:单帧(静)420倍。图象序列(x、y、t)50200倍,(2)压缩失真度衡量标准:a客观:输出与输入之差:e(x,y)=g(x,y)f(x,y)整图差:均方差:量纲:灰度级。,也可将输出与输入之差看作噪声,此时:输出图象均方信噪比定义为:g2(x,y)/e2(x,y),常用:峰值信噪比,一般2,或 PSNR40dB 人眼看不出来 30 dB 的图象不能用 35dB 可接受 到目前为上,很难找出一个通用的评价图象压缩的客观标准,仍然是很好的研究课题,b主观(人判别)专家投票的方法,实用。人的视觉的主观亮度是光强的对数函数。人眼对黑暗区误差比明亮区更敏感。人眼对灰度突变边缘比较敏感。,(3)图象压缩的技术指标:a保真度与用途有关,例如侦察与体育比赛关心内容不同b压缩比:原图象数据量压缩后数据量或0.3bit/pixelc误码扩散程度d实时性与压缩算法、系统速度有关e保密性传输中防止被盗,SPOT 是数据需解码(高明压缩方法,压缩后仍是一幅图)数字水印技术(信息安全)watermarking,10.2 四叉树(金字塔pyramid或Quad tree)适用于N=2n 图象 四叉树:,0层 1层 2层 n层象素数:40 41 42 4n,四叉树全部保留,总数据量为:,全分辨率图:4n点数,数据量增加1/3,对搜索有好处,找到有关兴趣区域后再提取感应趣的下一层图象。,10.3 信息有关的基本概念1信息的度量:7月份天气报:“明天下雨”,信息量小 10月份天气报:“明天下雪”小概率事件发生,信息量大即:概率低信息量大 概率高信息量小怎么定量?戈壁滩一年下雨概率1/128,睛概率127/128。对天气预报的信息量多少?引入-log2p 代表信息量 如:-log21/128=7 有雨-log2127/128 0 晴,信息具有可加性:一个99方阵,一个士兵在某一位置的概率1/81,信息=-log21/81=6.34 在特定行上的概率1/9:信息=-log21/9=3.17 在特定列上的概率1/9:信息=-log21/9=3.17 行、列信息量和:3.17+3.17=6.34引入一个信息度量 I(P)特点:0 p P2,I(P2)I(P1)I(p q)=I(p)+I(q)I(P)=-logbp 一般 b=2,2信息熵(Entropy)预期能得到的平均信息量,I(Pi)的数学期望值。对于M个灰阶:Pi i=1,2,.,M,例1,当Pi=1/4,i=1,2,3,4 H=2 当P1=1/2,P2=1/4,P3=P4=1/8 H=1.75,例2,二值图象,xi=0,1 0值概率:p 1值概率:1-p,H p 变化关系可以发现,当 p=0.5时熵最大。,一般讲,对M个灰值:,求H的条件极值,即:,当 M=256时,Hmax=8注意熵 H 的特点:H 0 Hmax=log2M H Hmax,10.4 可逆保真编码(无失真压缩)熵:平均信息量一般图象压缩模式:,代表:孤立地考察每个象素点出现概率。,注意:恰当做变换熵可以减小。例:(板书)熵变小,把信息转移到变换模型中(高阶熵概念)(举例:降低比特位问题)结论:不作变换时无失真编码压缩极限是熵,一幅图(8*8*3bits)4 4 4 4 4 4 4 0 4 5 5 5 5 4 5 04 5 6 6 6 4 5 04 5 6 7 6 4 5 04 5 6 6 6 4 5 04 5 5 5 5 4 5 04 4 4 4 4 4 4 0 4 4 4 4 4 4 4 0,灰度 频数 概率 熵0 8 0.125 0.3751 0 0 02 0 0 03 0 0 04 31 0.484 0.5075 16 0.25 0.506 8 0.125 0.375 7 1 0.016 0.096和 64 1.0 1.853,1Huffman码紧凑编码n个由(m1mn)信息,概率为P1Pn,基本思想:对概率大的信息分配短码,小的分配长码。步骤:先作直方图统计,按出现概率由大到小排队。而后反向编码:概率大的赋0,概率小的赋1。实现:可以按块、按总体统计或自适应边统计边修正。特点:此码变长,不易实现,当概率变,则编码方式亦变化。,2B码:每个码分成两部分,即延续比特和信息比特。分割码字 代表有效信息CCCC(:0或1表示)C 相同的表示同一个码字 C 变号表示前一个码字结束。3移位码 2位码可有00,01,10,而11作为移位码,超过3的倍数用11 的次数表之。,4行程编码(Run-Length Coding)由灰度长度对组成,即(灰度,长度),根据前图按垂直方向扫描,可编为:(4,9)(5,5)(4,3)(5,1)(6,3)(5,1)(4,3)(5,1)(6,1)(7,1)(6,1)(5,1)(4,3)(5,1)(6,3)(5,1)(4,3)(5,5)(4,10)(0,8)结果:64个数据压成到40个。,通常扫描走向:,另一种扫描方向线选取,Helbert曲线行程编码。递归算法:A:D A A B B:C B B A C:B C C D D:A D D C,D,D,D,A,C,1级,2级,对前图用Helbert曲线扫描结果:4 4 5 4 4 4 5 5 6 6 7 6 5 5 4 4 4 5 5 4 4 4 4 4 4 4 4 4 5 5 6 6 6 5 5 5 4 4 4 4 4 4 0 0 0 4 4 0 0 0 4 4 5 6 6 5 5 5 4 4 4 4 0 0得:(4,2)(5,1)(4,3)(5,2)(6,2)(7,1)(6,1)(5,2)(4,3)(5,2)(4,9)(5,2)(6,3)(5,3)(4,6)(0,3)(4,2)(0,3)(4,2)(5,1)(6,2)(5,3)(4,4)(0,2)242=48目前算术编程码效率最高,计算量大,10.5 有限失真编码1插值编码 量化:灰度分辨率 采样:空间分辨率 仅保留*部分灰值其它部分值求得:,*o*o*o*o*o*o*o*o*o*o*o*o*o*o,*s3*o*s1 s0 s2*s4,2按块取齐编码 将NN图像分成MM大小之块,MN然后分别对每个MM块内之数据压成一位长,按力矩不变原则选阈值并二值化而得到,同时还需保留恢复力矩必须的信息。步骤:由中值分割成二值图,由一、二次力矩计算出分别之A,B值,保留二值图像及f,。例:,原图 114 56 47 37 200 247 255 16 0 12 169 43 5 7 251,恢复后图204 204 17 17 17 204 204 204 17 17 17 204 17 17 17 204,二值图 1 1 0 0 0 1 1 1 0 0 0 1 0 0 0 1,小范围内恢复后的灰度值近似取为一样,看不出差别,主要特征保留。优点:按块等长编码,防误码扩散。缺点:四行才能计算,需要行存贮。,3变换域编码 概念:将空间域里的图象,经过某种变换(通常用正交变换,如付氏变换,沃尔什变换等),在某种变换域里描述,一般来说,在变换域里描述要比空间域里简单,而且图象相关性明显下降,这样变换本身就能实现编码率的压缩。若再对变换域图象进行某种处理(如频域中的二维滤波)以及熵编码,则可进一步压缩图象的编码比特率。对变换处理后的图像信号施以上述的反变换,即可获得空间域图象。变换目的是去相关、相邻象素相关性强。变换运算量与N2成正比。一般N取88块或1616块(块小压缩倍数少,没意义;块大,相关性弱)。,4预测编码:由前m点预测当前点,存预测值与实际值的差值典型:相邻象素灰值相减,存差值。预测结果:多米诺骨牌,误码扩散严重。分块后边缘损失。,5矢量编码 简化描述:全图n个点,有A0 A1 A2 An,有m 个组,近似归纳为有限个模式,如 k 组,全图有 n/m 组,n/m k,存 k 组+n/m 个组号。,10.6 图象帧间编码 序列图象(动图)帧间相关性强1静止运动部分的关系:Bell实验室研究成果,人对静止部分分辨率强,对运动部分分辨率弱要求不高。即:空间分辨率高,时间分辨率低一些。2传送帧间差对帧间差压缩传输,两幅之间对应象素的灰度差 小于某一阈值,取为零。3运动检测:图象分成一定大小的块(MN 1616)子块,在(M+2L,N+2L)范围内到前一帧图上搜索与某相关性最大的子块。相关函数:,10.7 JPEG与MPEG(Joint Photographic Expert Group,Motion Picture Expert Group)1990年代初期制定。1JPEG:19871991年初制定的一系列标准。基本方案:,DCT:88块做DCT变换,统计分析表明,图象局域相关性较强。量化:人的感觉对低频敏感,各系数对人眼的重要程度区别对待,即非均匀量化。沿长编码:(锯齿形编码)后半很多都是零有利编码。88块,每块做DCT直流分量,按块作预测编码,交流分量量化后作延长编码。对沿长编码结果作Huffman编码。,多波段问题:地物波谱224波段,彩色R、G、B三波段,各波段间存在相关性,如彩色,人眼对亮度最敏感,对颜色分辨率较弱。R、G、B)亮度、色调、饱和度(理论:主分量分解最佳)R、G、BY.U.V(PAL西德)Y.I.Q(NTSC 美国),2MPEG压缩(1、2、4)基本思想:帧间编码:第一帧用JPEG(帧内编码),隔8帧有一帧作帧内编码1,9,17,25,.P帧做预测编码,用前后两帧(1,9)作预测。例:开窗与否。双向预测、运动检测,希望误差小。双向补插:2,3,4可由1,5两帧按时间线性插值得到。压缩后存贮顺序:1,9,5,2,3,4,6,7,8其它压缩方法:分形、小波等。,