第6章图像编码(压缩)课件.ppt
第6章 图像编码(压缩)Image Coding,第2页,第6章 图像编码,第6章 图像编码,动机/原因:表达数字图像所需数据量通常很大图像编码:采用对图像的新的表达方法以减小所需的数据量数据和信息:数据是信息的载体对给定量的信息可用不同的数据量来表示 对给定量的信息,设法减少表达这些信息的数据量称为数据压缩图像压缩(编码)和图像解压缩(解码),第3页,第6章 图像编码,第9章 图像编码,图像压缩方法的分类 :信息保存型:在压缩和解压缩过程中没有信息损失压缩率一般在2 10之间信息损失型:常能取得较高的压缩率(几十几百)压缩后并不能经解压缩恢复原状,第4页,第6章 图像编码,第6章 图像编码,6.1 基本概念 6.2 基础理论 6.3 无损编码 6.4 有损编码 6.5 国际标准,第5页,第6章 图像编码,6.1 基本概念,6.1.1 数据冗余 6.1.2 图像保真度和质量 6.1.3 图像编码模型,第6页,第6章 图像编码,6.1.1 数据冗余,数据冗余的概念数据是信息的载体同量的数据可表达不同量的信息同量的信息可用不同量的数据表达冗余数据表达了无用的信息数据表达了已表达的信息,第7页,第6章 图像编码,6.1.1 数据冗余,相对数据冗余数据冗余可定量描述,相对冗余:压缩率: , CR 在开区间 (0, ) 中取值n1 和 n2 代表2个数据集合中的信息载体单位的个数,第8页,第6章 图像编码,6.1.1 数据冗余,数据冗余类别(1) 编码冗余与灰度分布的概率特性有关(2) 像素相关冗余空间冗余,几何冗余(3) 心理视觉冗余与主观感觉有关 减少/消除其中的一种/多种冗余,就能取得数据压缩的效果,第9页,第6章 图像编码,6.1.1 数据冗余,1. 编码冗余编码:建立码本来表达数据码本:用来表达一定量的信息或一组事件所需的一系列符号(如字母、数字等)码字:对每个信息或事件所赋的码符号序列码字的长度(字长):每个码字里的符号个数,第10页,第6章 图像编码,6.1.1 数据冗余,1. 编码冗余图像中灰度出现的概率不同灰度出现的概率不同平均比特数 用较少的比特数表示出现概率较大的灰度级用较多的比特数表示出现概率较小的灰度级,第11页,第6章 图像编码,6.1.1 数据冗余,2. 像素间冗余 直接与像素间相关性联系,规则 冗余大,不规则冗余小,第12页,第6章 图像编码,6.1.1 数据冗余,3. 心理视觉冗余主观:因人而异,因应用要求而异其存在与人观察图像的方式有关眼睛对某些视觉信息更敏感人对某些视觉信息更关心 心理视觉冗余与实在的视觉信息有联系,第13页,第6章 图像编码,6.1.2 图像保真度和质量,图像保真度信息无损型/信息损失型描述解码图像相对于原始图像的偏离程度对信息损失的测度主观保真度准则主观测量图像的质量,因人而异,应用不方便客观保真度准则用编码输入图与解码输出图的某个确定函数表示损失的信息量, 便于计算或测量,第14页,第6章 图像编码,6.1.2 图像保真度和质量,1. 客观保真度准则点误差图误差 均方根误差 均方信噪比,第15页,第6章 图像编码,6.1.2 图像保真度和质量,1. 客观保真度准则(归一化)信噪比:令 单位:分贝(dB) 峰值信噪比,第16页,第6章 图像编码,6.1.2 图像保真度和质量,2. 主观保真度准则观察者对图像综合评价的平均 电视图像质量评价尺度,第17页,第6章 图像编码,6.1.3 图像编码模型,图像编解码系统模型 两个通过信道级连的结构模块 输出图是输入图的精确复制? 信息保持型:是,无失真 信息损失型:不是,有一定的失真,第18页,第6章 图像编码,6.1.3 图像编码模型,信源编码器和信源解码器 无失真信源编码器不需要量化器,第19页,第6章 图像编码,第6章 图像编码,6.1 基本概念 6.2 基础理论 6.3 无损编码 6.4 有损编码 6.5 国际标准,第20页,第6章 图像编码,6.2 基础理论,信息量概率为P(E)的随机事件 E 的信息量 I(E )称为E的自信息(随概率增加而减少)特例:P(E ) = 1(即事件总发生),那么I(E ) = 0信息的单位:比特(log以2为底),第21页,第6章 图像编码,6.2 基础理论,信息系统 信源通过信道与信宿(即信息用户)连通以传递自信息 信源符号集:A = a1, a2, , aJ概率矢量:u = P(a1) P(a2) P(aJ )T用(A, u)可以完全描述信源,第22页,第6章 图像编码,6.2 基础理论,平均信息(熵)产生单个信源符号的自信息:I(aj) = logP(aj)产生k个信源符号,符号aj平均来说将产生kP(aj)次 信源平均信息(又称为熵) 定义了观察到单个信源符号输出时所获得的平均信息量,第23页,第6章 图像编码,根据信息论信源编码理论,可以证明:(1) ,总可以设计出某种无失真编码方法;(2) ,表明这种方法效率很低,占用比特数太多;(3) ,称为最佳编码;(4) ,丢失信息,图像失真。,6.2 基础理论,平均码长: 令 l(ai)为符号ai的码长编码效率:,第24页,第6章 图像编码,第6章 图像编码,6.1 基本概念 6.2 基础理论 6.3 无损编码 6.4 有损编码 6.5 国际标准,第25页,第6章 图像编码,6.3 无损编码,6.3.1 LZW编码 6.3.2 变长编码 6.3.3 位平面编码,第26页,第6章 图像编码,6.3.1 LZW编码,LZW:发明人(Lempel-Ziv-Welch)减少像素间冗余无损压缩特点:码字为固定长度不需要符号出现概率的知识是一种字典方法,第27页,第6章 图像编码,6.3.1 LZW编码,LZW编码示例 图像 初始字典,字典前256个码字被分配给灰度值。第257个位置用于下一个出现的灰度值序列。使用一个9比特512个字的字典,将用来表示两个像素的(88)比特码字用单个9比特码字代替,第28页,第6章 图像编码,6.3.1 LZW编码,LZW编码 在编码的同时都建立一个码本(1)拼接当前序列与将被处理的灰度拼接(2)搜索拼接序列在字典中找不到则建立新条目,编码输出为当前序列在表中的位置;若找到,不输出码字,当前序列改为拼接序列,第29页,第6章 图像编码,6.3.1 LZW编码,LZW解码,第30页,第6章 图像编码,6.3.2 变长编码,6.3.2(1) 哈夫曼编码 6.3.2(2) 香农-法诺编码 6.3.2(3) 算术编码 6.3.2(4) 变长码的特性,第31页,第6章 图像编码,6.3.2(1) 哈夫曼编码,哈夫曼编码步骤(1) 缩减信源符号数量将信源符号按出现概率从大到小排列,然后选2个最小的结合,第32页,第6章 图像编码,6.3.2(1) 哈夫曼编码,哈夫曼编码步骤 (2)对每个信源符号赋值从(消减到)最小的信源开始,逐步回到初始信源,第33页,第6章 图像编码,6.3.2(1) 哈夫曼编码,哈夫曼编码结果平均长度信源熵 编码效率,第34页,第6章 图像编码,6.3.2(2) 香农-法诺编码,变长编码技术,其码字中的0和1是独立的,并且基本上等概率出现主要步骤为:(1) 将信源符号依其概率从大到小排列(2) 将信源符号分成概率和接近的两部分(3) 分别给两部分的信源符号组合赋值(4) 如果两部分均只有一个信源符号,编码结束,否则返回(2)继续进行,第35页,第6章 图像编码,6.3.2(2) 香农-法诺编码,例,0,1,0,1,0,1,0,1,0,0,第36页,第6章 图像编码,6.3.2(3) 算术编码,产生 算术编码是60年代初期提出。在信源概率分布比较均匀情况下,它的编码效率高于哈夫曼编码 基本思想将要压缩的数据映射到0,1)实数区间中的某一区段上的实数X,该实数的二进制展开式即为原符号串的压缩编码结果算术编码通过对当前的概率区间作迭代分割来确定实数。 算术编码是具体构造出的用小数表示信息的方法,因为小数随位数的增加,它的精度也随之提高,从信息的角度来说,它所含有的信息量也随之增加,第37页,第6章 图像编码,6.3.2(3) 算术编码,方法特点算术编码是一种从整个符号序列出发,采用递推形式连续编码的方法算术编码过程中,只用到加法和移位运算算术编码中,源符号和码字间的一一对应关系并不存在,第38页,第6章 图像编码,6.3.2(3) 算术编码,例方法如下:,已知灰度级试对l011进行算术编码,(1)二进制信源符号只有两个“0” 和 “1”,设置 小概率:Qc14 大概率:Pc= 1- Qc 34(2)设C为子区的左端起始位置,L为子区的长度(符号概率) “0”的子区为0,l4,左端B0,长L14; “1”的子区为14,1;左端B14,长L3/4,第39页,第6章 图像编码,6.3.2(3) 算术编码,(3)在编码运算过程中,随着消息符号的出现,子区按下列规则缩小:规则A:新子区左端前子区左端十当前子区左端前子区长度规则B:新子区长度前子区长度当前子区的长度(4)初始子区为0.1,编码过程,第40页,第6章 图像编码,6.3.2(3) 算术编码,最后的子区左端(起始位置): C(85256) (0.01010101)b最后的子区长度: L(27/256)d(0.00011011)b最后的子区右端(子区间尾): 85/256+27/256(716)d(0.0111)b 编码结果为子区间头尾之间取值、其值为0.011,可编码为011,原来4个符号1011被压缩为三个符号011。,第41页,第6章 图像编码,6.3.2(3) 算术编码,图解,第42页,第6章 图像编码,6.3.2(3) 算术编码,特点不同的输入符号一定落入不同的区间,因此编码结果是唯一的不同信息组合映射到不同的实数区间,信息中所用符号出现的概率愈大,对应的区间也愈大,区间愈大,就愈有机会选择较短的码字来表示该信息算术编码更易于实现自适应。算术编码算法同符号概率统计是相互独立的,不像哈夫曼编码那样,符号概率统计的改变需要重新建立哈夫曼树,并改变码表算术编码的缺点是算术编码不是即时码,必须等到所有信息收到后才能解码,第43页,第6章 图像编码,6.3.2(4) 变长码的特性,编码角度统计特性哈夫曼和香农法诺码算术编码解码角度即时性:指对任意一个有限的码符号串,可以对每个码字分别解码,解码时不需接收后面的所有码字。也称为非续长性(任何码字不能用其他码字后添加符号来构成)哈夫曼和香农法诺码是,而算术码不是,第44页,第6章 图像编码,6.3.2(4) 变长码的特性,解码角度唯一性: 也称为单一性。指对任意一个有限长的码符号串,只有一种分解成其各个码符号的方法满足唯一性的码称为唯一可解码(uniquely decodeable code)哈夫曼、香农法诺码和算术码都是,第45页,第6章 图像编码,6.3.3 位平面编码,将多灰度值图像分解成一系列二值图 对每一幅二值图再用二值压缩方法 主要包括: (1) 位平面的分解 (2) 位平面的编码,第46页,第6章 图像编码,6.3.3 位平面编码,(1)位平面的分解 图像的位面表示,第47页,第6章 图像编码,6.3.3 位平面编码,实例,第48页,第6章 图像编码,6.3.3 位平面编码,1、常数块编码(CAC) 用专门的码字表达全是0或1的连通区域 将图像分成全黑,全白或混合的m n尺寸块 出现频率最高的类赋予 1 bit 码字0;其它两类分别赋予2 bit码字10和11 mn比特表示的模式压缩:原需用mn比特表示的常数块中的像素现在只用1 bit来表示,第49页,第6章 图像编码,6.3.3 位平面编码,2、1-D游程编码(RLC) 用一系列描述黑或白像素游程的长度来表示二值图或位平面中的每一行。 一般设每行均由白色(0)游程开始。例:对第2位平面:4 2 2,3 3 2,3 4 1,4 2 2,第50页,第6章 图像编码,第6章 图像编码,6.1 基本概念 6.2 基础理论 6.3 无损编码 6.4 有损编码 6.5 国际标准,第51页,第6章 图像编码,6.4 有损编码,有损编码是在牺牲图像重构后的准确度的基础上换取高压缩比 6.4.1 预测编码 6.4.2 变换编码,第52页,第6章 图像编码,6.4.1 预测编码,特点空域方法,消除像素间的冗余像素间的相关性使得预测成为可能基本思想提取每个像素中的新信息(实际值与预测值的差)并对它们编码包括: (1) 无损预测编码 (2) 有损预测编码,第53页,第6章 图像编码,6.4.1 预测编码,(1)无损预测编码(Lossless Predictive Coding)系统组成:编码器 + 解码器(有相同的预测器),第54页,第6章 图像编码,6.4.1 预测编码,无损预测编码过程: 输入序列: fn (n = 1, 2, ) 预测输出: (舍入成整数) 预测误差: 误差编码:在符号编码器中用变长码编误差 解压序列: 哪里取得了压缩?,(消除了像素间冗余),第55页,第6章 图像编码,6.4.1 预测编码,预测器 m阶线性预测: 1-D线性预测: 一阶1-D线性预测:,第56页,第6章 图像编码,6.4.1 预测编码,例:一维线性预测器,第57页,第6章 图像编码,6.4.1 预测编码,(2)有损预测编码(Lossy Predictive Coding)系统组成:增加了1个量化器,预测器放在1个反馈环中,第58页,第6章 图像编码,6.4.1 预测编码,有损预测编码系统中的数据 输入序列: fn (n = 1, 2, ) 量化输出: 预测输入: 解压序列: 编码误差: 哪里又取得了压缩?,(量化,减少了心理视觉冗余),第59页,第6章 图像编码,6.4.1 预测编码,例:德尔塔调制(DM)预测器 量化器预测系数 a 1,常数 c 0 DM方法得到的码率是1比特/像素,第60页,第6章 图像编码,6.4.1 预测编码,DM编码中的失真示例,a=1C=6.5,输入序列:14,15,14,15,13,15,15,14,20,26,27,28,27,27,29,37,47,62,75,77,78,79,80,81,81,82,82,第61页,第6章 图像编码,6.4.1 预测编码,失真问题:1)颗粒噪声:当c远大于输入中的最小变化时,如n1、n7等2)斜率过载:当c远小于输入中的最大变化时,如n14到n19,第62页,第6章 图像编码,6.4.1 预测编码,误差问题 上例中的两种失真问题是有损预测编码面临的共同问题 失真的严重程度与量化和预测方法及它们间的相互作用有关 但预测器和量化器往往是独立设计。预测器在设计中认为量化器没有误差,而量化器在设计中只是考虑最小化自身的误差,第63页,第6章 图像编码,6.4.1 预测编码,(1)最优预测 最小化编码器的均方预测误差差值脉冲码调制法 (DPCM),第64页,第6章 图像编码,6.4.1 预测编码,(1)最优预测 4阶线性预测器,四个例子:,第65页,第6章 图像编码,6.4.1 预测编码,例:采用4种预测器的DPCM预测效果比较,一阶 二阶 三阶,预测后的解码图,误差,采用德尔塔2级量化器,第66页,第6章 图像编码,6.4.1 预测编码,(2)最优量化,判别,重建,量化函数,第67页,第6章 图像编码,6.4.1 预测编码,(2)最优量化 输入概率密度函数p(s) 最小均方量化误差准则 重建电平是曲线下面积的重心 判别值为2个重建值的中值 量化器称为L级 LloydMax量化器,q(s)奇函数,输入概率密度函数,偶函数,第68页,第6章 图像编码,6.4.1 预测编码,量化器及比较,第69页,第6章 图像编码,6.4.1 预测编码,DPCM编码中不同量化器的效果比较,(a)5级(b)9级(c)17级(d)图(a)的误差图(e)图(b)的误差图,第70页,第6章 图像编码,6.4.2 变换编码,图像变换后形成的系数大多数比较小 频域方法,信息失真型 主要内容: 1、 变换编码系统 2、 变换选择 3、 子图像尺寸选择 4、 比特分配,第71页,第6章 图像编码,6.4.2 变换编码,1、变换编码(Transform Coding)系统图像分解:减少变换的计算复杂度图像变换:解除每个子图像内部像素之间的相关性,或者说将尽可能多的信息集中到尽可能少的变换系数上压缩不是在变换中而是在量化变换系数时及编码取得的,第72页,第6章 图像编码,6.4.2 变换编码,2、变换选择一个能把最多的信息集中到最少的系数上去的变换所产生的重建均方误差最小 不同变换的信息集中能力不同 正弦类变换(如DFT和DCT)较优非正弦类变换(如WHT: Walsh-Hadamard)实现简单小波变换计算快且有局部性质(不需分解),第73页,第6章 图像编码,6.4.2 变换编码,常用的变换:DFT,WHT,DCT 都是正交和可分离变换 集中能力: DCT DFT WHT 所需计算量:DCT DFT WHT DCT是较好的(综合)选择,第74页,第6章 图像编码,6.4.2 变换编码,比较对512512的单色图的3种近似。先分割成 88的子图像,变换后截去50的系数,再逆变换。逆变换后图像对应的均方误差较小。,DFT(1.28),WHT(0.86),DCT(0.68),第75页,第6章 图像编码,6.4.2 变换编码,3、子图像尺寸选择影响变换编码误差和计算复杂度(压缩量和计算复杂度都随子图像尺寸的增加而增加 )两个条件: 相邻子图像之间的相关(冗余)减少到某个可接受的水平; 子图像的长和宽都是2的整数次幂最常用的子图像尺寸:8 8和16 16,第76页,第6章 图像编码,6.4.2 变换编码,变换编码重建误差与子图像尺寸的关系,第77页,第6章 图像编码,6.4.2 变换编码,例:子图像尺寸的影响保留20的DCT系数。右图依次为:重构图;误差图;放大原局部图;22的结果;44的结果;88的结果22图有块效应,第78页,第6章 图像编码,6.4.2 变换编码,4、比特分配(Bit Allocation)比特分配:对变换子图像的系数截断、量化和编码的全过程截断误差 截除的变换系数的数量和相对重要性 用来表示所保留系数的精度(量化)保留系数的2个准则 最大方差准则,称为分区编码 最大幅度准则,称为阈值编码,第79页,第6章 图像编码,6.4.2 变换编码,(1)分区编码 系数保留:具有最大方差的变换系数带有最多的图像信息,事先确定模板,保留一定的系数 系数量化采用两种方式: (a)按系数变化区间均匀量化 (b)对每个系数设计量化器,如Lloyd Max量化器 系数编码: (a)相同的比特数 (b)给不同系数分别分配固定数量的比特,第80页,第6章 图像编码,6.4.2 变换编码,典型模板与比特分配,第81页,第6章 图像编码,6.4.2 变换编码,(2)阈值编码 根据子图像特性自适应选择保留系数将系数排队,与阈值比较确定去舍。 对任意子图像,值最大的变换系数对重建子图像的质量贡献最大。 最大系数的位置随子图像发生变化,需要对截断后的系数重新排列,一般的方法是使系数排列成1D序列,编码时采用游程码编码。,第82页,第6章 图像编码,6.4.2 变换编码,典型的阈值模板和系数排列次序,Zigzag方式,第83页,第6章 图像编码,6.4.2 变换编码,(2)阈值编码随子图像不同而保留不同位置的变换系数常用三种对变换子图像取阈值的方法:(a) 对所有子图像用一个全局阈值压缩的程度随(不同)图像而异,取决于超过全局阈值的系数的数量 (b) 对各个子图像分别用不同的阈值舍去同数量系数,码率是个常数 (c) 根据子图像中系数的位置选取阈值将取阈值和量化结合起来,第84页,第6章 图像编码,第6章 图像编码,6.1 基本概念 6.2 基础理论 6.3 无损编码 6.4 有损编码 6.5 国际标准,第85页,第6章 图像编码,6.5 国际标准,二值图像压缩标准G3和G4:CCITT(国际电报电话咨询委员会 )的两个小组Group3和Group4(1)G3:采用1D游程编码技术 G4:采用2 D游程编码技术(2)压缩率:G3约为15:1,G4高G3一倍左右JBIG(1)ISO和ITU(国际电信联盟 )联合组(Joint bilevel imaging group)(2)方法:自适应性、多分辨率(3)压缩比大约为230倍,第86页,第6章 图像编码,6.5 国际标准,静止图像压缩标准JPEG(Joint picture expert group)(1)ISO和CCITT两个组织在1991年制成草案,1994年成为标准(2)特点: 基于DCT的有损编码;基于分层递增模式,适用于高压缩、渐进重建应用;基于DPCM的无损预测编码(3)一般压缩1050倍,第87页,第6章 图像编码,6.5 国际标准,JPEG2000 大压缩比时质量优于JPEG;编码变换采用小波变换等运动图像压缩标准H.261 CCITT1990年制定,主要用于电视会议和可视会议。 扩展了DCT编码方式。对图像序列分组,组内第1帧采用帧内编码,剩余帧采用帧间编码。,第88页,第6章 图像编码,6.5 国际标准,MPEG1 (Moving Picture Expert Group), 成立于1986年 MPEG-1标准: 1991.11, 压缩320240全运动广播视频, 用于多媒体和广播电视,数据率要求1.5Mbps MPEG2 MPEG-2/H.262标准,1993.11,共同作为ISO/IEC13818标准草案;压缩720480全运动广播视频, 数据率要求4-10Mbps,第89页,第6章 图像编码,6.5 国际标准,MPEG-4:1999年完成第三版,是又一个新的视频和音频编码国际标准。特点是它是基于对象的编码方式以及它能对合成对象的编码能力。支持固定和可变速率视频编码(低速:64kbps; 中速:64384kbps; 高速:384kbps4Mbps)。目的在于提供适合用于交互多媒体环境下应用的核心技术,解决视频信号的有效存储和传输问题 主要技术:基于目标的编码和基于模型的编码,第90页,第6章 图像编码,6.5 国际标准,H.264/AVC 面向未来IP 和无线环境下的视频压缩 MPEG4将其纳入第10部分:AVC(先进视频编码),第91页,第6章 图像编码,小 结,图像压缩的必要性和可能性图像信息与压缩的一些概念无损压缩方法LZW变长(哈夫曼、香农等编码)位平面编码有损压缩方法预测编码变换编码,第92页,第6章 图像编码,作业,9.1、假设将一幅图像从左向右,从上向下扫描得到的序列为0,255,0,255,255,0,255,0,255,0,0,0,0,0,0,0。用LZW编码得到的输出码字是什么?9.2、说明预测编码和变换编码中起数据压缩作用的主要步骤。,