第六章:图像编码课件.ppt
第六章 图像编码,6.1 图像编码概述6.2 哈夫曼编码6.3 行程编码6.4 JPEG编码 6.5 MPEG编码,用数字形式表示图象使可视化信息以高效、新颖方式加以控制,其应用已经非常广泛,如卫星遥感、医学影象分析、脸谱识别、精确制导等。然而,这种表示方法需要大量的数据(比特数)。例如512*512*8bit*3色的电视图像,用9600波特在电话线上传输,单幅图象传输需要11分钟左右,这通常是不能接受的。,6.1 图像编码概述,图象编码是研究图象数据的编码方法,期望用最少的数码表示信源发出的图象信号,使数据得到压缩,减少图象数据占用的信号空间和能量,降低信号处理的复杂程度。,6.1 图像编码概述,图象编码主要是研究信源编码。人类社会已经进入信息时代,从而引起“信息爆炸”。信息数据压缩特别是图象信息数据压缩,其社会效益和经济效益将越来越明显,未来的图象通讯、多媒体技术和目标识别等领域对数据处理速度、存储容量都提出新的要求,图象数据压缩是必要的。同时,图象数据压缩也是可能的。,1.数字图像本身的特征带来的数据压缩的可能性。图象中象素灰度出现的不均匀性,造成图象信息熵冗余,即用同样长度比特表示每一个灰度,则必然存在冗余。而将出现概率大的灰度级用长度较短的码表示,将出现概率小的灰度级用长度较长的码表示,有可能使编码总长度下降。2.图象能量在变换域内分布的不均匀性,比如大部分能量集中在低频部分,而小部分能量集中在高和较高的频率部分,此时,对变换域信号进行与上述1.的方法,则可提高编码效率。3.图象象素灰度在时间和空间上的相关性造成信息冗余。,1,6.1.1 图像编码基本原理,表示图像需要大量的数据,但图像数据存在冗余信息,去掉这些冗余信息后可以有效压缩图像。冗余主要表现在:空间冗余:图像内部相邻像素之间的相关性所造成的冗余。时间冗余:视频图像不同帧之间的相关性所造成的冗余。视觉冗余:人眼不能感知或不敏感的那部分图像信息。,6.1.1 图像编码基本原理,信息熵冗余:编码冗余,如果图像中平均每个像素使用的比特数大于该图像的信息熵,则图像中存在冗余。结构冗余:图像中存在很强的纹理结构或自相似性。知识冗余:有些图像中还包含与某些先验知识有关的信息。,图像编码的目的就是尽量减小各种冗余信息,特别是 空间冗余、视觉冗余,以少的比特数来表示图像。,6.1.1 图像编码基本原理,图像编码分为有损压缩和无损压缩。无损压缩无信息损失,解压缩时能够从压缩数据精确地恢复原始图像,是可逆的;有损压缩不能精确重建原始图像,存在一定程度的失真,但在视觉角度看失去的信息是无关紧要的信息。根据编码原理将图像编码分为:(1)熵编码:无损编码,给出现概率较大的符号赋予一个短码字,而给出现概率较小的符号赋予一个长码字,从而使得最终的平均码长很小。,6.1.2 图像编码的方法,(2)预测编码:基于图像数据的空间或时间冗余特性,用相邻的已知像素(或像素块)来预测当前像素(或像素块)的取值,然后再对预测误差进行量化和编码。(3)变换编码:将空间域上的图像变换到另一变换域上,变换后图像的大部分能量只集中到少数几个变换系数上,采用适当的量化和熵编码就可以有效地压缩图像。,6.1.2 图像编码的方法,6.1.2 图像编码的方法,(4)混合编码:综合了熵编码、变换编码或预测编码的编码方法,如JPEG标准和MPEG标准等。,利用人工神经网络(Artificial Neural Network,ANN)的压缩编码、分形编码(Fractal Coding)、小波编码(Wavelet Coding)、基于对象的压缩编码(Object Based Coding)和基于模型的压缩编码(Model Based Coding)等等。,6.1.3 图像编码新技术,评价图像压缩算法的优劣主要有以下4个参数:1)算法的编码效率(压缩比)2)编码图像的质量 3)算法的适用范围 4)算法的复杂度,6.1.4 图像编码评价,编码图像的质量,图像信号在编码和传输过程中会产生误差,尤其是在有损压缩编码中,产生的误差应在允许的范围之内。在这种情况下,保真度准则可以用来衡量编码方法或系统质量的优劣。通常,这种衡量的尺度可分为客观保真度准则和主观保真度准则。,客观保真度准则,通常使用的客观保真度准则是用输入图像和输出图像的均方根信噪比。设输入图像是由NN个像素组成,令其为 f(x,y),这样一幅图像经过压缩编码处理后,送至受信端,再经译码处理,重建原来图像,重建图像为g(x,y)。,均方根信噪比为,主观保真度准则,图像处理的结果,绝大多数场合是给人观看,由研究人员来解释的,因此,图像质量的好坏与否,既与图像本身的客观质量有关,也与人的视觉系统的特性有关。有时候客观保真度完全一样的两幅图像可能会有完全不相同的视觉质量,所以又规定了主观保真度准则。这种方法是把图像显示给观察者,然后把评价结果加以平均,以此来评价一幅图像的主观质量。,规定一种尺度,例如:(1)优秀的:具有极高质量的图像;(2)好的:是可供观赏的高质量的图像,干扰并不明显;(3)可通过的:图像质量可以接受,干扰 不讨厌;(4)边缘的:图像质量较低,希望能加以改善,干扰有 些讨厌;(5)劣等的:图像质量很差,尚能观看,干扰显著地令人讨厌;(6)不能用:图像质量非常之差,无法观看。,6.2 哈夫曼编码,(1)统计出每级灰度出现的频率:灰度值:0 10 20 30 40 出现频率:1/16 1/16 7/16 3/16 4/16,6.2 哈夫曼编码,(2)从左到右把上述频率按从小到大的顺序排列。灰度值:0 10 30 40 20 出现频率:1/16 1/16 3/16 4/16 7/16,6.2 哈夫曼编码,(3)选出频率最小的两个值(1/16,1/16)作为二叉树的两个叶子节点,将频率和2/16作为它们的根节点,新的根节点再参与其它频率排序:2/16 3/16 5/16 7/16,6.2 哈夫曼编码,(4)选出频率最小的两个值(2/16,3/16)作为二叉树的两个叶子节点,将频率和5/16作为它们的根节点,新的根节点再参与其它频率排序:4/16 5/16 7/16,6.2 哈夫曼编码,(5)选出频率最小的两个值(4/16,5/16)作为二叉树的两个叶子节点将频率和9/16作为它们的根节点,新的根节点再参与其它频率排序:7/16 9/16,6.2 哈夫曼编码,(6)最后两个频率值(7/16,9/16)作为二叉树的两个叶子节点,将频率和1作为它们的根节点。,6.2 哈夫曼编码,(7)分配码字。将形成的二叉树的左节点标0,右节点标1。把从最上面的根节点到最下面的叶子节点途中遇到的0,1序列串起来,就得到了各级灰度的编码.,6.2 哈夫曼编码,各灰度的编码如下:灰度值:20 40 30 10 0哈夫曼编码:0 10 111 1101 1100则图所示的图像哈夫曼编码为:11111010100101100000111111010100共用了32比特,原图像占128比特,压缩比较高。,6.3 行 程 编 码,6.3.1 行程编码基本方法 行程编码又称行程长度编码(Run Length Encoding,RLE),是一种熵编码。行程:具有相同灰度值的像素序列。其编码原理是将具有相同值的连续串用其串长和一个代表值来代替(去除像素冗余),串长称为行程长度。例如:aabbbcddddd的行程长度编码为2a3b1c5d。,分析:对于有大面积色块的图像,压缩效果很好;对于纷杂的图像,压缩效果不好,最坏情况下,会加倍图像。,定长行程编码:编码的行程长度所用的二进制位数固定。变长行程编码:不同范围的行程长度用不同编码位,需要增加标志位来表明所使用的二进制位数。,6.3.1 行程编码基本方法,二值图变长行程编码的一种方法,3 12 4 9 1 11 1100 100 1001 1 11110010010101(不知道各行程应在何处分断)可以定义:可表示行程长度值 编码 编码长度 1-4 0?3 5-8 10?5 9-16 110?7 17-32 1110?9 33-64 11110?11 65-128 111110?13 如:1100的编码为:1100-1=1011(十进制11)行程编码为:1101011,01011010110111101000000,3 12 4 9 1 11 1100 100 1001 1 10 1011 11 1000 0010 1101011 011 1101000 000,还原方法:从符号串左端开始往右搜索,遇到第一个0时停下来,计算这个0的前面有几个1。设1的个数为K,则在0后面读K+2个符号,这K+2个符号所表示的二进制数加上1的值就是第1个行程的长度。,例子:PCX_RLE(1)PCX简介:真彩色图像以行为单位,按色面存放,128字节的文件头,图像数据,调色板,PCX文件分为文件头和图像压缩数据两个部分。如果是256色图像,则还有一个256色调色板存于文件尾部。文件头全长128字节,包含了图像的大小和颜色以及PCX文件的版本标识等信息,图像压缩数据紧跟在文件头之后。如果没有使用调色板,那么图像压缩数据存储的是实际像素值;否则,存储的是调色板的索引值。,6.3.2 PCX文件中的行程编码,PCX_RLE编码原则:1)图像数据以字节为单位进行编码2)按行进行压缩3)长度在前,灰度值在后4)单像素没有长度值5)以最高两位作为判断是重复数还是原像素。最高两位为1,说明是重复数,否则,说明是原像素值,PCX_RLE编码原则:6)重复像素长度L最大值为26-1=63,如果遇到L大于63的情况,则分为小于63的几段,分别处理。7)如果遇到不重复的单个像素P:如果P 0 xC0(192)直接存入该像素值,否则先存入长度1,再存入像素值(注:192-255之间的单像素图像不减反增),在256色PCX文件中,行程长度和行程的代表值分别占一字节,且规定编码时的最大行程长度为63,如果行程长度大于63,则必须分多次存储。设行程长度为L,有以下三种情况:(1)1L63:编码时先存入其行程长度(长度L加上192即0 xC0),再存入该行程的代表值。,6.3.2 PCX文件中的行程编码,(2)L=1:又分两种情况:如果该像素的值小于或等于0 xC0,则编码时直接 存入该像素值,而不存储长度信息;否则,先存入0 xC1,再存入该像素值,这样做的目 的是为了避免该像素值被误认为长度信息。,6.3.2 PCX文件中的行程编码,(3)L63:必须多次存储。计算整数n=L/63,存入 n个长度值(为63,加192后十六进制数为FF)和像素值,最后存入L/63的余数长度及像素值。例如,连续130个灰度值为0 x50的像素,其编码(以十六进制表示)应为FF 50 FF 50 C4 50。,6.3.2 PCX文件中的行程编码,PCX_RLE的解码(以解一行为例)1)读一个字节到 byChar2)if(byChar&0 xC0)=0 xC0)/判前两位是否全1,C0=1100 0000iCount=byChar&0 x3F;/取出后6位的重复数,连续读iCount个字节 else 直接读下一个字节3)重复1),2)直到读完一行。,对以下256色PCX文件中的一行图像压缩数据(十六进制数)进行解码:CA 53 12 C1 C1 FF 40 E2 40 第一个字节0 xCA0 xC0,则为行程长度L=10;第二个字节为像素值83;第三个字节0 x120 xC0,则为行程长度1,像素值193;第六个字节0 xFF0 xC0,则为行程长度L=63;第七个字节为像素值64;第八个字节0 xE20 xC0,则为行程长度L=34;第九个字节为像素值64。因此最终解码结果为:10个像素值为83、1个像素值为18、1个像素值为193、97个像素值为64。,6.3.2 PCX文件中的行程编码,6.4 JPEG 编 码,6.5.1 JPEG基本系统编码 JPEG是面向静态图像编码的国际标准。JPEG文件拥有比其他图像文件格式更高的压缩比。JPEG目前被广泛应用于多媒体和网络中,是现今万维网中使用最广泛的图像文件格式之一。JPEG是一种有损压缩,在压缩过程中会丢失数据,每次编辑JPEG图像后,图像就会被重复压缩一次,损失就会有所增加。,(1)将彩色图像颜色模型变为YUV模型 YUV是现代彩色电视系统通常采用的色彩模型,如果只有Y信号分量而没有U、V分量,表示的图像就是黑白灰度图像。YUV与RGB相互转换的公式如下(RGB取值范围均为0-255):Y=0.299R+0.587G+0.114B U=-0.147R-0.289G+0.436B V=0.615R-0.515G-0.100B R=Y+1.14V G=Y-0.39U-0.58V B=Y+2.03U,6.4.2 JPEG 编码过程,Y分量(亮度)比U、V分量(色度)更重要,所以可以只取UV的一部分,以增加压缩比。目前支持JPEG格式的软件通常提供两种取样方式YUV411和YUV422,其含义是YUV三个分量的数据取样比例。举例来说,如果Y取四个数据单元,即水平取样因子Hy乘以垂直取样因子Vy的值为4,而U和V各取一个数据单元,即HuVu=1,HvVv=1。那么这种部分取样就称为YUV411。,6.4.2 JPEG 编码过程,(2)数据分块 对图像进行编码前,将每个分量图像分割成不重叠的88像素块,每一个88像素块称为一个数据单元(DU)。,6.4.2 JPEG 编码过程,(3)DCT处理 图像数据块分割后,将DU进行二维离散余弦变换。对每个88的数据块DU进行DCT后,得到的64个系数代表了该图像块的频率成分,其中低频分量集中在左上角,高频分量分布在右下角。系数矩阵左上角的叫做直流(DC)系数,它代表了该数据块的平均值,其余63个叫交流(AC)系数。,6.4.2 JPEG 编码过程,量化是用DCT变换后的系数除以量化表中相对应的量化阶后四舍五入取整。由于量化表中左上角的值较小,而右下角的值较大,因而起到了保持低频分量、抑制高频分量的作用。,(4)量化处理,6.4.2 JPEG 编码过程,DCT系数量化后,构成一个稀疏矩阵,用Z(Zigzag)形扫描将其变成一维数列,将有利于熵编码。Z形扫描的顺序如图所示。,DCT系数的Z形扫描顺序,(5)Z形扫描,6.4.2 JPEG 编码过程,(6)DC系数编码 DC系数反映了一个88数据块的平均亮度,一般与相邻块有较大的相关性。采用“前缀码(SSSS)+尾码”来表示。前缀码指明了尾码的有效位数B,可以根据DIFF从表中查出前缀码对应的哈夫曼编码。尾码的取值取决于DC系数的差值。如果DC系数的差值DIFF大于等于0,则尾码的码字为DIFF的B位原码;否则,取DIFF的B位反码。,6.4.2 JPEG 编码过程,(7)AC系数编码 经Z形排列后的AC系数,更有可能出现连续0组成的字符串,对其进行行程编码有利于压缩数据。JPEG将一个非零DC系数及其前面的0行程长度的组合称为一个事件。将每个事件编码表示为“NNNN/SSSS+尾码”,NNNN为0行程的长度,SSSS表示尾码的有效位数B,如果非零AC系数大于等于0,则尾码的码字为该系数的B位原码,否则,取该系数的B位反码。,6.4.2 JPEG 编码过程,6.5 MPEG标准,连续帧单色、彩色压缩连续帧图像的定义连续帧图像压缩的基本思想帧间运动补偿预测编码技术MPEG1/2/4/7标准,连续帧图像的定义由多幅尺寸相同的静止图像组成的图像序列,被称为连续帧图像。与静止帧图像相比,连续帧图像多了一个时间轴,成为三维信号,因此连续帧图像也被称为三维图像。,连续帧图像压缩的基本思想基于如下基本假设:在各连续帧之间存在简单的相关性平移运动。一个特定画面上的像素量值:1)可以根据同帧附近像素来加以预测,被称为:帧内编码技术2)可以根据附近帧中的像素来加以预测,被称为:帧间编码技术,连续帧图像压缩的基本思想通过减少帧间图像数据冗余,来达到减少数据量、压缩连续帧图像体积的目的将连续帧图像序列,分为参考帧和预测帧,参考帧用静止图像压缩方法进行压缩,预测帧对帧差图像进行压缩由于帧差图像的数据量大大小于参考帧的数据量,从而可以达到很高的压缩比,帧间运动补偿预测编码技术帧间预测编码,+-,熵编码,帧间预测器,运动补偿,压缩图像块,输入图像块,en,fn,fn,运动补偿预测帧间误差图像,运动补偿预测图像,帧间运动补偿预测编码技术帧间预测编码向前预测双向预测,前一帧,当前帧,前一帧,当前帧,下一帧,帧间运动补偿预测编码技术帧间预测编码I帧不进行预测、进行帧内编码的编码帧(参考帧)P帧通过向前预测得到的误差编码帧B帧通过双向预测得到的误差编码帧因图像序列存放在存储器中,可以使用下一帧,帧间运动补偿预测编码技术编码中的运动补偿运动补偿概念是 以对帧间运动的估算为基础的,若物体均在空间上有一位移,那么用有限的运动参数来对帧间的运动加以描述,如对于像素的平移运动,可用运动矢量来描述一个来自前一编码帧的运动补偿预测像素,就能给出一个当前像素的最佳预测。预测误差和运动矢量一同参与编码,帧间运动补偿预测编码技术编码中的运动补偿由于一些运动矢量之间的空间相关性通常较高,因此,一个像素的运动矢量,可以代表一个相邻像素块的运动实现中,画面一般划分成一些不连接的像素块(在MPEGl和MPEG2标准中一个像素块为1616像素),对于每一个这样的像素块,只估算一个运动矢量,帧间运动补偿预测编码技术编码中的运动补偿举例:常用的基于块的运动估算和补偿块匹配法,K帧,K+l 帧,块,查找窗口,MPEG1/2/4/7标准MPEG1/2/4/7标准由ISO/IEC制定的ISO是国际标准化组织IEC是国际电工委员会,是非政府性国际组织,是世界上成立最早的专门国际标准化机构,正式成立于1906 年。,MPEG4标准应用范围:互联网、交互视频、移动通信主要编码技术:DCT变换、小波变换前向、双向运动补偿预测Zig-zag排序脸部动画、背影编码霍夫曼编码、算术编码每15帧至少要有一个I帧IBBPBBPBBIBBP.,