图象属性及格式及获取.ppt
第五章 彩色图象压缩基础,概述:,图像数据压缩两个基本依据:一个是图像数据中有许多重复的数据,使用数学方法来表示这些重复数据就可以减少数据量;利用的压缩技术是无损压缩技术,另一个事实是人的眼睛对图像细节和颜色的辨认有一个极限,把超过极限的部分去掉,这也就达到压缩数据的目的。利用有损压缩技术。实际的图像压缩是综合使用各种有损和无损压缩技术来实现的。,5.1视角系统对颜色的感知,颜色是视觉系统对可见光的感知结果。可见光是波长在380 nm780 nm之间的电磁波 研究表明,人的视网膜有对红、绿、蓝颜色敏感程度不同的三种锥体细胞,另外还有一种在光功率极端低的条件下才起作用的杆状体细胞,因此颜色只存在于眼睛和大脑。,视觉系统对颜色的感知特性,眼睛本质上是一个照相机人的视网膜(human retina)通过神经元来感知外部世界的颜色,每个神经元或者是一个对颜色敏感的锥体(cone),或者是一个对颜色不敏感的杆状体(rod)。红、绿和蓝三种锥体细胞对不同频率的光的感知程度不同,对不同亮度的感知程度也不同人们可以使用数字图像处理技术来降低数据率而不使人感到图像质量明显下降。,视觉系统对颜色和亮度的响应特性,产生波长不同的光所需三基色,自然界中的任何一种颜色都可以由R,G,B这3种颜色值之和来确定 图中的纵坐标表示标称单位光强度,横坐标表示波长,负值表示某些波长(即颜色)不能精确地通过相加混色得到。使用等量的三基色可匹配等能量的白光。,5.2 彩色图象的颜色模式,一个能发出光波的物体称为有源物体,它的颜色由该物体发出的光波决定,使用RGB相加混色模型;一个不发光波的物体称为无源物体,它的颜色由该物体吸收或者反射哪些光波决定,用CMY相减混色模型。,相加颜色模式,显示彩色图像用RGB相加混色模型 颜色R(红色的百分比)G(绿色的百分比)B(蓝色的百分比),相加颜色模式,当三基色等量相加时,得到白色;等量的红绿相加而蓝为0值时得到黄色;等量的红蓝相加而绿为0时得到品红色;等量的绿蓝相加而红为0时得到青色。,图象的相加色,一幅彩色图像可以看成由许多的点组成的每个像素都有一个值,称为像素值,它表示特定颜色的强度。一个像素值往往用R,G,B三个分量表示,颜色相加列表,标准的电视图形阵列适配卡的16色,标准的电视图形阵列适配卡的16色,注意:色调-饱和度-亮度(hue-saturation-lightness,HSL)颜色模型,CMY相减混色模型,用彩色墨水或颜料进行混合,这样得到的颜色称为相减色。任何一种颜色都可以用三种基本颜料按一定比例混合得到。这三种颜色是青色(Cyan)、品红(Magenta)和黄色(Yellow),通常写成CMY,称为CMY模型。减少了为视觉系统识别颜色所需要的反射光,CMY相减色,在相减混色中,当三基色等量相减时得到黑色;等量黄色(Y)和品红(M)相减而青色(C)为0时,得到红色(R);等量青色(C)和品红(M)相减而黄色(Y)为0时,得到蓝色(B);等量黄色(Y)和青色(C)相减而品红(M)为0时,得到绿色(G)。,相减色列表,相减色与相加色之间关系,RGB与CMYK间关系,彩色空间的线性变换标准,为使用人的视角特性以降低数据量,通常把RGB空间表示的彩色图像变换到其他彩色空间。目前采用的彩色空间变换有三种:YIQ,YUV和YCrCb。每一种彩色空间都产生一种亮度分量信号和两种色度分量信号,而每一种变换使用的参数都是为了适应某种类型的显示设备。YIQ适用于NTSC彩色电视制式,YUV适用于PAL和SECAM彩色电视制式,而YCrCb适用于计算机用的显示器。,YUV与YIQ,YIQ模型,其中的Y表示亮度,I、Q是两个彩色分量。YUV模型,Y表示亮度,UV用来表示色差,U、V是构成彩色的两个分量;YUV表示法的重要性是它的亮度信号(Y)和色度信号(U、V)是相互独立的,也就是Y信号分量构成的黑白灰度图与用U、V信号构成的另外两幅单色图是相互独立的。可用于对单色图分别进行编码。YUV表示法的另一个优点是可以利用人眼的特性来降低数字彩色图像所需要的存储容量。YUV可以用于数据压缩,依据是?,YUV与RGB彩色空间变换,Y=0.299R+0.587G+0.114BU=-0.147R-0.289G+0.436BV=0.615R-0.515G-0.100B,YIQ与RGB彩色空间变换,Y=0.299R+0.587G+0.114BI=0.596R-0.275G-0.321BQ=0.212R-0.523G+0.311B,YCrCb与RGB彩色空间变换,Y0.299R0.578G0.114BCr(0.500R0.4187G0.0813B)128Cb=(-0.1687R0.3313G0.500B)128,5.4图象的三个属性,图像的属性包含分辨率、像素深度、真/伪彩色、图像的表示法和种类等。显示分辨率是指显示屏上能够显示出的像素数目 图像分辨率是指组成一幅图像的像素密度的度量方法。图像分辨率与显示分辨率是两个不同的概念。图像分辨率是确定组成一幅图像的像素数目,而显示分辨率是确定显示图像的区域大小。如果显示屏的分辨率为640480,那末一幅320240的图像只占显示屏的1/4;,像素深度,像素深度是指存储每个像素所用的位数,它也是用来度量图像的分辨率。像素深度决定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数。一幅彩色图像的每个像素用R,G,B三个分量表示,若每个分量用8位,那末一个像素共用24位表示,就说像素的深度为24,每个像素可以是224=16 777 216种颜色中的一种。在用二进制数表示彩色图像的像素时,除R,G,B分量用固定位数表示外,往往还增加1位或几位作为属性(Attribute)位。例如,RGB 555表示一个像素时,用2个字节共16位表示,其中R,G,B各占5位,剩下一位作为属性位。在这种情况下,像素深度为16位,而图像深度为15位。,真彩色、伪彩色与直接色,真彩色(true color)真彩色是指在组成一幅彩色图像的每个像素值中,有R,G,B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色。伪彩色伪彩色图像的含义是,每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当作彩色查找表(color look-up table,CLUT)的表项入口地址,去查找一个显示图像时使用的R,G,B强度值,用查找出的R,G,B强度值产生的彩色称为伪彩色。直接色每个像素值分成R,G,B分量,每个分量作为单独的索引值对它做变换。也就是通过相应的彩色变换表找出基色强度,用变换后得到的R,G,B强度值产生的彩色称为直接色。它的特点是对每个基色进行变换。,真彩色和伪彩色图像之间的差别,5.5 图象种类,矢量图和位图 计算机包含两种类型的图形格式:矢量图(Vector Based Image)和位图(Bit Mapped Image)。矢量图(图形):主要用于工程图、白描图、图例、卡通漫画和三维建模等。由图形应用程序创建,在数学上定义为一系列由线连接的点,其内部表示为单个的线条、文字、圆、矩形、多边形等图形元素。每个图元称为对象,可以用一个代数式来表达,并且是一个独立的实体,具有颜色、形状、大小和屏幕位置等属性。通过软件,矢量图很容易转化为位图,而位图转化为矢量图则需要复杂而庞大的数据处理。,2.位图(图像):,是直接量化的原始图像信号形式,图像的最小单位是像点,用于表现自然影像。像素点由若干个二进制位进行描述,二进制位代表像素点颜色的数量,二进制位与图像之间存在严格的“位映射”关系,具有位映射关系的图叫作“位图”。位图与矢量图的不同点:1)位图的容量一般较大,与图的尺寸和颜色有关;矢量图一般较小,与图的复杂程度有关。2)位图的文件内容是点阵数据;矢量图的文件内容是图形指令。3)位图的显示速度与图的容量有关;矢量图的显示速度与图的复杂程度有关。4)从应用特点看,位图适于“获取”和“复制”,表现力丰富,但编辑较复杂;矢量图易于编辑,适于“绘制”和“创建”,但表现力受限。,彩色图像,RGB 红、绿、蓝,R G B,R G B,教学进程,CMYK彩色图像,CMYK 青、品红、黄、黑,C KM Y,C M Y K,教学进程,灰度图象,灰度图象是按照灰度的等级数目进行划分进行如果灰度等级用8位表示,则灰度等级就是256级如果灰度等级用1位表示,则称为单色图象,单色图像,单色图像 色族单一的图像,但并非只有一种颜色的图像,单色图像,单色图像用途:简单形式 文本显示、木刻、版画效果的图像 复杂形式 书籍用图片、报纸用图片 单色图像格式:TGA、JPG、TIF、PCX等,教学进程,JPEG压缩算法,由ISO和IEC两个组织联合组成的一个专家组,负责制定静态的数字图象数据压缩编码标准可用于静态图象,也可以用于动态图象基本压缩算法:离散余弦变换:25:1没有区别预测技术为基础的无损压缩算法JPEG2000压缩算法:小波变换,压缩比 10:1 100:1(一般压缩比40:1),压缩原理 采用无失真预测编码、有失真DCT编码等混合编码方式,无失真预测编码 线性预测编码,压缩比2:1 有失真DCT编码 1 离散余弦变换压缩编码,压缩比40:1 2 霍夫曼编码(增强型编码)3自适应算术编码(增强型编码),JPEG图像压缩算法,JPEG图像压缩算法,JPEG 是有损压缩算法JPEG 核心是“离散余弦变换(Discrete Cosine Transform,DCT)”JPEG 压缩算法的基本步骤为:,1、离散余弦变换DCT Transformation,2、系数量子化Coefficient Quantization,3、Huffman无损压缩Lossless Compression,静态图象压缩原理图,JPEG压缩的主要计算步骤,正向离散余弦变换(FDCT)。量化(quantization)。Z字形编码(zigzag scan)。使用差分脉冲编码调制(differential pulse code modulation,DPCM)对直流系数(DC)进行编码。使用行程长度编码(run-length encoding,RLE)对交流系数(AC)进行编码。熵编码(entropy coding)。,正向离散余弦变换,对每个单独的彩色图像分量,把整个分量图像分成88的图像块,并作为两维离散余弦变换DCT的输入。通过DCT变换,把能量集中在少数几个系数上。,正向离散余弦变换,DCT变换使用下式计算逆变换使用下式计算C(u),C(v)=1/,当u,v=0;C(u),C(v)=1,其他。,正向离散余弦变换,计算两维的DCT变换时,可使用下面的计算式把两维的DCT变换变成一维的DCT变换,量子化 Quantization,DCT变换的输入是8位的象素值(0255,JPEG实现时将其减去128,范围变成-128127),但输出范围是从1024到1023,占11位。量子化即通过整除运算减少输出值的存储位数。,使用量子化矩阵(Quantization Matrix)来实现量子化。,量子化公式为:量化后的值(i,j)=ROUND(DCT(i,j)/量子(i,j)逆量子化公式为:DCT(i,j)=量化后的值(i,j)*量子(i,j),量子化是JPEG算法中损失图像精度的根源,也是产生压缩效果的源泉,量子表Quantum Table,quality=4,quality=9,Quantumij=1+(1+i+j)*quality),Zig-Zag编码,(0,0)-(0,1)-(1,0)-(2,0)-,将量子化的矩阵按Zig-Zag顺序排列,将原始数列转换为差值数列,对差值数列进行编码,可以使用Huffman编码、算术编码或熵编码等方法,Z形编码,量化后的系数要重新编排,目的是为了增加连续的“0”系数的个数,就是“0”的游程长度,方法是按照Z字形的式样编排。这样就把一个8 x 8的矩阵变成一个1x 64的矢量,频率较低的系数放在矢量的顶部。,直流系数编码,8 x 8图像块经过DCT变换之后得到的DC直流系数有两个特点:一是系数的数值比较大,二是相邻8x8图像块的DC系数值变化不大。JPEG算法使用了差分脉冲调制编码(DPCM)技术,对相邻图像块之间量化DC系数的差值(Delta)进行编码 DeltaDC(0,0)k-DC(0,0)k-1,交流系数编码,量化AC系数的特点是1x 64矢量中包含有许多“0”系数,并且许多“0”是连续的游程长度编码(RLE)对它们进行编码JPEG使用了1个字节的高4位来表示连续“0”的个数,而使用它的低4位来表示编码下一个非“0”系数所需要的位数,跟在它后面的是量化AC系数的数值。,0的个数,下个非“0”系数位数,量化AC系数的数值,熵编码,使用熵编码还可以对DPCM编码后的直流DC系数和RLE编码后的交流AC系数作进一步的压缩。在JPEG有损压缩算法中,使用霍夫曼编码器来减少熵。使用霍夫曼编码器的理由是可以使用很简单的查表(lookup table)方法进行编码。,组成位数据流,JPEG编码的最后一个步骤是把各种标记代码和编码后的图像数据组成一帧一帧的数据,这样做的目的是为了便于传输、存储和译码器进行译码,这样的组织的数据通常称为JPEG位数据流(JPEG bitstream)。,一个真实的编码和解码过程,JPEG的其他问题,将原始图像划分成多个 8 X 8 或 16 X 16 的矩阵进行处理,要求矩阵中每个点的像素值范围是 0255,二值、16级灰度等均转换为256级灰度图像进行处理,对非256色的彩色图象,先转换成真彩色图像,然后使用分色法将图像分成红、蓝、绿三个256级灰度图像,再进行处理,Independent JPEG Grouphttp:/www.ijg.org/,5.6.1 数据格式,BMP格式,Bitmap,Microsoft公司开发,用于Windows环境,使用要点(1)用于表现打印、显示用图像(2)不适于网络传送(3)不适于提供印刷文件,5.6 静态图像文件,教学进程,TIFF格式,Tag Image File Format,Aldus公司开发,用于精确描述图像的场合,使用要点(1)平面设计作品的最佳表现形式(2)用于提供印刷文件(3)不适于网络传送,教学进程,TGA格式,Taga Image Format,Truevision公司开发,用于屏显和动画帧显示,使用要点(1)用于表现影视广播级动画的帧(2)不适于保存高质量印刷文件(3)不适于网络传送,教学进程,GIF格式,Graphics Interchange Format,CompuServe公司开发,用于屏显和网络,使用要点(1)用于屏幕显示图像和电脑动画(2)用于网络传送(3)不适于保存高质量印刷文件,教学进程,JPEG格式,Joint Photographic Experts Group,联合专家小组开发,用于彩色图像的存储和网络传送,使用要点(1)用于保存表现自然景观的图像(2)用于网络传送(3)不适于表现有明显边界的图形(4)不适用于高质量印刷文件,教学进程,