彩色数字图像基础.ppt
多媒体技术基础Fundamentals of Multimedia,第 5 章 彩色数字图像基础(2)Chapter 5 Fundamentals of Digital Color Image(2),赵 进复旦大学计算机科学技术学院http:/,复旦大学2009INFO130130,2,内容大纲,图像的颜色模型图像的基本属性图像的分类伽玛校正JPEG图像文件,3,回顾,图像的基本属性分辨率(DPI)像素深度(bits per pixel)真/伪彩色 表示法,4,像素深度与颜色,像素深度是指位图中记录每个像素点所占的位数,它决定了彩色图像中可出现的最多颜色数,或者灰度图像中的最大灰度等级数。图像的颜色需用三维空间来表示,如RGB颜色空间,而颜色的空间表示法又不是惟一的,所以每个像素点的像素深度的分配还与图像所用的颜色空间有关。以最常用的RGB颜色空间为例,图像深度与颜色的映射关系主要有真彩色、伪彩色和直接色。,5,真彩色,True Color真彩色:指在组成一幅彩色图像的每个像素值中,有R,G,B三个基色分量,每个基色分量直接决定显示设备的基色强度。【例1】用RGB 555表示的彩色图像,R,G,B各用5位,用R,G,B分量大小的值直接确定三个基色的强度,这样得到的彩色是真实的原图彩色。,6,真彩色,【例2】如果用RGB 8:8:8方式表示一幅彩色图像,就是R,G,B都用8位来表示,每个基色分量占一个字节,可生成的颜色数就是22416 777 216种。用3个字节表示的真彩色图像所需要的存储空间很大,而人的眼睛是很难分辨出这么多种颜色的因此在许多场合往往用RGB 5:5:5来表示,每个彩色分量占5个位,再加1位显示属性控制位,共2个字节,生成的真颜色数目为215=32K。全彩色(full color)图像:特指RGB 8:8:8,即图像的颜色数为224。,7,例子,How many different colors can you see in a 640 480 pixel image?Of course at most 640 x480your window desktop?Depends on resolution and size(e.g.1024x768)A 24-bit system allows us to describe 224=16,777,216 different colors.In many cases,such a high color resolution is not needed.,8,如何节省空间,分析图像中所有可能的颜色假设为n种,通常 n 224为每个色分配一个代码每个代码对应有RGB值每个颜色的bit数为 log2n 例如:图像最多有1000种色,那么用于表示一种颜色的bit数为 log21000=10,9,伪彩色,Pseudo color每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当作彩色查找表CLUT(color look-up table)的表项入口地址,去查找一个显示图像时使用的R,G,B强度值。彩色查找表CLUT也称为:colormap(颜色图),palette(调色板)是一个事先做好的表,表项入口地址也称为索引号,根据该索引号可查找出包含实际R、G、B的强度值。例如16种颜色的查找表,0号索引对应黑色,.,15号索引对应白色。,10,CLUT,彩色图像本身的像素数值和彩色查找表的索引号有一个变换关系,这个关系可以使用Windows 95/98定义的变换关系,也可以使用你自己定义的变换关系。使用查找得到的数值显示的彩色本身是真的,但由于CLUT可能没有完全包含原图的所有可能彩色,故不一定反映图像原来真正的颜色在VGA显示系统中,调色板就相当于颜色查找表,11,16色标准VGA调色板,绿色 伪彩色值=10,真彩色值=0 255 0,12,真彩色和伪彩色图像之间的差别,13,调色板的选取,伪彩色一般用于65K色以下的显示方式中。标准的调色板是在256K色谱中按色调均匀地选取16种或256种颜色。一般应用中,有的图像往往偏向于某一种或几种色调,此时如果采用标准调色板,则颜色失真较多。因此,同一幅图像,采用不同的调色板显示可能会出现不同的颜色效果,14,例子(调色板色彩数为16x16),真彩色显示,无需调色板,调色板与图像原有颜色匹配,故颜色偏差很小,调色板与原图不匹配,图像出现色偏,15,CLUT,Using the CLUT approach,We waste space for storing the CLUT.We save space by using fewer bits for each pixel.Usually the latter factor outweighs the first.,16,直接色,Direct Color每个像素值分成R,G,B分量,每个分量作为单独的索引值对它做变换。也就是通过相应的彩色变换表找出基色强度,用变换后得到的R,G,B强度值产生的彩色称为直接色。,17,真彩色与直接色的比较,相同之处是都采用R,G,B分量决定基色强度 不同之处是前者的基色强度直接用R,G,B决定,而后者的基色强度由R,G,B经变换后决定。产生的颜色有差别。试验结果表明,使用直接色在VGA显示器上显示的彩色图像看起来真实、很自然,虽然只有256色。,18,直接色与伪彩色的比较,相同之处是都采用查找表不同之处是前者对R,G,B分量分别进行变换,后者是把整个像素当作查找表的索引值进行彩色变换。,19,图像的分类,矢量图与点位图生成的图形图像的方法灰度图与彩色图颜色,20,矢量图,vector based image用一系列计算机指令来表示一幅图,如画点、画线、画曲线、画圆、画矩形等。这种方法实际上是数学方法来描述一幅图,然后变成许多的数学表达式,再编程,用语言来表达。在计算显示图时,也往往能看到画图的过程。绘制和显示这种图的软件通常称为绘图程序(draw programs)。,21,矢量图特点,矢量图的优点是:(1)缩放、旋转、移动时图像不会失真(2)存储和传输时数据量较小。矢量图的缺点是:(1)图像显示时花费时间比较长。(2)真实世界的彩色图像难以转化为矢量图。常见矢量图的格式是ai(adobe illustrator),cdr(CORELDRAW)wmf eps swf,22,点位图,bit mapped image把一幅彩色图分成许多像素,每个像素用若干二进制位来指定该像素的颜色、亮度和属性。一幅图由许多描述每个像素的数据组成,这些数据通常称为图像数据,存储到图像文件。,23,点位图特点,点位图的优点是:(1)显示速度快。(2)真实世界的图像可以通过扫描仪、数码相机、摄像机等设备方便的转化为点位图。点位图的缺点是:(1)存储和传输时数据量比较大。(2)缩放、旋转时算法复杂且容易失真。,24,矢量图与点位图,矢量图,点位图,25,影响点位图文件大小的因素 图像分辨率:分辨率越高,组成一幅图的像素越多,则图像文件越大。像素深度:像素深度越深,表达单个像素颜色和亮度的位数越多,图像文件就越大。而矢量图文件的大小则主要取决图的复杂程度。矢量图侧重于绘制、创造;点位图偏重于获取、复制,26,灰度图与彩色图,灰度图(gray-scale image):按照灰度等级的数目来划分。如果每个像素的像素值用一个字节表示,灰度值级数就等于256级,每个像素可以是0255之间的任何一个值 单色图(monochrome image):只有黑白两种颜色的图像。每个像素值用1位存储,值只有“0”或“1”。,27,标准单色图 标准灰度图,256色标准图像转换成的灰度图,28,黑白图象的表示,Black and white image,29,灰度图象的表示,Gray scale image,30,彩色图,可按照颜色的数目来划分,例如256色图像和真彩色(22416 777 216种颜色)等。,256色标准图像,24位标准图像,31,彩色图象的表示,32,伽马(gamma)校正,一个图像系统中一般包含输入设备(扫描仪、摄像机、数码相机)、存储设备(胶片、磁盘)和输出设备三大模块。各种涉及到光电转换的设备的输入输出特性曲线一般是非线性的例如:CRT发射光的强度与输入电压不成正比,33,34,这些非线性部件都有一个能够反映各自特性的幂函数:yxn 输出(输入)式中的(gamma)是幂函数的指数,它用来衡量非线性部件的转换特性。这种特性称为幂-律(power-law)转换特性(按照惯例,“输入”和“输出”都缩放到01之间)。所以整个图像系统的传递函数是一个幂函数。12n,35,一个图像系统追求的目标:真实的再现原始场景。由于人的视觉对亮度的感知也是非线性的,为了真实地再现原始场景,并非一定要使1如果图像再现环境为明亮环境则必须时整个图像系统的1;如果为暗淡环境,则必须使整个系统的1.25;如果为黑暗环境,则必须使系统的1.5。,36,同时对比,中间小方块是相同的,但由于周围的对比不同,看到的主观效果也不同,37,伽马()校正,实际图像系统的值并非符合我们要求的值,且是不能随意改变的。所以要求我们加入一个中间环节来校正整个系统的值,即补偿系统的非特性曲线,使之接近于应用环境所要求的值。这个过程就叫做伽马()校正。,38,校正的位置,从获取图像、存储成图像文件、读出图像文件直到在某种类型的显示屏幕上显示图像,这些个环节中至少有5个地方可有非线性转换函数,存在并可引入值。camera_exponent:摄象机中图像传感器的(0.4或0.5)encoding_exponent:编码器编码图像文件时引入 decoding_exponent:译码器读图像文件时引入 LUT_exponent:图像帧缓存查找表中引入CRT_exponent:CRT的(通常2.2),39,图像压缩,图像数据压缩的主要根据图像数据中有许多重复的数据,使用数学方法来表示这些重复数据就可以减少数据量,即无损压缩技术,人的眼睛对图像细节和颜色的辨认有一个极限,把超过极限的部分去掉,也达到压缩数据的目的,即有损压缩技术。,40,常用的图像编码,名称 性质 方法 用途 公司/组织BMP 无损 RLC Windows MSTIFF 无损 RLC,LZW desktop Aldus,MS publishingGIF 无损 LZW Internet CompuServePNG 无损 LZ77,Huffman Internet W3CJPEG 有损 DCT,Huffman Internet,数码相机 ISO,41,BMP图像文件格式,位图文件(Bitmap-File,BMP)格式是Windows采用的图像文件存储格式,在Windows环境下运行的所有图像处理软件都支持这种格式。BMP位图文件默认的文件扩展名是bmp或者dib。,42,BMP文件,BMP文件大体上分为四个部分:,43,Header,typedef struct tagBITMAPFILEHEADER WORD bfType;/*说明文件的类型*/DWORD bfSize;/*说明文件的大小,用字节为单位*/WORD bfReserved1;/*保留,设置为0*/WORD bfReserved2;/*保留,设置为0*/DWORD bfOffBits;/*说明从BITMAPFILEHEADER结构 开始到实际的图像数据之间的字 节 偏移量*/BITMAPFILEHEADER;,44,BITMAPINFOHEADER,typedef struct tagBITMAPINFOHEADER DWORD biSize;/*说明结构体所需字节数*/LONG biWidth;/*以像素为单位说明图像的宽度*/LONG biHeight;/*以像素为单位说明图像的高度*/WORD biPlanes;/*说明位面数,必须为1*/WORD biBitCount;/*说明位数/像素,1、2、4、8、24*/DWORD biCompression;/*说明图像是否压缩及压缩类型*/DWORD biSizeImage;/*以字节为单位说明图像大小*/LONG biXPelsPerMeter;/*说明水平分辨率,像素/米*/LONG biYPelsPerMeter;/*说明垂直分辨率,像素/米*/DWORD biClrUsed;/*说明图像实际用到的颜色数,如果为0 则颜色数为2的biBitCount次方*/DWORD biClrImportant;/*说明对图像显示有重要影响的颜色 索引的数目,如果是0,表示都重要。*/BITMAPINFOHEADER;,45,调色板,调色板实际上是一个数组,它所包含的元素与位图所具有的颜色数相同,决定于biClrUsed和biBitCount字段。数组中每个元素的类型是一个RGBQUAD结构。typedef struct tagRGBQUAD BYTE rgbBlue;/*指定蓝色分量*/BYTE rgbGreen;/*指定绿色分量*/BYTE rgbRed;/*指定红色分量*/BYTE rgbReserved;/*保留,指定为0*/RGBQUAD;,46,数据,紧跟在彩色表之后的是图像数据字节阵列。图像的每一扫描行由表示图像像素的连续的字节组成,每一行的字节数取决于图像的颜色数目和用像素表示的图像宽度。扫描行是由底向上存储的,这就是说,阵列中的第一个字节表示位图左下角的像素,而最后一个字节表示位图右上角的像素。,47,GIF,GIF(Graphics Interchange Format)格式由CompuServe公司于87年开发,版本号GIF87a,89年扩充后版本号为GIF89a。GIF图像文件以块(block)为单位存储信息。一个GIF文件由表示图形/图像的数据块、数据子块以及显示图形/图像的控制信息块组成,称为GIF数据流(Data Stream)。数据流中的所有控制信息块和数据块都必须在文件头(Header)和文件结束块(Trailer)之间。,48,GIF图像文件格式,49,GIF文件格式的特点,GIF文件采用了LZW无损压缩算法来存储图像数据。GIF文件允许设置背景的透明属性。GIF文件格式可在一个文件中存放多幅彩色图像并且制作出幻灯片或者动画效果。GIF文件支持图像数据的交叉存储方式,这样一个大的图像可以逐步显示,让用户首先看到图像概貌,然后逐步清晰。GIF文件定义的图像中可以加入文本。,50,JPEG,JPEG“Joint Photographic Experts Group”.ISO和IEC两个组织机构联合组成的一个专家组,负责制定静态数字图像数据压缩编码标准。开发的图像压缩算法称为JPEG算法ISO/IEC 10918,51,两种基本的JPEG压缩算法,以离散余弦变换DCT为基础的有损压缩算法,在保证图像质量的前提下为了进一步提高压缩比JPEG 2000标准中采用小波变换(wavelet)算法。以预测技术为基础的无损压缩算法。,52,用途,JPEG是一个适用范围很广的静态图像数据压缩标准,既可用于灰度图像又可用于彩色图像。JPEG不仅适于静止图像的压缩,电视图像的帧内图像的压缩编码,也常采用此算法。JPEG标准还可以大范围地调节图像压缩率及其保真度。,53,JPEG无损压缩,效果无失真压缩比为23倍8种预测模式适用于不同类型图象,54,JPEG有损压缩,JPEG有损压缩,它利用了人的视觉系统的特性,使用量化和无损压缩编码相结合来去掉视觉的冗余信息和数据本身的冗余信息。,55,JPEG编码/解码,JPEG压缩编码大致分成三个步骤:(1)使用正向离散余弦变换(forward discrete cosine transform,FDCT)把空间域表示的图变换成频率域表示的图。(2)使用加权函数对DCT系数进行量化,这个加权函数对于人的视觉系统是最佳的。(3)使用huffman可变字长编码器对量化系数进行编码。译码或者叫做解压缩的过程与压缩编码过程正好相反。,56,57,JPEG算法的主要计算步骤,正向离散余弦变换(FDCT)。量化(quantization)。Z字形编码(zigzag scan)。使用差分脉冲编码调制(differential pulse code modulation,DPCM)对直流系数(DC)进行编码。使用行程长度编码(run-length encoding,RLE)对交流系数(AC)进行编码。熵编码(entropy coding)。,58,8x8,对经过FDCT变换后的频率系数进行量化。量化是图像质量下降的最主要原因,2D-1D,目的是为了增加连续的“0”系数的个数,就是“0”的游程长度,通过DCT变换,把能量集中在少数几个系数上。,59,JPEG的压缩比与图象质量,压缩比(CR)CR=原始图象的数据量/压缩后图象的数据量压缩后图象象素的比特数=原始图象象素的比特数/CR压缩比(CR)bits/pel 效果 1632倍 0.250.5 中等好,能满足一般 应用要求 1016倍 0.50.75 好很好,能满足多数应 用要求 510倍 0.81.6 极好,能满足大多数应用 要求 25倍 1.64 几乎无失真,60,例,高质量55KB,中高质量15KB,中等质量8KB,中低质量6KB,低质量5KB,61,JPEG2000,解决JPEG的不足JPEG压缩效率不够高,在中、高码率时图像质量不错,但在低码率时(如低于0.25 bpp的细节丰富的灰度图象)图象的畸变就无法接受。一般用来压缩真彩色的人物与风景图片,对处理文字、卡通图画、线绘图等2值图象表现不佳。对于分辨率很高的图象,如不进行拼接,就无法直接处理。目前JPEG算法不允许图象大于 64K x 64K(pel)利用小波变换,62,JPEG2000与JPEG对比,3MB的原始画面,19kB的JPEG画面,19kB的JPEG2000,本章结束,