第2章 数字图像处理基础.ppt
第2章 数字图像处理基础,2.1 色度学基础2.2 人眼的视觉特性2.3 图像的数字化2.4 图像的代数运算2.5 灰度直方图2.6 图像文件格式及类型,掌握色度学基础知识理解人眼的视觉特性 掌握图像的数字化过程 了解图像的代数运算 理解灰度直方图的概念及其应用 了解图像文件的格式及类型,本章学习目标:,2.1 色度学基础,彩色是光的一种属性,没有光就没有彩色。在光的照射下,人们通过眼睛感觉到各种物体的彩色,这些 彩色是人眼特性和物体客观特性的综合效果。在太阳光的照射下,人们可以看到五彩缤纷的大自然景物。图像是由人的视觉系统接受物体透射或者反射的光学信息,然后在大脑中形成的印象和认识,是客观存在的多维物体在 人脑中的“成像”。因此要研究图像处理就得先从色度学以及人眼的视觉特 性两方面开始。,光和色 由光学理论知道,光是一种以电磁波形式存在的物质,它的波长范围大约在 380780nm(1nm10-9m)之间。由于这段电磁波的辐射能为人眼看得见,所以称为可见光,习惯上简称为光。人眼对不同波长的光引起不同的颜色感觉,例如,波长为400nm左右和波长为700nm左右的光,给人以紫和红的感觉。在可见光的范围内,按波长的依次递减,相应颜色排列为红、橙、黄、绿、青、蓝、紫七种颜色,把这些色光混合在一起就得到白光。,2.1.1 三基色原理,电磁波谱,把一束光(太阳光)斜射到玻璃棱镜上,通过棱镜折射后,可将其分解为波长由长到短排列的红、橙、黄、绿、青、蓝、紫七色彩带,如下图所示。这种现象也表明了白光不是单色光,而是由七色光合成的。,太阳光的分解,光和色本质上是一回事,色是光的一种形式,色既是客观物质,又是人眼对客观物质的视觉反映,色觉是视觉的一种特性。,亮度、色调和色饱和度称为彩色三要素。任何一种彩色对人眼引起的视觉作用,都可以用彩色三要素来描述。1)亮度:亮度是指人眼所感觉的彩色的明暗程度,亮度取决于光线的强弱。另外,亮度与波长的长短有关,强度相同但波长不同的光给人眼的亮度感觉也是不同的,生活中观察15W的绿色灯泡发出的光比15W的红色灯泡亮,15W的红色灯泡比15W的蓝色灯泡亮,就是这个道理。,彩色三要素:,光强度是指光波作用于感受器所发生的效应,其大小是由物体反射系数来决定,反射系数越大,物体的光强度愈大,反之愈小。,2)色调:色调是指彩色的颜色类别,如红、橙、黄、绿、青、蓝、紫分别表示不同的色调。色调取决于彩色的光谱成分,不同波长的光具有不同的色调。,彩色三要素,色度是由物体反射光线中占优势的波长来决定,不同的波长产生不同的颜色感觉,如红、橙、黄、绿、青、蓝、紫等。它是彩色最为重要的属性,是决定颜色本质的基本特性。,3)色饱和度:色饱和度是指彩色的深浅程度。同一色调的彩色,其色饱和度越高,颜色越深。色饱和度与彩色中所掺入的白光比例有关,掺入的白光越多,色光越浅,色饱和度越低。色饱和度用百分数表示,如某色光中若掺入一半的白光,则色饱和度为50%,未掺入白光的纯色光,其色饱和度为100%。白光的色饱和度为0。,彩色三要素,色调和色饱和度统称为色度。彩色电视系统不仅像黑白电视系统那样能够传送景物的亮度信息,还要传送景物的色度信息。,三基色原理和混色法,三基色原理:实验证明,将红、绿、蓝三种色光投射到一个白色的屏幕上,调节三种色光的不同比例,几乎可以混合出自然界所有的彩色。用来混色的三种单色光称为基色。用三基色可以混合成其他彩色的原理称三基色原理。在电视技术中,以红(R)、绿(G)、蓝(B)为三基色,红光的波长取700nm,绿光的波长取546.1nm,蓝光的波长取435.8nm。,三基色原理:,三基色原理的主要内容有:1)自然界的所有彩色几乎都可用三种基色按一定的比例混合而成;反之,任何彩色也可分解为比例不同的三种基色;2)三种基色必须是相互独立的,即任一基色不能由另外两种基色混合而成;3)用三基色混合成的彩色,其色调和色饱和度皆由三基色的比例决定;4)混合色的亮度等于参与混色的基色的亮度的总和。,混色法:,彩色电视重现景物的彩色,通常是靠彩色显像管荧光屏上的三种荧光粉在电子束轰击下发出各自的基色光而完成的,即它们分别发出红、绿、蓝三种基色光,并混合成彩色图像,这三种基色称为显像三基色。,利用三基色按不同的比例混合来获得彩色的方法称为混色法。彩色显像管之所以能够显示出各种各样的丰富多彩的彩色是利用了三基色的混色原理。彩色显像管中的荧光粉粒本身是发光体,它的混色规律是遵从相加混色法,即以彩色光的互相叠加来实现混色产生另一种新的彩色光。相加混色法的混色规律可用下图表示:,相加混色,以等量的红、绿、蓝三基色光进行相加混色效果如下:红色十绿色=黄色;绿色十蓝色=青色;蓝色十红色=紫色;红色十绿色十蓝色=白色。,三种基色是相互独立的,任何一种基色都不能有其它两种颜色合成。根据人眼的三基色吸收特性,人眼所感受到的颜色其实是三种基色按照不同比例的组合。国际照明委员会(CIE)为了建立统一的标准,于1931年制定了特定波长的三基色标准:蓝(B=435.8nm)、绿(G=546.1nm)、红(R=700nm)。这样,任一彩色C均可表示为:,其中C为未知色光,(R),(G),(B)为三基色光,C,R,G,B 为调配系数。,2.1.2 颜色模型 为了科学地定量描述和使用颜色,人们提出了各种颜色模型。目前常用的颜色模型按用途可分为两类,一类面向诸如视频监视器、彩色摄像机或打印机之类的硬件设备。另一类面向以彩色处理为目的的应用,如动画中的彩色图形。面向硬件设备的最常用彩色模型是RGB模型,而面向彩色处理的最常用模型是HSI模型。另外,在印刷工业上和电视信号传输中,经常使用CMYK和YUV色彩系统。,(1)RGB模型 RGB颜色空间是图像处理中最基础的颜色模型,它是在配色实验基础上建立的。其RGB彩色空间示意图如图所示,RGB颜色空间的主要观点是人的眼睛有红、绿、蓝3种色感细胞,它们的最大感光灵敏度分别落在红色、蓝色和绿色区域,其合成的光谱响应就是视觉曲线,由此可推论出任何彩色都可以用红、绿、蓝3种基色来配制。,其中C为未知色光,N,P,Q为三基色光,c,n,p,q 为调配系数。,RGB彩色空间示意图,(2)HSI模型 HIS颜色模型是Munseu(孟赛尔)颜色系统中的一种,以人眼的视觉特征为基础,利用三个相对独立、容易预测的颜色心理属性:色度(Hue)、光强度(Intensity)和饱和度(Saturation)来表示颜色,反映了人的视觉系统观察彩色的格式。,HIS颜色系统模型:,(3)HIS 与 RGB 之间的非线性映射对任何3个0,1范围内的R、G、B值,其对应HSI模型中的I、S、H分量的计算公式为,常见彩色图像处理流程:,RGB,R,G,B,HSI,H,S,I,2.2 人眼的视觉特性,2.2.2图像在人眼中的形成过程:,人眼在观察景物时,光线通过角膜、晶状体、玻璃体的折射,在视网膜上显出景物的影像(倒立的像),构成光刺激。视网膜上的光敏细胞感受到强弱不同的光刺激,相应的产生强度不同的电脉冲,并经由神经纤维传送至视神经中枢,经过大脑皮层的综合分析,从而产生视觉。人眼成像的过程如图所示:,人眼成像过程,2.2.3 亮度范围和分辨率,1人眼的亮度感觉范围 根据人眼机理及人的视觉模型,人眼感知的主观亮度和实际的客观亮度之间并非完全相同,但是有一定的对应关系。人眼能够感觉的亮度范围(称为视觉范围)非常宽,从千分之几尼特到几百万尼特,这是由于瞳孔对光敏细胞具有一定的调节作用。瞳孔根据外界光的强弱调节其大小,使射到视网膜上的光通量尽可能是适中的。在强光和弱光下,分别由锥状细胞和杆状细胞作用,而后者的灵敏度是前者的1万倍。在不同的亮度环境下,人眼对于同一实际亮度所产生的相对亮度感觉是不相同的。另外,当人眼适应了某一环境亮度时,所能感觉范围将变小很多。人眼的明暗感觉是相对的,但由于人眼能适应的平均亮度范围很大,总的来说,人眼的视觉范围是很宽的。,2.人眼的分辨率 人眼的分辨率与环境照度有关,当照度太低时,只有杆状细胞起作用,则分辨率下降;但照度太高则可能引起“眩目”现象。人眼的分辨率还与被观察对象的相对对比度有关。当相对对比度小时,对象和背景亮度很接近,使得人眼的分辨率下降。,分辨力 人眼在一定距离上能区分开相近两点的能力,用能区分开的最小视角之倒数来描述=1/,2.2.4 视觉适应性 当我们从明亮的阳光下进入正在放映电影的电影院时,除了可以很清晰的看到屏幕上的图像外,其他都会是一片漆黑,只有过一段时间后,我们对周围的视觉才能恢复,这种适应过程大约需要十几秒到三十秒钟。人眼对这种从亮突变到暗环境的适应能力称为暗适应性。相比之下,人们从黑暗中走到光亮处,视觉能很快恢复,亮适应性过程要短很多。这是由于锥状细胞恢复工作所需的时间要比杆状细胞少得多。,人眼的适应:(1)亮度适应,暗亮 亮适应 适应时间短几秒钟亮暗 暗适应 适应时间长30秒,(2)颜色适应,随着光的波长分布变化,研究眼睛对于颜色刺激产生变化的特性;强红光刺激后,将黄色看成绿色。,2.2.5人眼视觉的时间特性(1)视觉起始特性 在加入阶跃光波刺激时所产生的感觉变化,在刺激后几十毫秒时感觉才达到顶点,然后慢慢减少到一个常值。人眼视觉曲线的上升沿时间随着刺激光强的增加而缩短。,(2)视觉惰性,人眼的亮度感觉不会随着物体亮度的消失而立即消失,而有一个过渡时间,这为视觉惰性。在亮度消失以后尚能保持1/20 1/10秒;当闪烁光源每秒钟闪烁次数越过10 20次时便会给人以均匀发光体的感觉,电影画面24幅/s。,2.2.6 亮度对比效应,人眼对亮度差别的感觉是由相对亮度的变化决定的,同时相对亮度也会影响人眼对目标的感觉亮度,而且在客观亮度的突变处,人眼感觉的主观亮度会出现超调现象。,1.同时对比效应 大小和亮度均相同的四个小正方形的物体处于不同的亮度背景中,当人同时观察目标物与背景时,会感到较暗背景中的目标物较亮,而较亮背景中的目标物则较暗。这是由于人的视觉灵敏度在高亮度背景下会下降。这种效应称为同时对比效应。如图所示。同时对比效应还包括以下几种情况。,同时对比效应:,(1)当目标物具有相同亮度时,人会感到暗背景中的目标物较亮,而亮背景中的目标物较暗。(2)当两个不同亮度的目标物处于不同亮度的背景中时,人会按照 对比度感觉目标物的亮度对比。(3)当人眼观察对比度相近的两个目标物时,会认为两个目标物的 亮度接近,这种现象称为亮度恒定现象。,2 马赫效应 马赫现象是1868年由奥地利物理学家E.马赫发现的一种明度对比现象,是指人们在明暗交界处感到亮处更亮、暗处更暗的现象。它是一种主观的边缘对比效应。当亮度发生跃变时,在亮暗边缘附近,亮侧亮度上冲、暗侧亮度下冲的现象。,由8个亮度逐渐减弱且连在一起的窄带组成的图像,其中每个窄带的亮度是分布均匀的。但由于人类的视觉系统有增强边缘对比度的机制,在亮度变化的地方会出现虚幻的亮或暗的条纹,即增强了轮廓。,马赫效应示意图:,3人眼的错觉现象 人眼视觉系统所感觉到的物体的形状,并不是简单的投影到视网膜上原封不动的形状,其对形状的感觉受物体自身形状及其周围背景的影响。,2.3 图像数字化技术,所谓的图像数字化,是指将模拟图像经过离散化之后,得到用数字表示的图像。图像的数字化包括了空间离散化(即采样)和明暗表示数据的离散化(即量化)。,f(x,y),图像的数字化 采样概念,采样 是指将在空间上连续的图像转换成离散的采样点(即像素)集的操作。由于图像是二维分布的信息,所以采样是在 x轴和y轴两个方向上进行的。一般情况下,x轴方向与y轴方向的采样间隔相同。,图像的数字化 采样概念,空间坐标(x,y)的数字化被称为图像采样 确定水平和垂直方向上的像素个数N、M,图像的数字化 采样间隔,采样时的注意点是:采样间隔 的选取。采样间隔太小,则增大数据量;太大,则会发生信息的混叠,导致细节无法辨认。,图像的采样与数字图像的质量,图像的采样与数字图像的质量,图像的数字化 采样效果演示示例,细节清晰,数据量为100%,细节无法辨认,数据量为1%,图像的数字化 采样指标分辨率,分辨率 是指映射到图像平面上的单个像素的景物元素的尺寸。单位:像素/英寸,像素/厘米(如:扫描仪的指标 300dpi),分辨率 或者是指要精确测量和再现一定尺寸的图像所必需的像素个数。单位:像素*像素(如:数码相机指标30万像素(640*480),对一个频谱有限(|u|umax且|v|vmax)的图像信号 进行采样,当采样频率满足式(1.2.3)、式(1.2.4)条件时,采样函数 便能无失真地恢复为原来的连续信号。umax,vmax分别为信号 在两个方向的频域上的有效频谱的最高角频率;ur,vs分别为二维采样频率,ur=2/Tu,vs=2/Tv,实际上,常取Tu=Tv=To。,(1.2.3),(1.2.4),图像的数字化 量化概念,量化是将各个像素所含的明暗信息离散化后,用数字来表示。一般的量化值为整数。充分考虑到人眼的识别能力之后,目前非特殊用途的图像均为8bit量化,即采用0 255的整数来描述“从黑到白”。在3bit以下的量化,会出现伪轮廓现象。,量化示意图:,图像的量化,函数取值的数字化被称为图像的量化,如量化到256个灰度级,灰度级:表示像素明暗程度的整数量 例如:像素的取值范围为0-255,就称该 图像为256个灰度级的图像层次:表示图像实际拥有的灰度级的数量 例如:具有32种不同取值的图像,可称该图像具 有32个层次图像数据的实际层次越多,视觉效果就越好,图像的量化与数字图像的质量,低bit量化的伪轮廓现象图例,图像的数字化 量化方法,量化可分为均匀量化和非均匀量化。均匀量化是简单地在灰度范围内等间隔量化。非均匀量化是对图像中像素灰度值频繁出现的灰度范围,量化间隔取小一些,而对那些像素灰度值极少出现的范围,量化间隔取大一些。,一般情况下,对灰度变化比较平缓的部分用比较多的量化级,粗采样;在灰度变化比较剧烈的地方应采用更高的分辨率,粗量化。,一般,当限定数字图像的大小时,为了得到质量较好的图像可采用如下原则:(1)对缓变的图像,应细量化,粗采样,以避免假轮廓。(2)对细节丰富的图像,应细采样,粗量化,以避免模糊(混叠)。对于彩色图像,是按照颜色成分红(R)、绿(G)、蓝(B)分别采样和量化的。若各种颜色成分均按8bit量化,即每种颜色量级别是256,则可以处理256256256=16 777 216种颜色。,非统一的图像的采样:在灰度级变化尖锐的区域,用细腻的采样,在灰度级比较平滑的区域,用粗糙的采样,图像的采样和量化:,非统一的图像的量化:在边界附近使用较少的灰度级。剩余的灰度级可用于灰度级变化比较平滑的区域;避免或减少由于量化的太粗糙,在灰度级变化比较平滑的区域出现假轮廓的现象.,图像的采样和量化:,均匀量化效果示意图,非均匀量化效果示意图,均匀量化与非均匀量化效果的比较,量化与采样的效果图例,原图 低灰度级量化 低分辨率,2.5 灰度直方图,在数字图像处理中,灰度直方图是最简单且最有用 的工具,可以说,对图像的分析与观察,直到形成一个有效的处理方法,都离不开直方图。,2.5.1 概念 对一幅数字图像,若对应于每灰度值,统计出具有该灰度值的像素数,并据此绘出像素数-灰度值图形,则该图形称该图像的灰度直方图,简称直方图。直方图是以灰度值作横坐标,像素数作纵坐标。有时直方图亦采用某一灰度值的像素数占全图总像素数的百分比(即某一灰度值出现的频数)作为纵坐标。,数字图像的灰度直方图 定义,灰度直方图是灰度级的函数,是对图像中灰度级分布的统计。有两种表示形式1)图形表示形式 横坐标表示灰度级,纵坐标表示图像中对应某灰度级所出现的像素个数。2)数组表示形式 数组的下标表示相应的灰度级,数组的元素表示该灰度级下的像素个数。,数字图像的灰度直方图 计算例,灰度直方图,灰度图像的直方图,在离散的形式下,用rk代表离散灰度级,用P(rk)代表概率密度函数,并且有下式成立:式中nk为图像中出现rk这种灰度的像素数,n是图像中像素总数,nk/n就是概率论中的频数,l是灰度级的总数目。在直角坐标系中作出rk与P(rk)的关系图形,就得到直方图。,灰度图像直方图,图像的直方图,图像及对应的灰度直方图:,灰度图像直方图的计算示例,灰度直方图计算示意图,2.5.2 直方图的性质,(1)直方图是一幅图像中各像素灰度值出现次数(或频数)的统计结果,它只反映该图像中不同灰度值出现的次数(或频数),而未反映每一灰度值像素所在位置。也就是说:,它只包含了该图像中某一灰度值的像素出现的概率,而丢失了其所在位置的信息。,所有的空间信息全部丢失,直方图的性质,(2)任一幅图像,都能唯一地算出一幅与它对应的直方图,但不同的图像,可能有相同的直方图。也就是说:,图像与直方图之间是一种多对一的映射关系。,直方图的性质,图像与直方图之间是一种多对一的映射关系。,直方图的性质,(3)直方图是对具有相同灰度值的像素统计计数得到的。,一幅图像各子区的直方图之和就等于该图全图的直方图。,2.5.3 直方图的应用,前面提到过,灰度直方图是最简单的,最有用的工具。简单性从其一维的数据形式,以及简单的计算方法可以感受到。有用性,在这里通过几个应用例子来说明。,数字图像的灰度直方图应用 数字化参数,直方图给出了一个简单可见的指示,用来判断一幅图像是否合理的利用了全部被允许的灰度级范围。一幅图像应该利用全部或几乎全部可能的灰度级,否则等于增加了量化间隔。丢失的信息将不能恢复。,灰度图像的直方图,图像灰度分布概率密度函数,灰度图像的直方图,从上图中的(a)和(b)两个灰度密度分布函数中可以看出:(a)的大多数像素灰度值取在较暗的区域,所以这幅图像肯定较暗,一般在摄影过程中曝光过强就会造成这种结果;(b)图像的像素灰度值集中在亮区,因此,图像(b)的特性将偏亮,一般在摄影中曝光太弱将导致这种结果。,显然,从两幅图像的灰度分布来看图像的质量均不理想。,灰度图的灰度直方图例,灰度分布效果图例,例:直方图显示与灰度图像的关系,灰度图像与对应直方图的显示,例:直方图显示与彩色图像的关系,三个颜色分量的灰度直方图,数字图像的灰度直方图应用 分割阈值选取,假设某图像的灰度直方图具有 二峰性,则表明这个图像较亮的区域和较暗的区域可以较好地分离。取二峰间的谷点为阈值点,可以得到好的二值处理的效果。,灰度直方图具有二峰性,具有二峰性的灰度图的二值化,2.6 图像文件格式及类型,数字图像有多种存储格式,每种格式一般由不同的开发商支持。随着信息技术的发展和图像应用领域的不断拓宽,还会出现新的图像格式。1.BMP 文件格式 是一种与文件无关的图像文件格式,是一种位映射的存储形式。是Windows软件推荐使用的一种格式。应用广泛。,2.6.1 图像文件格式,位图文件参数头:,2.GIF文件格式 是以数据块为单位来存储图像的相关信息,在不同的系统平台上交流和传输图像,它是在Web及其他联机服务上常用的一种文件格式。其特点是压缩比高,磁盘空间占用较少,因此这种图像格式在实际中有广泛的应用。最初的GIF只能用来存储单幅静止图像,后来随着技术的发展,能够同时存储多幅静止图像进而形成连续的动画。虽然GIF格式只能保存最大8位色深的数码图像,但由于这种格式短小、下载速度快、可用许多同样大小的图像文件组成动画等多种优势,使得这种格式在网络上得到广泛的应用。,3.TIFF 图像文件格式 它是现存图像文件格式中最复杂的一种,它提供存储各种信息的完备的手段,可以存储专门的信息而不违反格式宗旨,是目前流行的图像文件交换标准之一。由于其图像格式复杂、存储信息多,其存储的图像层次丰富,细节信息非常多,图像质量也随之提高,因此非常有利于原稿的复制。该格式分为压缩和非压缩两种形式。其中压缩采用的是无损压缩方案。,4.JPEG图像格式 JPEG是一种常用的图像格式,其扩展名为.jpg或者.jpeg,其压缩技术非常先进,它采用的是有损方式来去除冗余的图像和彩色数据,可以在获得极高的压缩率的同时得到质量较好的图像。JPEG格式主要是为了解决专业摄影师所遇到的图像信息过于庞大的问题。由于JPEG的高压缩比和良好的图像质量,使得它广泛应用于多媒体和网络程序中。JPEG是对静止灰度或彩色图像的一种国际压缩标准。,5.JPEG2000格式 JPEG2000是作为JPEG的升级版出现的,其压缩率比JPEG高出约30左右。与JPEG的不同之处在于:JPEG2000可同时支持有损和无损压缩,而JPEG只能支持有损压缩。而无损压缩对于保存一些重要图片是非常必要的。JPEG2000还有一个特别之处在于它能实现渐进传输,即先传输图像的轮廓,然后逐步传输数据,不断提高图像的质量,使得图像在显示时从朦胧到清晰逐渐转变。JPEG2000能够应用于传统的JPEG市场,如扫描仪、数码相机等,也可应用于新兴领域,如网络传输、无线通讯等。,6.PNG格式 PNG(Portable Network Graphics)是一种新兴的网络图像格式。其具有以下几个突出优点:PNG是目前保证最不失真的格式,它综合了GIF和JPG二者 的优点,存贮形式丰富,兼有GIF和JPG的色彩模式;能把图像文件压缩到极限以利于网络传输,同时又能保留 所有与图像质量有关的信息;显示速度很快,只需下载1/64的图像信息就可以显示出低 分辨率的预览图像;PNG支持透明图像的制作,透明图像在制作网页图像的时 候很有用.PNG的缺点是不支持动画应用效果。,1.黑白图像(二值图像),2.6.2 数字图像类型,2.灰度图像,3.彩色图像(索引图像和真彩色图像(RGB)图像)彩色图像除有亮度信息外,还包含有颜色信息。彩色图像的表示与所采用的彩色空间,即彩色的表示模型有关,同一幅彩色图像如果采用不同的彩色空间表示,对其的描述可能会有很大的不同。常用的表示方法主要有真彩色图像(RGB)图像和索引图像。,