第二章图像和视觉基础.ppt
数字图像处理(Digital Image Processing),湖北师范学院教育信息与技术学院,第二章 图像和视觉基础,2.1 光的特性 2.2 视觉系统2.3 颜色模型 2.3.1 CIE色度图 2.3.2 常用颜色模型2.4 图像的表示,2.1 光的特性,光的本质是电磁波。在电磁波谱中,可见光仅占很窄的一个波谱范围。其波长在0.380.76m之间。下图示出电磁波谱的大致划分。可见光的低频率端是红色,高频率段是紫色。从高频到低频的光谱颜色的变化分别是紫、蓝、青、绿、黄、橙、红。,太阳或灯泡等光源发射可见光谱中的全部频率而产生白色光。当白色光投射到一个物体上时,某些频率被反射,某些则被物体吸收了。在反射光中混合的频率确定了人所感受到的物体的颜色。如果在反射光中以低频率为主,则物体呈现红色,此时,可以说光主要含有光谱中红色端的频率。除了频率以外,描述光的各种性质还需要另一些特征。在观察光源时,我们的眼睛对颜色(或主频率)和另外两个基本的感觉作出反应。其中之一是亮度,即感受到的光明度。第二个感受的特征是光的纯度或饱和度。这三种特征:主频率、明度和纯度通常用来描述光源的不同性质。通常用色度说明纯度和主频率这两种颜色特征。另外,人的眼睛只能看到可见光部分,但就目前科技水平看,能够成像的并不仅仅是可见光。一般来说可见光的波长为0.380.76m,而迄今为止人类发现可成像的射线已有多种,如:射线:0.0030.03nm;X射线:0.033nm;紫外线:3300nm;红外线:0.8300m;微波:0.3100cm。这些射线均可以成像。利用图像处理技术把这些不可见射线所成图像加以处理并转换成可见图像,实际上大大延伸了人类视觉器官的功能,扩大了人类认识客观世界的能力。,2.1.1 光度学基本概念,辐射度量学:是研究各种电磁辐射强弱的学科。光度学:是研究光的强弱的学科,光通量的单位:lm(流明)。点光源:线度足够小,或距离观察者足够远的光源。发光强度I:点光源沿某个方向上单位立体角d内发出的光通量。单位:cd(坎);1 cd=1 lm/sr,点光源的立体角(solid angle)是从一点(称为立体角的顶点)出发通过一条闭合曲线上所有点的射线围成的空间部分,所以立体角表示由顶点看闭合曲线时的视角。可以取一立体角在以其顶点为球心所作的球面上截出部分的面积与球面半径的平方之比作为对该立体角的度量。立体角的单位是球面度,记为sr。一个球面度对应在球面上所截取的面积等于以球半径为边长的正方形面积时的立体角。扩展光源:有一定发光面积的光源光度学亮度B(单位:cd/m2)为:,照度(illumination)一个被光线照射的表面上的照度定义为照射在单位面积上的光通量。设面元dS上的光通量为dF,则此面元上的照度E为:单位:lx(勒克斯),1 lx=1 lm/m2 照度是光源对物体辐射的一种量度,比较客观;亮度是观察者对物体表面光强的量度,比较主观。,2.1.2 一个简单的成像模型 图像成像模型可表达为一个2-D亮度函数f(x,y),因为亮度是能量的量度,一定不为零且为有限值,即:。它受到两个因素的影响,1)入射到可见场景上的光量;2)场景中目标对入射光反射的比率。它们分别用照度成分 i(x,y)和反射成分 r(x,y)表示。i(x,y)是由光源决定的;r(x,y)是由场景中的目标特性所决定的。有:,2.2 视觉系统,2.2.1 视觉基础 眼睛中的光接受器主要是视网膜中的视觉细胞(两种:锥状体和杆状体)。锥状体:只有在光线明亮的情况下才起作用,具有辨别光波波长的作用,因此对颜色非常敏感。锥状体约为700万个/眼睛。杆状体比锥状体的灵敏度高,在较暗的光线下就能起作用,没有辨别颜色的能力,又叫夜视觉,所以黑暗中看到的东西没有颜色,其数量大约有1亿三千万个。当眼睛接受到的光包含所有可见光信号,且其强度大体相近时,人们感觉到的是没有颜色的白光。在光源为白光的照射下,若物体能反射80%以上的入射光,则看上去是白色的。若反射光小于3%,物体看上去是黑色的,中间值对应不同程度的灰色。为了表示方便,光强度可以规一化到01之间,0对应黑色,1对应白色,中间值对应灰色。,光能本身是无颜色的,颜色是人们眼睛感知光后产生的生理和心理现象。眼睛对光的感觉称为光觉,对颜色的感觉称为色觉,这是眼睛的基本特性。光觉的门限值大约为110cd/m(尼特),人眼感觉光的范围的最大值和最小值之比达到10以上。但人的眼睛并不能同时对这样大范围的明亮程度都作出反应。某一时刻眼睛只能感知很小范围的明亮度。一般情况下,在相同亮度的刺激下,背景亮度不同所感觉到的明暗程度也不同,例如白天我们看不见星星,而夜晚却能看到。同样,在观察颜色时,在图形的色度一样,但背景颜色不一样时,感觉到的图像的色度也不一样。这种现象叫做对比现象。对比现象包括亮度对比和颜色对比。实验表明,在背景亮度比目标亮度低的场合,感觉目标有一定亮度。当背景亮度比目标亮时,看到的目标就有亮的多的感觉。同时,对比效果在背景大的场合比较显著。,整体视觉过程 视觉“视”“觉”,2.2.2 视觉过程,1光学过程,15/100=2.55/17,2化学过程 主要有锥细胞和柱细胞两种细胞起作用。锥细胞数量少,对颜色很敏感,它在明视觉或亮光视觉中起到主要作用。柱细胞数量多,分辨率比较低不感受颜色并对低照度较敏感,它在暗视觉或微光视觉中起到主要作用。3神经处理过程 每个视网膜接收单元都与一个神经元细胞借助突触(synapse)相连,每个神经元细胞借助其它的突触与其它细胞连接,从而构成光神经(optical nerve)网络,光神经进一步与大脑中的侧区域(side region of the brain)连接,并到达大脑中的纹状皮层(striated cortex),对光刺激产生的响应经过一系列处理最终形成关于场景的表象,从而将对光的感觉转化为对景物的知觉。,这两个图形在视网膜上是固定不动的,但你对它的感觉却是在两种可能 图形中动摇。同时感觉到两种有意义的图形是很困难的!,女人腿还是男人腿?,2.2.3成像中的空间关系,1.成像几何 1)投影变换:将3-D客观场景投影到2-D图像平面 2)成像过程:,2.观察距离和角度 正常人视力的角区分能力约为一分。在观察感兴趣场景时,需要使其中最小的细节在眼睛的视场中对应一个约一分的弧所对应的角。如果一个点在眼睛的视场中对应不到一分的弧所对应的角,则人观察不到这个点。如果两个相邻点与眼睛间连线的夹角不到一分,则人分辨不出这两个点。因此,如果给定点的尺寸,则可确定最远观察距离;如果给定观察距离:则能确定能看见的最小点。有以下关系:最佳观察距离=3400*图像高度/显示线数,3.景深示意图,2.2.4 视觉系统对光的感知特点,1.人眼适应的亮度范围(1)总体范围大:从暗视觉门限到眩目极限之间的范围在1010量级(2)具体范围小:一般范围在102量级,2.亮度变化的感知 人类视觉系统对亮度变化的感知比对亮度本身要敏感,而且对光强度的响应不是线性的,而是对数形式的(即:对暗光时亮度的增加比对亮光时亮度的增加更敏感)。因此,有时会产生一些错觉,如马赫效应等。,视觉错觉,2.3 颜色模型,白光通过棱镜,就会折射出颜色的光谱。一般可以分解成红、橙、黄、绿、蓝、青、紫七色。可见光谱的每部分都有它自己唯一的值,它被称之为颜色,理论上可以选择几百万种颜色。可见光谱可以由多种颜色构成,但是人们一般只看到一种颜色,它是多种颜色混合后结果。因为人眼有把多种颜色相混合的能力。在心理生物学上,颜色由其色彩、色饱和度和明度决定。色彩即颜色的“色彩”,它是某种颜色据以定义的名称。色饱和度是单色光中掺入白光的度量,单色光的色饱和度为100%,白光加入后,其色饱和度下降,非彩色光的色饱和度为0%,明度为光的强度值。在心理物理学上,与色彩、色饱和度和明度相对应的是主波长、色纯和亮度。在可见光谱上,单一波长的电磁能所产生的颜色是单色的。光的颜色由其主波长决定,亮度与光的能量成比例,它是单位面积上所接受的光强。纯的单色光在实际生活中是少见的,人们所看到的颜色都是混合色。彩色图形显示器(CRT)上每个像素都是由红、绿、蓝三种荧光点组成,这是以人类视觉颜色感知的三刺激理论为基础设计的。三刺激理论基于这样一个假设:人类眼睛视网膜中的锥状视觉细胞,分别对红、绿、蓝三种光最敏感。实验表明,对蓝色敏感的细胞对波长为440nm左右的光最敏感;对绿色敏感的细胞对波长为545nm左右的光最敏感;对红色敏感的细胞对波长为580nm左右的光最敏感。实验还显示,人类眼睛对蓝光的灵敏度远远低于对红光和绿光的灵敏度。,2.3.1 CIE色度图 两种不同的颜色可以混合生成另一种颜色。如果两种颜色混合成白色光,它们就被称为互补色。红色和青色,绿色和品红,以及蓝色和黄色都是互补色。适当选择两种或多种初始颜色,可以形成许多其它颜色。用来生成其它颜色的初始颜色称为基色。在实际的基本颜色中,没有哪一组集合能组合生成所有可见的颜色。然而,三种基色对多数应用来说是足够的。通常采用红、绿、蓝作为三种基色,即RGB加色系统。下图示出用来生成任何一种光谱颜色的红、绿、蓝色的量。从曲线图中可知,500nm波长附近的颜色只能从蓝光和绿光混合相加所得的光中再加负红光才能得到。但实际上不存在负的光强,因此,RGB彩色监视器不能显示500nm波长左右的颜色。,颜色匹配所需的RGB基色量:,由于没有哪一组彩色光源可用来组合显示所有可能的颜色,国际照明委员会(CIE)在1931年定义了三种标准基色X,Y,Z。这三种基色是想像的颜色。定义这三基色的同时还定义了一组彩色匹配函数,如下图所示。图中曲线不是代表基色的光谱,而是用来代表匹配各种可见色光所需的每一种基色的量。这就给出了定义各种颜色的国际标准,而且使用CIE基色避免了颜色的负值匹配。,颜色匹配所需的XYZ基色量:,CIE规定三基色为XYZ,任何一种颜色C可以表示成:CXXYYZZ 其中,X,Y,Z是为匹配颜色C所需标准基色的量。如果只考虑颜色的色彩和纯度,那么可以将式(8-42)中的亮度规范化,即作如下计算:xX/(XYZ),yY/(XYZ),xZ/(XYZ)这里,xyz=1。因此,任何一种颜色可仅用x和y表示出来。由于x和y仅依赖于色彩和纯度,所以称为色度值。色度值表示生成一种颜色所需X,Y,Z三基色的相对量,但不表示颜色的亮度,亮度由Y表示,X和Z可根据它们对Y的比例来确定。下图为国际照明委员会给出的CIE色度图,其图形轮廓线代表所有可见光波长的轨迹,线上数字标明该位置可见光的波长。红色位于图的右下角,绿色在图顶端,蓝色在图左下角,连接光谱轨迹两端点的直线称为紫色线,它并不属于光谱。内部的点表示所有可能的可见颜色的组合,中间的C点对应于亮白色位置,它用作平均日光的近似标准。由于规范化,色度图中没有亮度值,具有同一色度但不同亮度的颜色位置相同。,CIE色度图有多种用途。欲获得一种光谱色的补色,只需从这一点通过C点作一条直线,求出其与对側光谱轨迹的交点,即可求得补色波长,如上图中C1的补色为C2,或者说C1和C2互为补色。两种补色按一定比例相加得白色。求一种颜色的主波长时,只要连接颜色所在位置与C点的直线,直线与位于颜色同侧的光谱轨迹线交点即为主波长,如下图中C3的主波长为C4。但如果交点在紫色线上,则主波长应是位于颜色反侧的光谱轨迹线交点,如图8.27中C5同C点相连同侧的交点为C6,在紫色线上,因此C5的主波长为反侧的C7。单纯色或全饱和色位于光谱轨迹上,其色纯度为100%,而C点色纯度为O%。任一中间颜色的色纯度即等于C点与它之间距离除以C点至光谱轨迹线或紫色线之间的距离。例如上图中C3颜色的色纯约等于25%,而C4颜色的色纯为100%,色纯度用百分数表示。,用CIE色度图确定补色、主波长和纯度,CIE色度图,色度图,2.3.2 常用颜色模型1.RGB颜色模型 国际照明委员会选择红色(波长=700.00nm)、绿色(波长=546.1nm)、蓝色(波长=435.8nm)三种单色光作为表色系统的三基色,这就是CIE的RGB(Red,Green,Blue)颜色表示系统。我们通常使用的彩色光栅显示器采用的就是RGB颜色模型系统。RGB颜色模型是相加混色,称为加色系统。白光可以由RGB三种基本色相加得到。产生1lm(流明)的白光所需要的三基色近似值可以用下面的亮度方程来表示:1lm(白光)0.30lm(红)0.59lm(绿)0.11lm(蓝)即产生白光时,三基色的比例关系不等,这给实际使用带来一些不方便。为了克服这一缺点,使用了三基色单位制,即所谓的T单位制。在使用T单位制时,其方程可以改写如下:1lm(白光)1T(红)1T(绿)1T(蓝)即1T单位红光=0.30lm,1T单位绿光=0.59lm,1T单位蓝光=0.11lm。由不同的RGB分量相加就可以产生其他的颜色,即:CrRgGbB式中C为混合色,r,g,b为使用T单位制时,所需要RGB三基色的量值,取值范围在01之间。然而,仍然有不少颜色无法用RGB表示出。下图中三角部分标出了RGB颜色模型系统所能表示的颜色区域。,RGB加色系统,RGB颜色模型,2.CMY颜色模型 以品红、青、黄(Cyan,Magenta,Yellow)作为三基色所构成的颜色模型也是一种常用的颜色表示系统。它是一种减色系统。CMY减色系统和RGB加色系统颜色互为补色。所谓某颜色的补色是从白色中减去这种颜色后所得的颜色。品红是绿色的补色,青色是红色的补色,黄色是蓝色的补色。即相加系统的补色就是相减系统的基色(R+G=黄,G+B=青,R+B=品红)。下图示出了CMY和RGB的关系。,减法系统,与彩色光栅显示器RGB三支电子枪轰击屏幕荧光粉组合光颜色不同,打印机和绘图仪之类的硬拷贝设备是通过往纸上涂颜料来生成彩色图片。我们通过反射光来看见颜色,这是一种减色处理。正如白色光经过品红色物体表面的反射或透射后,光谱中绿色部分被吸收和减去,人们看到物体呈现品红色,是一个减色过程。摄影的滤光镜也是利用这一原理。打印、绘图、印刷、胶卷以及非发光显示器等反射体通常采用CMY减色系统。使用CMY减色系统的打印处理通过四个墨点的集合来产生颜色点。三种基色(品红、青和黄)各使用一点,黑色也使用一点。因为品红色、青色和黄色墨水的混合通常生成深灰色而不是黑色,所以黑色单独包括在其中,使颜色效果更好。通过三种基色的墨水相互混合,产生不同颜色的组合。加上黑墨水后的颜色系统也称为CMYB模型。,3.HSI模型 也称为视觉生理模型。色调(H,Hue)、色饱和度(S,Saturation)以及明度(I,Intensity),(Museum,孟塞尔颜色系统)在特定应用环境中,用于图像分析有特殊的优势。比如,在只有光照亮度发生变化的应用中,不考虑明度,只使用色度进行区域分割。,圆锥体模型:,RGB三基色系统称为“物理三基色”,CIE另外规定了一种虚拟的三基色系(XYZ)标准色度系统,在匹配各种彩色时,三基色系数都是正值。它们间的转换也可写出矩阵形式:,2.3.3 颜色模型间的转换,1.XYZ和RGB之间转换,NTSC(National television system committee)制式彩色电视使用YIQ模型其中Y为亮度,I、Q为色度,下式可转换到RBG模型:Y=0.299R+0.587G+0.114B I=0.5R-0.231G-0.269B Q=0.203R-0.5G+0.297BYIQ 与RGB间的转换借助XYZ来进行,也可写出矩阵形式:,2.YIQ和RGB之间转换,PAL(Phase alternation line:逐行倒相)制式彩色电视使用YUV模型其中,Y为亮度,U、V为色度。下式可实现与RBG间的转换:Y=0.299R+0.587G+0.114B U=-0.169R-0.331G+0.5B V=0.5R-0.419G-0.081B,3.YUV和RGB之间转换,4.RGB到HIS模型的转换,5.HIS到RGB模型的转换,2.4.1 图像表示 为了对图像施以有效的处理,就要了解图像的内在特性。同时,为了方便地处理图像,用适当的数字模型去表征图像的特性。在图像处理中常用的数字表征法有两种,一种是确定性的,一种是统计性的。用确定性的图像表征法可方便地研究图像的点的性质,而用统计表征法可用统计平均参数反映图像的特性。,2.4 图像的表示,物体,当用数学方法描述一幅图像时,常着重考虑它的点的性质。例如,一幅图像可以被看成是空间各个座标点上强度的集合。它的最普遍的数学表达式为:I=f(x,y,z,t)其中,x、y、z是空间坐标,是波长,t是时间,I是图像点的光强度。对静态图像,t为常数。对单色图像,为常数。对平面图像,z为常数。例如,对于静态平面单色图像,其数学表达式可以简化为:I=f(x,y)上面式子所表示的图像是多种多样的,要想对图像信息进行明确地分类也并非容易。只能就图像处理中常见的图像信息加以简单地分类。在数字图像处理中所涉及到的是一些最普通类型的图像。它们的突出特点是都具有特殊的统计特性,并且有专门的应用。从这个基点出发可做如下比较明快的分类:TV型的自然风景,这是一种常见的图像;空间摄影照片和地球资源探测图片,这类图像构图不明显;电子显微镜照片和标准显微镜照片,这是一类在冶金学、医学及石油探测等都很感兴趣的一类照片文本,这是指一些打印、印刷或手写的记号图像;图样,通常就是简单地由线段和图形构成的单色二值图像;专用图像,大多是用特殊技术得到的图像,例如,X射线照片、红外热象、超声波图像等等。,2.4.2 数字图像的数字化 一般的图像(即模拟图像)是不能直接用数字计算机来处理的。为使图像能在数字计算机内进行处理,首先必须将各类图像(如照片,图形,X光照片等等)转化为数字图像。所谓将图像转化为数字图像或图像数字化,就是把图像分割成如图所示的称为象素的小区域每个象素的亮度或灰度值用一个整数来表示。把图像分割成象素的方法可以是多种多样的,如图所示。即每个象素所占小区域可以是正方形的,六角形的或三角形的。与之相对应的象素所构成的点阵则分别为正方形网格点阵、正三角形网格与正六角形点阵。上述各象素分割方案中,正方形网格点阵是实际常用的。对一个正方形点阵,若任一象素沿水平与垂直方向上与相邻象素间距为1,则该象素沿斜线方向上的间距为1.414.,图像数字化,1.采样 采样就是把在时间上和空间上连续的图像转换成为离散的采样点(即象素)集的一种操作。由于图像是一种 二维分布的信息,为要对它完成抽样操作,就需要先将二维信号变为一维信号,再对一维信号完成采样。具体做法是,先沿垂直方向,按一定间隔以上到下顺序地沿水平方向直线扫描的方式,取出各水平行上浓淡(灰度)值的一维扫描线。而后再对该一维扫描线信号按一定间隔采样得到离散信号。即先沿垂直方向抽样,再沿水平方向抽样两步完成采样操作。对于运动图像(即时间域的连续图像),还需先在时间轴上采样,即先在时间轴上采样,再沿画面垂直方向采样,最后再沿画面水平方向上抽样这样三步完成采样操作。若采样结果每行(即横向)象素为M个,每列(即纵向)象素为N个,则整幅图像大小为MN个象素。在进行采样时,采样点间隔的选取是一个非常重要的问题。它决定了采样后的图像忠实地反映原图像的程度。或者说,采样间隔大小的选取要根据原图像中包含何种程度的细微浓淡变化来确定。一般来说,图像中细节越多,则抽样间隔应越小。根据一维采样定理,若一维信号g(t)最大频率为,若用T1/2为间隔进行抽样后,则根据抽样结果g(iT)i=-1,0,1能完全恢复g(t)。,2.量化 经过抽样,模拟图像已在时间、空间上离散化为象素。但抽样结果所得的象素的值(即浓淡值或灰度值)仍是连续量。把抽样后所得的这些连续量表示的象素值离散化为整激值的操作叫量化。即若连续浓淡(灰度)值用z来表示,则对于满足zizzi+1的z值都量化为整数值zi,zi称为象素的灰度值。z与zi的差称为量化误差。一般每个象素的灰度值量化后用一个字节(8位二是制码或8比特)来表示,如把由白一灰一黑的连续变化的灰度值,量化为0255共256个灰度级。量化后的灰度值,代表了相应的浓淡程度。灰度值与浓淡程度的关系有两种表示方法,一种是由0255对应于由黑一白,另一种是由0255对应于由白一黑。在图像处理时,应注意是采用那种表示方法。对只有黑白二值的二值图像,一般用0表示白,1表示黑。,均匀采样,非均匀采样,均匀量化非均匀量化矢量量化,经过数字化过程(采样、量化)得到矩阵:,3.空间分辨率和幅度分辨率,灰度图像:单色,一元组,彩色图像:RGB三色,三元组,数字图像图像(水平)尺寸 M:图像(垂直)尺寸 N:象素灰度级数 G(k-bit):图像所需的位数 b:,一幅数字化后的图像其总数据量是:每行象素数(M)每列象素数(N)灰度量所占用位数(Bits)。下面举例给出若干常用的M、N值。几种常用的图像大小如下:汉字:取决于字的大小,每个字可以从1616到256256象素;显微镜图像:256256或512512象素;电视图像:500700480象素;卫星图像:(单波殷)32402340象素;SAR(合成孔径雷达)80008000象素;CRT显示器:一般640480或10241024象素,20482048象素等,4.图像质量与采样和量化,图像幅度分辨率变化所产生的效果,空间和幅度分辨率同时变化所产生的效果,谢 谢,