数字图像处理中的基本运算.ppt
第四章:数字图像处理中的基本运算,图像处理基本运算概述,图像处理中,经常要采用各种各样的算法。根据数字图像处理运算中输入信息与输出信息的类型,图像处理典型算法从功能上具有以下几种:(1)单幅图像 单幅图像(2)多幅图像 单幅图像(3)单幅或多幅图像 数值/符号,4.1 基本运算类型,上述三类运算中,第一类运算功能是图像处理中最基本的功能;如果根据输入图像得到输出图像运算的数学特征,可将图像处理运算方式分为:,点运算 代数运算 几何运算这些运算都是基于空间域的图像处理运算,与其对应的是另一种运算:变换域运算,将在后续章节中讨论。,在图像处理中,点运算是一类简单却非常具有代表性的重要算法之一,也是其他图像处理运算的基础。运用点运算可以改变图像像素占据的灰度值范围,但不会改变图像内的空间位置关系。点运算包括以下内容:1定义,2:分类,4.2 点运算,3:应用,1.定义,所谓点运算是指像素值(像素点的灰度值)通过运算之后,可以改善图像的显示效果。这是一种像素的逐点运算。点运算与相邻的像素之间没有运算关系,是原始图像与目标图像之间的影射关系。是一种简单但却十分有效的图像处理方法。点运算又称为“对比度增强”、“对比度拉伸”、“灰度变换”,点运算实际上是灰度到灰度的映射过程;数学上的描述:设 输入图像为 A(x,y)输出图像为 B(x,y)则点运算可表示为:B(x,y)=fA(x,y)显然点运算不会改变图像内像素点之间的空间位置关系。,2.分类,(1)线性点运算 指输出灰度级与输入灰度级呈线性关系的点运算。即:,255,255,输入DA,输出DB,0,f(DA)=aDA+b,b,如果a1,输出图像的对比度增大,255,218,48,提高对比度,255,0,DA,DB,提高对比度举例,如果a1,输出图像的对比度减小,255,255,142,0,降低对比度,DB,DA,降低对比度举例,0,255,255,DB,DA,如果a1,b0,操作仅使所有像素的灰度值上移或下移,其效果是使整个图像更暗或更亮,0,255,255,整个图像更亮,0,255,255,整个图像更暗,DB,DB,DA,DA,如果a1,b0时,输出、输入图像相同,0,255,255,DB,DA,如果a为负值,暗区域将变亮,亮区域将变暗,0,255,255,DB,DA,0,255,255,DB,DA,线性点运算公式 当图象成像时曝光不足或过度,或由于成像设备的非线性和图像记录设备动态范围太窄等因素,都会产生对比度不足的弊病,使图像中的细节分辨不清.这时可通过点运算将灰度范围线性扩展.设f(x,y)灰度范围为a,b,g(x,y)灰度范围为c,d.则线性点运算公式为:,线性点运算公式,窄,宽,(2)分段线性点运算 将感兴趣的灰度范围线性扩展,抑制不感兴趣的灰度区域,就要使用分段线性点运算。设f(x,y)灰度范围为0,Mf,g(x,y)灰度范围为0,Mg,分段线性点运算如下图所示:,分段线性点运算公式,窄,宽,(3)非线性点运算:输出灰度级与输入灰度级呈非线性关系的点运算。,255,255,0,输入,输出,非线性点运算灰度变换函数的斜率处处为正,这类函数保留了图像的基本外貌。,非线性点运算的函数形式可以表示为:DB=f(DA)同样,DA为输入点的灰度值,DB为相应输出点的灰度值。f表示非线性函数。有三种典型的非线性点运算函数,可以改变对比度:暗(不变):中(增加):亮(不变)暗(降低):中(增加):亮(降低)暗(加强):中(压低):亮(加强)公式见下页。,(1)DB=f(DA)=DA+CDA(DM-DA),(2),(3),255,128,255,218,255,128,255,32,加亮-减暗图像,亮度调整,加暗-减亮图像,输入DA,输出DB,输入DA,输出DB,对比度拉伸,非线性拉伸实例1,拉伸效果:图像加亮、减暗,非线性拉伸实例2,非线性拉伸实例3,非线性拉伸实例4,非线性拉伸实例5,非线性拉伸实例6,非线性拉伸实例7,4.2.2 点运算与直方图,点运算是一种确定的函数关系下所进行的像素变换运算,因此,点运算之后输出图像和输入图像之间的直方图也具有与变换函数相关联的对应关系。从图4-3中可以找到它们之间的关系,即灰度级小区间内输入像素的个数,等于输出像素的个数,而且输入、输出图像的阴影部分面积可以用小矩形的面积近似替代(替代积分式)。HB(DB)DB=HA(DA)DA最后输出的直方图的值为(详细推导见P73-74),4.2.3.点运算的应用,(1)对比度增强 在一些数字图像中,技术人员所关注的特征可能仅占据整个灰度级非常小的一个范围。点运算可以扩展所关注部分的灰度信息的对比度,使之占据可显示灰度级的更大部分。又称为对比度拉伸。(2)光度学标定 点运算可消除图像传感器的非线性的影响。,(3)显示标定 一些显示设备不能保持数字图像上像素的灰度值和显示屏幕上相应点的亮度之间的线性关系。这一缺点可以通过点运算予以克服,即在图像显示之前,先设计合理的点运算关系,可将点运算和显示非线性组合起来互相抵消,以保持在显示图像时的线性关系。(4)轮廓线 点运算可为图像加上轮廓线。(5)剪裁 对于8bit图像,通过点运算,在每个像素值被存储之前,输出灰度级一定要剪裁到0255的范围内。,4.3 代数运算,1、概念2、运算类型及应用,1.代数运算概念,代数运算是指两幅输入图像之间进行点对点的加、减、乘、除运算得到输出图像的过程。如果记输入图像为A(x,y)和B(x,y),输出图像为C(x,y),则有如下四种形式:(1)C(x,y)=A(x,y)+B(x,y)(2)C(x,y)=A(x,y)-B(x,y)(3)C(x,y)=A(x,y)B(x,y)(4)C(x,y)=A(x,y)/B(x,y),2.运算类型及应用(1)加运算(2)减运算(3)乘运算(4)除运算,(1)加运算,C(x,y)=A(x,y)+B(x,y)主要应用举例去除“叠加性”随机噪音生成图像叠加效果,去除“叠加性”噪音 对于原图象f(x,y),有一个带噪音的图像集 g i(x,y)i=1,2,.M 其中:g i(x,y)=f(x,y)+h(x,y)I M个图像的均值定义为:g(x,y)=1/M(g0(x,y)+g1(x,y)+g M(x,y)前提:噪音h(x,y)i为互不相关,且均值为0时,上述图象均值将降低噪音的影响。,相加,图例:求平均消除加性随机噪声,k=1,2,3,4,16,表示1幅图像平均、2幅图像相加后求平均,K=1,K=2,K=4,K=16,生成图象叠加效果:可以得到各种图像合成的效果,也可以用于两张图片的衔接,(2)减法运算 C(x,y)=A(x,y)-B(x,y)主要应用消除背景影响差影法(检测同一场景两幅图像之间的变化),消除背景影响,即去除不需要的叠加性图案 设:背景图像b(x,y),前景背景混合图像f(x,y)则g(x,y)=f(x,y)b(x,y)g(x,y)为去除了背景图像 下图表示一幅数字化的光学显微图像和相应的灰度直方图,该图像被缓慢变化的背景图像所污染,通过减法运算,消除了背景图像的影响。,光学显微图像:,差影法,指把同一景物在不同时间拍摄的图像或同一景物在不同波段的图像相减;差值图像提供了图像间的差异信息,能用于指导动态监测、运动目标检测和跟踪、图像背景消除及目标识别等。,差影法在自动现场监测中的应用,在银行金库内,摄像头每隔一固定时间拍摄一幅图像,并与上一幅图像做差影,如果图像差别超过了预先设置的阈值,则表明可能有异常情况发生,应自动或以某种方式报警;用于遥感图像的动态监测,差值图像可以发现森林火灾、洪水泛滥,监测灾情变化等;也可用于监测河口、海岸的泥沙淤积及监视江河、湖泊、海岸等的污染;利用差值图像还能鉴别出耕地及不同的作物覆盖情况。,差影技术还可以用于消除图像背景。例如,该技术可用于诊断印刷电路板及集成电路掩模的缺陷,特别是用于血管造影技术中,肾动脉造影术对诊断肾病有独到优势。为了减少误诊,希望提供反映游离血管的清晰图像。对此,可摄制出肾动脉造影前后的两幅图像,相减后就能把脊椎及其他组织的图像去掉,仅保留血管图像。,差值法的应用举例,(a)差影法可以用于混合图像的分离,-,=,(b)检测同一场景两幅图像之间的变化 设:时刻1的图像为T1(x,y),时刻2的图像为T2(x,y)g(x,y)=T2(x,y)-T1(x,y),T1(x,y),T2(x,y),g(x,y),求梯度幅度,图像的减法运算也可应用于求图像梯度函数 梯度定义形式:梯度幅度,梯度幅度的近似计算:,梯度幅度的应用:边缘提取,梯度幅度图像,对肌肉活组织检查标本显微图,梯度幅度在边缘处很高;在均匀的肌肉纤维的内部,梯度幅度很低。,肌肉纤维,梯度图像,(3)乘运算 C(x,y)=A(x,y)*B(x,y)主要应用举例 图像的局部显示,图像的局部显示,原图像,掩膜图像,局部图像,(4)除运算 C(x,y)=A(x,y)/B(x,y),除法运算的典型运用是比值图像处理。主要应用举例 用于校正成像设备的非线性影响;如CT等医学图像处理;遥感图像处理中,4.4 几何运算,1.概念,2.几何运算类型,几何运算又称几何变换。图像的几何变换(Geometric Transformation)是指图像处理中对图像平移、镜像、旋转、放大和缩小、错切,以及图像的复合变换等。几何变换特点:(1)可能改变图像中各物体之间的空间位置关系(2)不改变像素值,而可能改变像素所在的位置。,1.概念,空间变换 灰度插值,2.几何运算类型,空间变换,齐次坐标 几何变换一般形式(新、旧位置关系),根据几何学知识,上述变换可以实现图像各像素点以坐标原点的比例缩放、反射、错切和旋转等各种变换,但是上述22变换矩阵T不能实现图像的平移以及绕任意点的比例缩放、反射、错切和旋转等变换。,为了能够用统一的矩阵线性变换形式来表示和实现这些常见的图像几何变换,就需要引入一种新的坐标,即齐次坐标。采用齐次坐标可以实现上述各种几何变换的统一表示。,如图所示,则新位置A1(x1,y1)的坐标为:,表示为如下形式,缺点:由于矩阵T中没有引入平移常量,无论a、b、c、d取什么值,都不能实现式平移功能。解决办法:需要进行改进系数矩阵T。,问题:有个加项,不好处理,不能表示为如下容易处理的形式:,首先想到的是:将T矩阵扩展为如下23变换矩阵,把平移项收到矩阵中,其形式为:,根据矩阵相乘的规律,对应在21坐标列矩阵x y T中引入第三个元素,扩展为31的列矩阵x y 1T,就可以实现点的平移变换。变换形式如下:,问题:非方阵,虽然可以实现图像各像素点的平移变换,但不方便。解决办法:一般将23阶变换矩阵T进一步扩充为33方阵,即采用如下变换矩阵(加一行001):,这样一来,平移变换可以用如下形式表示:,总结:这种以n+1维向量表示n维向量的方法称为齐次坐标表示法。齐次坐标的几何意义相当于点(x,y)投影在xyz三维立体空间的z=1的平面上。,空间变换,4.4.2 图像的平移,注意:平移后的景物与原图像相同,但“画布”一定是扩大了。否则就会丢失信息。,平移是日常生活中最普遍的方式之一。图像的平移是:将一幅图像上的所有像素点都按给定的偏移量沿x方向和y方向进行移动。,4.4.3 图像的缩小 图像的缩小一般分为按比例缩小和不按比例缩小两种。图像缩小之后,因为承载的信息量小了,所以画布可相应缩小。,空间变换,1.图像按比例缩小:最简单的是减小一半,这样只需取原图的偶(奇)数行和偶(奇)数列构成新的图像。,2.图像不按比例缩小:这种操作因为在x方向和y方向的缩小比例不同,一定会带来图像的几何畸变。,4.4.4 图像的放大 图像的缩小操作中,是在现有的信息里如何挑选所需要的有用信息。而图像的放大操作中,则需对尺寸放大后所多出来的空格填入适当的值,这是信息的估计问题,所以较图像的缩小要复杂一些。,空间变换,1.按比例放大图像 如果需要将原图像放大k倍,则将一个像素值添在新图像的k*k的子块中。,放大5倍,2.图像的任意不成比例放大:这种操作由于x方向和y方向的放大倍数不同,一定带来图像的几何畸变。放大的方法是:将原图像的一个像素添到新图像的一个k1*k2的子块中去。,返回,图像的减半缩小效果,返回,图像的按比例缩小效果,返回,图像的不按比例任意缩小,返回,图像的成倍放大效果,返回,图像的不按比例放大,返回,4.4.5 图像的镜像,水平镜像,垂直镜像,空间变换,0,0,x,y,0,0,x,y,水平镜像的变换结果,图像的垂直镜像,4.4.6 图像的旋转,空间变换,以逆时针旋转为例(微观效果):,0,0,x,y,原图,旋转图,旋转点,宏观效果,图 旋转前的图像,图 旋转15并进行插值处理的图像,图像的旋转注意点:图像旋转之后,会出现许多的空白点,对这些空白点必须进行填充处理,否则画面效果不好。称这种操作为插值处理。,最简单的方法是行插值或是列插值方法:1.插值的方法是:空点的像素值等于前一点的像素值。2.同样的操作重复到所有行。,经过插值处理之后,图像效果就变得自然。,图像的旋转效果,返回,图像旋转中的插值处理效果,返回,如图所示,图像经过了两次45和135旋转变换,旋转360之后,图像(b)的字迹发生了较明显的变化,特别是字体的边缘更为明显。,4.4.7 图像复合变换,图像的复合变换是指对给定图像进行两次及以上的平移、镜像、比例、旋转等基本变换的多次变换,又称为级联变换。根据矩阵理论可知,在齐次坐标下,对给定图像按顺序连续进行多次基本图像变换,其变换的矩阵仍然可以用3X3矩阵表示。若对图像进行了n次基本变换,变换矩阵分别为T1,T2,Tn,则复合变换矩阵为:T=T1T2Tn,根据复合变换的组合类型,复合变化可以分为以下两类:同类型复合变换:由同一种基本变换组成,要么都是多次平移,要么都是多次比例缩放不同类型复合变换:复合变换由不同的基本变换组成,复合变换中由转置、平移、镜像、缩放等变换组成。现对同类型的复合变换讨论如下(见教材P92-93):1.复合平移:两次平移之后,平移的距离等于两次平移距离之和。,2.复合比例:对图像连续进行多次比例缩放变换之后,最后的复合变换矩阵,只需要对两次变换的比例常数进行乘积即可。,3.复合旋转:对图像连续进行多次旋转变换之后,最后合成的旋转变换矩阵,等于各次旋转角度之和。,以上均为相对于原点(图像中心)进行比例、旋转等复合变换,如果要相对其他参考点进行以上变换,则要先进行平移,然后再进行其他基本变换,最后形成图像的复合变换。相应地,使用齐次坐标后,图像复合变换的矩阵由一系列图像基本几何变换矩阵依次相乘而得到,运算简便。,4.4.8 控制点变换,控制点变换是通过测定若干特定坐标的位移量来确定坐标变换方程的系数的方法。如图4-23(P94)所示,若已知输入图像的1、2、3、4四个点与输出图像上A、B、C、D四个点对应,则可以根据这四对已知控制点对,通过代数变换方程确定几何变换 关系:x=ax0+by0+cx0y0+d y=ex0+fy0+gx0y0+h求解上述变换方程中的系数,就可以得到满足要求的近似变换关系,即可以确定所有落入矩形框内的输出点。,4.4.9 透视变换,在光线照射下,把三维物体或对象转变为二维图形表示的过程称为投影变换。根据视点(投影中心,投影仪镜头,人眼睛)与投影平面之间距离的不同,投影可分为平行投影和透视投影。平行投影的视点与投影平面之间的距离为无穷大。透视投影即透视变换。而对透视投影(变换),视点与投影平面之间的距离是有限的。这个距离决定着透视投影的特性透视缩小效应,即三维物体或对象透视投影的大小与形体到视点的距离成反比(拿物体挡住投影仪光线做实验)。,例如,等长的两直线段,都平行于投影面,但离投影中心(投影仪镜头)近的线段,其透视投影大,而离投影中心远的线段,透视投影小。这种效应所产生的视觉效果与照相机系统和人的视觉系统(用手挡眼睛视线,对着墙壁,遮住的面积大小与手到眼睛的距离成反比)十分类似。与平行投影相比,透视投影的深度感更强,看上去更真实,但透视投影不能真实地反映物体的精确尺寸和形状。,对于透视投影,一束平行于投影面的平行线的投影可保持平行,而不平行于投影面的平行线的投影会聚集到一个点,这个点称为灭点(Vanishing Point)。生活经验:火车铁轨在远处相交于一点。灭点可以看作是无限远处的一点在投影面上的投影。透视投影的灭点可以有无限多个,不同方向的平行线在投影面上就能形成不同的灭点。坐标轴方向的平行线在投影面上形成的灭点又称作主灭点。因为有x,y和z三个坐标轴,所以主灭点最多有3个。,透视投影是按主灭点的个数来分类的,即按投影面与坐标轴的夹角来分类的,可分为一点透视、二点透视和三点透视,如图4-24 所示。,图4-24 透视变换(投影面位于为灭点处)(a)一点透视;(b)二点透视;(c)三点透视,下面讨论一点透视。一点透视只有一个主灭点,即投影面与一个坐标轴正交,与另外两个坐标轴平行,如图4-24(a)所示。进行一点透视投影变换,要很好地考虑图面布局,以避免三维形体或对象的平面域积聚成直线或直线积聚成点而影响直观性。具体地说,就是要考虑下列几点:三维形体或对象与画面(投影面)的相对位置;视距,即视点与画面的距离;,视点的高度。假设视点在坐标原点,(如图4-25所示),z坐标轴方向与观察方向重合一致,三维形体或对象上某一点为P(x,y,z),一点透视变换后在投影面(观察平面)UOV上的对应点为P(x,y,z),投影面与z轴垂直,且与视点的距离为d,z轴过投影面窗口的中心,窗口是边长为2a的正方形,如图4-25所示。根据相似三角形对应边成比例的关系,有:,图4-25 一点透视变换,利用齐次坐标,与二维几何变换类似,写成变换矩阵形式。,这就是图像的一点透视变换。一般地,视点不在原点,投影平面是任意平面的情况,一点透视变换的矩阵也可以用一个44的矩阵表示。,4.4.10 其他变换,如前所述,齐次坐标为确定各种基本变换和复合变换公式提供了一个简单的方法。然而,在许多图像处理与分析应用中,所需的几何变换都相当复杂,甚至有些无法用简便的数学式来表达。此外,所需几何变换经常要从对实际图像的测量中获得,因此更希望用这些测量结果而不是函数形式来描述几何变换。,例如,在对由摄像机拍摄的有几何畸变的图像进行几何校正时,首先应将一个矩形栅格目标数字化并显示出来。因为摄像机中有几何变形,所显示的图案不会是准确的矩形,因此所求几何变换应能使其栅格图案再次被复原为准确的矩形,从而修正了摄像机产生的畸变。采用同样的几何变换可用于校正同一摄像机生成的数字化图像(假定畸变与景物无关),由此可得到不畸变的图像。,图像几何变换的一个重要应用是消除由于摄像机导致的数字图像的几何畸变。当需要从数字图像中得到定量的空间测量数据时,几何校正被证明是十分重要的。某些图像,例如,从卫星上或飞机侧视雷达上得到的图像,都有相当严重的几何变形,这些图像需要先经过几何校正,然后才能对其内容做出解释。一些图像系统使用非矩形的像素坐标,例如,极坐标、柱坐标、球面坐标等,用普通的显示设备观察这些图像时,必须先对它们进行校正,也就是说,将其转换为矩形像素坐标。,灰度插值,图像的比例缩放、旋转变换时等,变换过程需要两个独立的算法:一个算法完成几何变换;一个算法用于灰度级插值.,灰度插值,三种常见插值方法:最邻近插值法双线性插值(一阶插值)高阶插值,数字图像处理只能对坐标网格点(离散点)的值进行变换。而坐标变换后产生的新坐标值同网格点值往往不重合,因此需要通过内插的方法将非网格点的灰度值变换成网格点的灰度值,这种算法称为灰度内插。,最邻近插值法,计算与点P(x0,y0)临近的四个点;将与点P(x0,y0)最近的整数坐标点(x,y)的灰度值取为P(x0,y0)点灰度近似值。,双线性插值,根据点P(x0,y0)的四个相邻点的灰度值,通过两次插值计算出灰度值f(x0,y0),注意:X,Y平面点代表行列坐标,竖直线代表对应点的灰度值。,双线性插值公式,最邻近插值法,最邻近插值法就是最临近点重复,双线性插值(一阶插值):采用在(x,y)周围四个网格点的灰度值进行内插,双线性插值的特点,计算量大,但缩放后图像质量高,不会出 现图像不连续的情况。具有低通滤波器的性质,使高频分量减弱,所以使图像的轮廓在一定程度上受损。,三阶插值:三次内插法是指用(x,y)周围的16个网格点灰度按三次多项式进行内插的高精度算法,本章重点,线性点运算中斜率和截距的取值对图像的影响代数运算的特点及应用几何运算的特点及应用常用的灰度内插法图像的三种运算类型及应用,