【教学课件】第四章图象分割(ImageSegmentation).ppt
《【教学课件】第四章图象分割(ImageSegmentation).ppt》由会员分享,可在线阅读,更多相关《【教学课件】第四章图象分割(ImageSegmentation).ppt(47页珍藏版)》请在三一办公上搜索。
1、2002,Ver1.0,74,第四章 图象分割(Image Segmentation),定义:所谓图象分割就是按一定的规则将图象划分成若干有意义的 区域。研究重点:(1)按什么样的规则。(2)什么叫有意义。一般是符合特定场合的应用的才称为 有意义。因此图像分割是个病态问题(ill-posed problem),一种方法可能非常符合甲的需求,但与乙的需求矛盾。说明:规则和需求的多样性导致了图像分割方法的多样性,到目前 为止,有人说有1800多种方法,可见其方法之多。同时也说 明不存在通用的图像分割方法。在本章中,我们讲述边缘提取和基于直方图的图像分割,希望大家能够掌握一些基本的概念和处理问题的手
2、段。,2002,Ver1.0,75,4.1 边缘检测(Edge Extraction,Edge detection)定义:边缘点是指其周围象素的灰度有阶跃变化(step edge)或屋顶状变化(roof edge)的象素、常存在于目标与背景之间、目标与目标之间、目标与其影子之间。分析手段:因为灰度的变化,可以反映为导数;因此,根据边缘的形状,可以通过求导的方法来寻求边缘。边缘的参数包括:边缘强度(edge intensity)和边缘方向(edge direction),比如:,由此,可以看出求导和边缘检测的关系。,窗口中象素的灰度值,窗口中象素的梯度值,2002,Ver1.0,76,g(i),
3、g(i),i,i,一阶导数,二阶导数,极值点,屋顶状边缘:一阶导数过零点,二阶导数最小值,阶跃边缘:一阶导数最大值,二阶导数过零点,2002,Ver1.0,77,说明:在实际应用中,一般仅考虑阶跃边缘,因为只要采样分辨率足够或者说窗口足够小,边缘都可以看成是阶跃边缘。分析手段:边缘是指图象中灰度发生急剧变化的区域。图象灰度的变化情况可以用灰度分布的梯度来反映,给定连续图象f(x,y),其方向导数在边缘法线方向上取得局部最大值。因此,边缘的检测转化为求f(x,y)在(x,y)处的方向导数问题。f(x,y)沿任意方向r的方向导数为:,其中,为x轴到方向r的转角。fx和fy为f(x,y)的偏导数。与
4、方向导数有关联的一个概念是函数的梯度,对于平面的每一个点p(x,y)都可定出一个向量(包括幅值和方向),该向量称为(x,y)处的梯度。,向量为:,梯度为:,可以证明,当方向r与梯度方向一致时,方向导数达到最大值,该最大值即为梯度的模。,2002,Ver1.0,78,梯度的模为:,x轴到梯度的转角的正切为:,因此,(x,y)处的边缘强度取其方向导数的最大值,即梯度的模;边缘方向取x轴到梯度的方向。实际上也可以直接从方向导数的公式直接推导得到:,即:,得到:,2002,Ver1.0,79,注1:对各向同性的说明 假设图像f(x,y)的所有导数都存在并且连续,那么在对f(x,y)求导数时只依赖于点(
5、x,y)附近的一个任意小的邻域内的像素的值,因此可以将这种运算认为是位移不变运算。为了能得到图像中间任意方向伸展的边缘,还希望对图像的某种导数运算是各向同性。可以证明偏导数的平方和是各向同性,即:,式中(x,y)是某个象素图像旋转前的坐标,(x,y)是该向素图像旋转后的坐标。梯度运算符合位移和旋转不变性。,注2:数字图像中的导数运算 在图象中,导数的计算有两种方式:(1)先将数字图像通过曲面拟合的方法得到连续空间中的描述,然后在连续空间中,自然可以求导。,2002,Ver1.0,80,通过研究边缘类型及其导数的表现,可以设计不同的检测算法。下面,我们讲述几种常用的边缘检测算法。,(2)用差分代
6、替求导,如下:x f(i,j)=f(i+1,j)-f(i,j)y f(i,j)=f(i,j+1)-f(i,j)f(i,j)=x f(i,j)cos+y f(i,j)sin,梯度算子(Gradient)定义梯度为:,若G(i,j)Threshold,则(i,j)点为边缘点。缺点:时间复杂度高。改进:令G(i,j)=|x f(i,j)|+|y f(i,j)|,2002,Ver1.0,81,例:1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 8 8 8 8 8 8 1 1 1 1 1 1 8 8 8 8 8 8 1 1 1 1 1 1 8 8 8 8 8 8 1 1 1 1 1
7、1 1 1 1 1 1 1 1,0 0 0 0 0 0 7 7 7 7 7 0 0 0 0 0 0 7 0 0 0 0 7 0 0 0 0 0 0 7 0 0 0 0 7 0 0 0 0 0 0 7 7 7 7 7 10 0 0 0 0 0 0 0 0 0 0 0 0 01,得到,4.1.2罗伯特算子(Roberts)定义为:R(i,j)=max|f(i,j)-f(i+1,j+1)|,|f(i+1,j)-f(i-1,j+1)|,例:1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 8 8 8 8 8 8 1 1 1 1 1 1 8 8 8 8 8 8 1,0 0 0 0 0
8、7 7 7 7 7 7 0 0 0 0 0 0 7 0 0 0 0 7 0 1 1 1 1 1 1 8 8 8 8 8 0,得到,2002,Ver1.0,82,4.1.3索伯算子(Sobel)定义为:S(i,j)=|(P3+2*P2+P1)-(P5+2*P6-P7)|+|(P3+2*p4+p5)-(P1+2*P0+P7)|,2002,Ver1.0,83,缺点:得到双线宽的边缘,因为该算子涉及到3*3的邻域。优点:(1)加权(距离越近,贡献越大)(2)实质上是平滑去噪,后求差分。在边缘检测可以说是通用模式,即:在用Gradient或Robert等其他算子求边缘象素前,最好先对图象进行平滑,因为噪
9、声的灰度值一样是变化很大。,思考1:在图像平滑时,模板中各系数之和1且都不小于0;在边缘检测算子中,各系数之和是0且有正有负。思考2:对图像I使用模板l,等价于对I先使用模板2再使用模板3吗?,I,I,模板l,模板2,模板3,2002,Ver1.0,84,4.1.4方向模板(Prewitt),00,900,450,1350,2002,Ver1.0,85,4.1.5小结,一般性原则:给定图象f(x,y)在两个正交方向H1、H2上的梯度g1(x,y)和g2(x,y)定义如下:,则边缘的强度和方向由下式给出:,为了加快速度,有时:,2002,Ver1.0,86,Original Image(Lena
10、),Prewitt Image,Sobel Image,2002,Ver1.0,87,注:Prewitt Image 和Sobel Image 都是Gradient Image,从中看不到具体的有何明显改进。实际上,Gradient Image仅是中间结果,而且各种算子得到的梯度图像相差不大,即可能都不能满足你实际的需要,或直接满足你的需要。这需要在边缘检测完成后,使用相关的约束条件得到目标的位置或尺寸。而梯度图像还需要一个阈值(如何取阈值是一个值得研究的问题),才能判断一个像素是否是边缘点。,4.1.6二阶微分算子,前面讲过,对阶跃边缘边缘而言,边缘点处的二阶导数过0点,或二阶导数在边缘点处
11、出现零交叉(Zero-Crossing),即边缘点两旁的二阶导数异号。因此下面我们讲述基于该原理的边缘点检测,即拉普拉斯(Laplacian)算子。对数字图像的每个象素f(x,y),取它的二阶导数为关于x轴方向和y轴方向的二阶导数之和,得到:,2x f(i,j)+2y f(i,j)=f(i+1,j)+f(i-1,j)+f(i,j+1)+f(i,j-1)-4f(i,j),2002,Ver1.0,88,写成模板形式就是:,使用Laplacian,在某种尺度(下面会讲何为尺度)下得到的边缘点,或,2002,Ver1.0,89,补充内容1:过零点检测(Marr-Hildreth算子)(马尔-希尔德累思
12、算子)根据图象边缘处的一阶微分(梯度)应该是极值点的事实,图象边缘处的二阶微分应为零,确定过零点的位置要比确定极值点容易得多也比较精确。但是显然二阶微分对噪声更为敏感。算法:为抑制噪声,可先作平滑滤波然后再作二次微分,通常采用高斯函数作平滑滤波,故有LoG(Laplacian of Gaussian)算子。在实现时一般用两个不同参数的高斯函数的差DoG(Difference of Gaussians)对图象作卷积来近似,这样检测出来的边缘点称为f(x,y)的过零点(Zero-crossing)。理论:过零点的理论是Marr,Hildreth提出来的,是计算视觉理论中的有关早期视觉的重要内容。将
13、高斯函数G(x,y;)与图像f(x,y)进行卷积,可以得到一个平滑的图像fs(x,y),由于感兴趣的是图像的边缘,于是需要对fs(x,y)进行拉普拉斯运算。而图像f(x,y)与高斯函数G(x,y;)相卷积的拉普拉斯运算可以表示为G(x,y;)的拉普拉斯变换与f(x,y)的卷积,因此,有算子如下:,2002,Ver1.0,90,其中:,根据LOG函数的特点,已经有专用的硬件,使用DOG函数来近似实现LOG函数。即:,2002,Ver1.0,91,从工程的观点来看,当时,DOG逼近LOG。另外,在软件实现中,考虑到LOG算子的对称性,可采取分解的方法来提高运算速度,即把一个二维的滤波器分解为独立的
14、行列滤波器。有:,其中:,2002,Ver1.0,92,高斯函数的标准差是一个尺度参数,它越小,则相当于邻域越小,即在一个很小的局部范围内平滑,边缘定位越准确;反之,则表示在较大的范围内平滑,边缘定位越不准。LOG算子的优点是:边缘定位精度高,连续性好;缺点是:在抗干扰和检测出复杂形状的边缘之间仍存在较尖锐的矛盾,平滑尺度的选择也没能很好地解决。当边缘宽度小于算子的窗口时(即边缘相对于窗口而言成了屋顶状边缘)时,边缘丢失。,补充内容:多尺度方法和边缘聚焦 研究最优算子的一些学者指出,窗口的大小(或尺度)参数的自动调整是很困难的。伯津斯Berzins对LOG算子提取边缘的精度进行了定量分析,知道
15、一般来说边缘定位的误差与高斯函数中的 成比例,因此可以采用连续改变 的方法得到一系列的图像边缘序列,实现由粗到精的边缘检测过程。从理论上讲,这一边缘序列包含了原始图像的全部信息,由此可完全恢复原始图像(又叫指纹定理)。然而,由于图像数据量非常庞大,离散尺度的综合仍然是一个尚未解决的问题。威特金(Witkin)等人进一步讨论了 从0到无穷大时零交叉的变化情况,这便是“尺度空间滤波”的方法。(自动化学报1990,Vol.16,No.3,pp193-202),2002,Ver1.0,93,有学者发现,当 增大时,零交叉点的个数不会增加,但可能会减少,这性质称为单调性质。他们还发现,为了使零交叉满足单
16、调性质,所用的平滑函数必须是高斯函数。这一类结果被称为尺度定理。“边缘聚焦”是由粗到精检测边缘,将高精度的边缘定位和良好噪声一直相结合,应用这一方法可以精确地重建不同种类的结合点,这在三维景物重建和识别中有一定的应用。比如,在医学图像处理中,为了确定心脏的位置,图像首先被模糊,然后逐步聚焦确定心室的形状。实现边缘聚焦的一种方法是比较不同分辨率尺度下的一些边缘图,然后匹配边缘线段。或者另一种方法,即在尺度空间使用很短的步长,以满足连续两步间边缘片断移动距离不超过一个像素。(当然还有其它的方法)。,补充内容:沈俊算子(递归滤波器)与上面介绍的马尔的方法一样,沈俊同样提出了先滤波后求导的边缘检测方法
17、。他在阶跃边和可加白噪声模型下,就信噪比最大准则,证明了最佳滤波器是对称的指数函数。形式如下:,2002,Ver1.0,94,其中:,a0越大,即越接近于1,则F(x,y)越窄,压制噪声的能力减少,但定位精度越高。沈俊还进一步证明了:(1)用上述指数函数滤波,可以等价于分别按行和按列各进行两次正反向的递归滤波来实现,即对,按行进行:,其中,p2(x,y)即为按行进行了正反两次递归滤波的输出,对它再进行按列进行正反两次递归滤波,即对:,2002,Ver1.0,95,其中,p4(x,y)即为所求,即:,(2),基于上述的结果,可以给出如下的边缘提取方法:(1)用上述正、反向递归滤波器的结果与原图像
18、作差,得到拉普拉斯图像。(2)对拉普拉斯图像二值化,即将所有正值都赋以1,其他的赋以0。(3)在二值化的拉普拉斯图像中,求出零交叉点(即它的值为1,且至少有一个邻居的值为0)。,2002,Ver1.0,96,补充内容:坎尼算子(Canny)在如下的三个标准意义下,Canny边缘检测算子对受白噪声影响的阶跃型边缘是最优的:(1)检测标准 不丢失重要的边缘,不应有虚假的边缘;(2)定位标准 实际边缘与检测到的边缘位置之间的偏差最小;(3)单响应标准 单一边缘仅有唯一响应。即单个边缘产生多个响应的概率要低。Canny 边缘检测算子是基于如下的几个概念:(1)边缘检测算子是针对1D信号表达的,对前两个
19、标准最优,即检测标准和定位标准;(2)如果考虑第三个标准(多个响应),需要通过数值优化的办法得到最优解。该最优滤波器可以有效地近似为标准差为的高斯平滑滤波器的一阶微分,其误差小于20%,这是为了便于实现。这与LoG边缘检测算子很相似。(3)将边缘检测算子推广到两维情况。阶跃边缘由位置、方向和可能的幅度(强度)来确定。,2002,Ver1.0,97,英文原文:1.optimal for step edges corrupted by white noise 2.optimality related to three criteria detection criterion.important e
20、dges should not be missed,there should be no spurious responses localization criterion.distance between the actual and located position of the edge should be minimal one response criterion.minimizes multiple responses to a single edge(also partly covered by the first criterion since when there are t
21、wo responses to a single edge one of them should be considered as false)坎尼算子中,当一个像素满足以下3个条件时,则被认为是图像的边缘点:(1)该点的边缘强度大于沿该点梯度方向的两个相邻象素点的边缘强度。(2)与该点梯度方向上相邻两点的方向差小于45度。(3)以该点为中心的3x3邻域中的边缘强度极大值小于某个阈值。,2002,Ver1.0,98,补充内容5:边缘锐化(Edge Sharpen)含义:边缘锐化指的是在图像中令处于目标边界上的像素黑的更黑、白的更白,即灰度值小的更小,灰度值大的更大。也即对位于边界上的像素而言,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 第四 图象 分割 ImageSegmentation
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5664965.html