基本图像分割技术.ppt
第八章基本图像分割技术,数字图像分析与处理,在对图像的研究和应用中,人们往往仅对图像中的某些部分感兴趣。这些部分常称为目标或前景(其它部分称为背景),它们一般对应图像中特定的、具有独特性质的区域。为了辨识和分析目标,需要将这些有关区域分离提取出来。图像分割是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程。,图像分割也是目前公认的图像处理难题,其困难源于图像内容的多样性以及模糊、噪声等的干扰。至今还没有普适性分割方法和通用的分割效果评价标准,分割的好坏必须结合具体应用来评判。总体而言,一个好的图像分割算法应该尽可能具备以下特征:(1)有效性:对各种分割问题有效的准则,能将感兴趣的区域或目标分割出来。(2)整体性:即能得到感兴趣区域的封闭边界,该边界无断点和离散点。(3)精确性:得到的边界与实际期望的区域边界很贴近。(4)稳定性:分割结果受噪声影响很小。,8.1图像分割定义和技术分类8.2并行边界技术8.3串行边界技术8.4并行区域技术8.5串行区域技术,第6章,图像分割定义可借助集合概念(1)(2)对所有的i和j,有(3)对i=1,2,n,有P(Ri)=TRUE(4)对,有(5)对i=1,2,n,Ri是连通的区域,6.1 图像分割定义和技术分类,图像分割的基本策略分割算法基于灰度值的两个基本特性:不连续性和相似性。区域内部的像素一般具有灰度相似性,而在区域之间的边界上一般具有灰度不连续性。检测图像像素灰度级的不连续性,找到点、线(宽度为1)、边(不定宽度)。先找边,后确定区域。,图像分割的基本策略检测图像像素的灰度值的相似性,通过选择阈值,找到灰度值相似的区域,区域的外轮廓就是对象的边,图像分割方法和种类以不同的分类标准,图像分割方法可以划分为不同的种类。,图像分割应用 机器阅读理解 OCR录入 遥感图像自动识别 在线产品检测 医学图像样本统计 医学图像测量 图像编码 图像配准的预处理,6.2 边缘检测算子,边缘检测是所有基于边界的图像分割方法的第一步。边缘是灰度值不连续的结果,这种不连续常可利用求导数方便地检测到。一般常用一阶和二阶导数来检测边缘。边缘的定义:图像中像素灰度有阶跃变化或屋顶变化的那些像素的集合,图像局部亮度变化最显著的部分。边缘的分类阶跃状、脉冲状、屋顶状,阶跃状,屋顶状,一阶微分:用梯度算子来计算特点:对于亮的边,边的变化起点是正的,结束是负的。对于暗边,结论相反。常数部分为零。用途:用于检测图像中边的存在,二阶微分:通过拉普拉斯来计算特点:二阶微分在亮的一边是正的,在暗的一边是负的。常数部分为零。用途:1)二次导数的符号,用于确定边上的像素是在亮的一边,还是暗的一边。2)0跨越,确定边的准确位置,几种常用的边缘检测算子梯度算子Roberts算子Prewitt算子Sobel算子Kirsch算子Laplacian算子Marr算子,梯度算子一阶导数算子,函数f(x,y)在(x,y)处的梯度为一个向量:f=f/x,f/y计算这个向量的大小为:G=(f/x)2+(f/y)21/2近似为:G|fx|+|fy|或 G max(|fx|,|fy|)梯度的方向角为:(x,y)=tan-1(fy/fx)可用下图所示的模板表示,为了检测边缘点,选取适当的阈值T,对梯度图像进行二值化,则有:这样形成了一幅边缘二值图像g(x,y)特点:仅计算相邻像素的灰度差,对噪声比较敏感,无法抑止噪声的影响。,Roberts算子,公式:模板:特点:与梯度算子检测边缘的方法类似,对噪声敏感,但效果较梯度算子略好,Prewitt算子,公式模板:特点:在检测边缘的同时,能抑止噪声的影响,Sobel算子,公式模板特点:对4邻域采用带权方法计算差分能进一步抑止噪声但检测的边缘较宽,Sobel梯度算子的使用与分析1.直接计算y、x可以检测到边的存在,以及从暗到亮,从亮到暗的变化 2.仅计算|x|,产生最强的响应是正交 于x轴的边;|y|则是正交于y轴的边。3.由于微分增强了噪音,平滑效果是Sobel 算子特别引人注意的特性,Kirsch算子(方向算子),模板,特点在计算边缘强度的同时可以得到边缘的方向各方向间的夹角为45 分析取其中最大的值作为边缘强度,而将与之对应的方向作为边缘方向;如果取最大值的绝对值为边缘强度,并用考虑最大值符号的方法来确定相应的边缘方向,则考虑到各模板的对称性,只要有前四个模板就可以了。,拉普拉斯算子二阶导数算子,定义:二维函数f(x,y)的拉普拉斯是一个二阶的微分定义为:2f=2f/x2,2f/y2离散形式:模板:可以用多种方式被表示为数字形式。对于一个3x3的区域,经验上被推荐最多的形式是:,定义数字形式的拉普拉斯的基本要求是,作用于中心像素的系数是一个正数,而且其周围像素的系数为负数,系数之和必为0。,拉普拉斯算子的分析:优点:各向同性、线性和位移不变的;对细线和孤立点检测效果较好。缺点:对噪音的敏感,对噪声有双倍加强作用;不能检测出边的方向;常产生双像素的边缘。,由于梯度算子和Laplace算子都对噪声敏感,因此一般在用它们检测边缘前要先对图像进行平滑。,Marr算子(LOG算子),Marr算子是在Laplacian算子的基础上实现的,它得益于对人的视觉机理的研究,有一定的生物学和生理学意义。先用高斯函数对图像进行平滑,然后再用拉普拉斯算子进行运算。平滑函数应能反映不同远近的周围点对给定像素具有不同的平滑作用,因此,平滑函数采用正态分布的高斯函数,即:,其中是方差。用h(x,y)对图像f(x,y)的平滑可表示为:*代表卷积。令r是离原点的径向距离,即r2=x2+y2。对图像g(x,y)采用Laplacian算子进行边缘检测,可得:这样,利用二阶导数算子过零点的性质,可确定图像中阶跃边缘的位置。称为高斯拉普拉斯滤波算子,也称为LOG滤波器,或“墨西哥草帽”。,一维LOG函数及其变换函数,二维LOG函数,2023/11/12,图 LOG算子的55模板,特点:与高斯滤波器进行卷积,既平滑了图像又降低了噪声,孤立的噪声点和较小的结构组织将被滤除。在边缘检测时仅考虑那些具有局部梯度最大值的点为边缘点,用拉普拉斯算子将边缘点转换成零交叉点,通过零交叉点的检测来实现边缘检测。,,,Canny(坎尼)算子 3个准则:信噪比准则定位精度准则单边缘响应准则,,,具体步骤:首先用2D高斯滤波模板进行卷积以平滑图像;利用微分算子,计算梯度的幅值和方向;对梯度幅值进行非极大值抑制。即遍历图像,若某个像素的灰度值与其梯度方向上前后两个像素的灰度值相比不是最大,那么这个像素值置为0,即不是边缘;使用双阈值算法检测和连接边缘。即使用累计直方图计算两个阈值,凡是大于高阈值的一定是边缘;凡是小于低阈值的一定不是边缘。如果检测结果大于低阈值但又小于高阈值,那就要看这个像素的邻接像素中有没有超过高阈值的边缘像素,如果有,则该像素就是边缘,否则就不是边缘。,,,例子,梯度算子,Roberts算子,Prewitt算子,Sobel算子,Kirsch算子,原始图像,Laplacian算子,Marr算子,曲面拟合法,Sobel,Robert,Prewitt,LOG,Canny,2023/11/12,边缘检测算子的对比,在数字图像处理中,对边缘检测主要要求就是运算速度快,边缘定位准确,噪声抑制能力强,因此就这几方面对以上介绍的几个算子进行分析比较。首先,在运算速度方面,对于一个图像,其计算量如表所示。,2023/11/12,2023/11/12,根据实际测试结果,简单介绍各个算子的特点。1.Roberts算子 Roberts算子利用局部差分算子寻找边缘,边缘定位精度较高,但容易丢失一部分边缘信息,同时由于没经过图像平滑计算,因此不能抑制噪声。该算子对具有陡峭的低噪声图像响应最好。,2023/11/12,2.Sobel算子和Prewitt算子 Sobel算子和Prewitt算子都是对图像进行差分和滤波运算,差别只是平滑部分的权值有些差异,因此对噪声具有一定的抑制能力,但不能完全排除检测结果中出现伪边缘。同时这2个算子边缘定位比较准确和完整。该类算子对灰度渐变和具有噪声的图像处理结果较好。,2023/11/12,3.Krisch算子 该算子对八个方向边缘信息进行检测,因此具有较好的边缘定位能力,并且对噪声有一定的抑制作用,就边缘定位能力和抗噪声能力来说,该算子的处理效果比较理想。,2023/11/12,4.Laplacian算子 拉普拉斯算子为二阶微分算子,对图像中的阶跃状边缘点定位准确且具有旋转不变性,即无方向性,但是该算子容易丢失一部分边缘的方向信息,造成一些不连续的检测边缘,同时抗噪声能力比较差。拉普拉斯算子比较适用于屋顶型边缘的检测。,2023/11/12,5.Marr-Hildreth算子 Marr-Hildreth算子首先通过高斯函数对图像作平滑处理,因此对噪声的抑制作用比较明显,但同时也可能将原有的边缘也平滑了,造成某些边缘无法检测到。此外高斯函数中方差 参数的选择,对图像边缘检测效果有很大的影响。越大,检测到的图像细节越丰富,但对噪声抑制能力相对下降,易出现伪边缘;反之,则抗噪声性能提高,但边缘定位准确性下降,易丢失许多真边缘,因此,对于不同的图像应该选择不同的参数。,边界闭合在有噪声时,用各种算子得到的边缘像素常是孤立的或分小段连续的。为组成区域的封闭边界以将不同区域分开,需要将边缘像素连接起来边缘像素连接的基础是它们之间有一定的相似性。用梯度算子对图像处理可得到像素2方面的信息:梯度的幅度;梯度的方向,先检测边缘再串行连接成闭合边界图搜索边界点和边界段可以用图结构表示,通过在图中进行搜索对应最小代价的通道也可以找到闭合边界一个图可表示为G=N,A,其中N是一个有限非空的结点集,A是一个无序结点对的集。集A中的每个结点对(ni,nj)称为一段弧(niN,njN)。通路的总代价:,6.3 串行边界技术,定义图中的边缘元素是两个互为4-近邻的像素间的边界,边界由一系列边缘元素构成每个由像素p和q确定的边缘元素对应一个代价函数,代价函数的取值与像素间的灰度值差成反比,灰度值差小则代价大,灰度值差大则代价小,动态规划一个借助有关具体问题的启发性知识减少搜索的方法 估计代价图搜索的算法(1)将起始结点标记为OPEN并置g(s)=0(2)如果没有结点OPEN,失败退出,否则继续。(3)将估计代价r(n)为最小的OPEN结点标记为CLOSE,(4)如果n是目标结点,找到通路(可由n借助指针上溯至s)退出,否则继续(5)展开结点n,得到它的所有子结点(如果没有子结点,返回(2))(6)如果子结点ni还没有标记,置r(ni)=g(n)+c(n,ni),标记它为OPEN并将指向它的指针返到结点n(7)如果子结点ni已标记为OPEN或CLOSE,根据g(ni)=ming(ni),g(n)+c(n,ni)更新它的值。将其g 值减小的CLOSE子结点标记为OPEN,并将原指向所有其g 值减小的子结点的指针重指向n。返回(2),并行的直接检测区域的分割方法原理和分类取阈值技术是最常见并行区域分割方法首先对一幅灰度取值在gmin和gmax之间的图像确定一个灰度阈值T(gmin T gmax),然后将图像中每个像素的灰度值与阈值T相比较,并将对应的像素根据比较结果(分割)划为两类:即像素的灰度值大于阈值的为一类,像素的灰度值小于阈值的为另一类,6.4 并行区域技术,阈值分割算法是区域分割算法中具有代表性的一类非常重要的分割算法。以一定的图像模型为依托,通过取阈值后得到的图像,各个区域可以分离开。最常用的图像模型是假设图由具有单峰灰度分布的目标和背景组成。,单一阈值的灰度直方图,仅使用一个阈值分割的方法称为单阈值分割方法。如果图像中有多个灰度值不同的区域,那么可以选择一系列的阈值以将每个像素分到合适的类别中去,这种用多个阈值分割的方法称为多阈值分割方法。,分类:单阈值分割,多阈值分割,多阈值的灰度直方图,图像阈值分割是一种广泛应用的分割技术,利用图像中要提取的目标物与其背景在灰度特性上的差异,把图像视为具有不同灰度级的两类区域(目标和背景)的组合,选取一个合适的阈值,以确定图像中每个象素点应该属于目标还是背景区域,从而产生相应的二值图像。阈值分割法的特点是:适用于物体与背景有较强对比的情况,重要的是背景或物体的灰度比较单一;而且总可以得到封闭且连通区域的边界。,图像二值化 设原始图像f(x,y),以一定的准则在f(x,y)中找出一个合适的灰度值,作为阈值T,则分割后的图像g(x,y),可由下式表示:,另外,还可以将阈值设置为一个灰度范围T1,T2,凡是灰度在范围内的象素都变为1,否则皆变为0,即,某种特殊情况下,高于阈值T的象素保持原灰度级,其它象素都变为0,称为半阈值法,分割后的图像可表示为:,取阈值分割方法的关键是选取合适的阈值(1)全局阈值:仅根据各个图像像素的本身性质f(x,y)来选取而得到的阈值(2)局部阈值:根据像素的本身性质f(x,y)和像素周围局部区域性质q(x,y)来选取得到的阈值(3)动态阈值:根据像素本身性质f(x,y),像素周围局部区域性质q(x,y)和像素位置坐标(x,y)来选取得到阈值,2023/11/12,原始图像 阈值T=91 阈值T=130 阈值T=43 图 不同阈值对分割结果的影响,全局阈值,原理:假定物体和背景分别处于不同灰度级,图像被零均值高斯噪声污染,图像的灰度分布曲线近似用两个正态分布概率密度函数分别代表目标和背景的直方图,利用这两个函数的合成曲线拟合整体图像的直方图,图像的直方图将会出现两个分离的峰值,如图所示。然后依据最小误差理论针对直方图的两个峰间的波谷所对应的灰度值求出分割的阈值。,图双峰直方图,简单直方图分割法,双峰法选取阈值的缺点:会受到噪音的干扰,最小值不是预期的阈值,而偏离期望的值。改进办法:1)取两个峰值之间某个固定位置,如中间位置上。由于峰值代表的是区域内外的典型值,一般情况下,比选谷底更可靠,可排除噪音的干扰;2)加强对噪音的处理。对直方图进行平滑处理,如最小二乘法等补点插值。,该方法适用于具有良好双峰性质的图像,但需要用到数值逼近等计算,算法十分复杂,而且多数图像的直方图是离散、不规则的。在实际阈值分割过程中,往往需要能够自动获取阈值,下面的算法可以自动获得全局阈值:1)选取一个的初始估计值T;2)用T分割图像。这样便会生成两组像素集合:G1由所有灰度值大于T的像素组成,而G2由所有灰度值小于或等于T的像素组成。3)对G1和G2中所有像素计算平均灰度值u1和u2。4)计算新的阈值:T=1/2(u1+u2)。重复步骤(2)到(4),直到得到的T值之差小于一个事先定义的参数T0。,全局阈值的选取极小值点阈值最优阈值,全局阈值的选取最大凸残差阈值当图像中目标和背景面积相差较大时,直方图的一个峰会淹没在另一个峰旁边的缓坡里图像的直方图(包括部分坐标轴)可看作平面上的一个区域,对该区域可计算其凸包并求取其最大的凸残差,用来分割图像,局部阈值的选取直方图变换利用一些像素邻域的局部性质对原来的直方图进行变换以得到一个新的直方图,局部阈值的选取灰度-梯度散射图一个轴是灰度值轴,一个轴是梯度值轴,而其统计值是同时具有某一个灰度值和梯度值的像素个数,动态阈值的选取当图像中有不同的阴影(例如由于照度影响),或各处的对比度不同时,如果只用一个固定的全局阈值对整幅图进行分割,则由于不能兼顾图像各处的情况而使分割效果受到影响用与坐标相关的一系列阈值来对图像进行分 割。基本思想是首先将图像分解成一系列子图像,对每个子图像计算一个阈值。通过对这些子图像所得阈值的插值就可得到对图像中每个像素进行分割所需的阈值,动态阈值的选取(1)将整幅图像分成一系列重叠的子图像(2)做出每个子图像的直方图(3)检测各个子图像的直方图是否为双峰的,如是则采用前面介绍的最优阈值法确定一个阈值,否则就不进行处理(4)根据对直方图为双峰的子图像得到的阈值通过插值得到所有子图像的阈值(5)根据各子图像的阈值再通过插值得到所有像素的阈值,然后对图像进行分割,区域生长:就是一种根据事先定义的准则将像素或者子区域聚合成更大区域的过程。先对每个需要分割的区域找一个种子像素作为生长的起点,然后将种子像素周围邻域中与种子像素有相同或相似性质的像素(根据某种事先确定的生长准则或相似准则来判定)合并到种子像素所在的区域中。将这些新像素当做新的种子像素继续进行上面的过程,直到再没有满足条件的像素可被包括进来,6.5 串行区域技术,例如:生长规则的连通性为8连通;连通邻域的差值为T。,分裂合并从整幅图像开始通过不断分裂得到各个区域(1)对任一个区域Ri,如果P(Ri)=FALSE就将其分裂成不重叠的四等分。(2)对相邻的两个区域Ri和Rj,如果P(RiRj)=TRUE,就将它们合并起来。(3)如果进一步的分裂或合并都不可能了,则结束。,区域分裂与合并算法实现:1)对于图像中灰度级不同的区域,均分为四个子区域。2)如果相邻的子区域所有像素的灰度级相同,则将其合并。3)反复进行上两步操作,直至不再有新的分裂与合并为止。,图中阴影区域为目标,白色区域为背景,其灰度值为常数。,(a)第一次分裂(b)第二次分裂(c)第三次分裂(d)合并分割结果图 区域分裂与合并图像分割法图解,例:用分割与合并法对下图进行处理,分割与合并的准则为(准则是多种多样的):例如,Ri内的平均灰度与Ri内各像素之间的差的绝对值有超过5的像素,则分割;反之合并且合并区域的灰度以合并后的平均值取代。,