形状特征完成版ppt课件.ppt
形状特征,形状特征,1、形状特征的描述2、边缘检测3、上下文形状描述符(shape context),1.形状描述特征,二维图像中,形状通常被认为是一条封闭的轮廓曲线所包围的区域。通常情况下,对形状的描述有两种方法:一种是基于轮廓的,一种是基于区域的。前者只利用形状的外部边缘,而后者利用形状的全部区域。,1.1基于轮廓的描述,1.1.1 基于空间域的描述1、链码2、周长3、斜率、曲率和角点4、基于多边形的特征参数1.1.2 基于变换域的描述1、傅里叶描述子2、小波轮廓描述符,1链码,区域外部形状是指构成区域边界的像素集合。链码描述通过边界的搜索等算法的处理,所获得的输出最直接的方式是各边界点像素的坐标,也可以用一组被称为链码的代码来表示,这种链码组合的表示既利于有关形状特征的计算,也利于节省存储空间。,用于描述曲线的方向链码法是由Freeman提出的,该方法采用曲线起始点的坐标和斜率(方向)来表示曲线。对于离散的数字图像而言,区域的边界轮廓可理解为相邻边界像素之间的单元连线逐段相连而成。对于图像某像素的8-邻域,把该像素和其8-邻域的各像素连线方向按八链码原理图所示进行编码,用0,1,2,3,4,5,6,7表示8个方向,这种代码称为方向码。,八链码原理图,八链码例子,其中偶数码为水平或垂直方向的链码,码长为1;奇数码为对角线方向的链码,码长为。八链码例子图为一条封闭曲线,若以s为起始点,按逆时针的方向编码,所构成的链码为556570700122333,若按顺时针方向编码,则得到链码与逆时针方向的编码不同。边界链码具有行进的方向性,在具体使用时必须加以注意。,2周长,区域周长L是用区域中相邻边缘点间距离之和来表示。采用不同的距离公式,周长L的计算不同。常用的有两种:一种计算方法是采用欧式距离,在区域的边界像素中,设某像素与其水平或垂直方向上相邻边缘像素间的距离为1,与倾斜方向上相邻边缘像素间的距离为。周长就是这些像素间距离的总和。这种方法计算的周长与实际周长相符,因而计算精度比较高。另一种计算方法是采用8邻域距离,将边界的像素个数总和作为周长。也就是说,只要累加边缘点数即可得到周长,比较方便,但是,它与实际周长间有差异。,2周长,根据这两种计算周长的方式,以区域的面积和周长图为例,区域的周长分别是 和22。,3斜率、曲率和角点,斜率(slope)能表示轮廓上各点的指向,曲率(curvature)是斜率的改变率,它描述 了轮廓上各点沿轮廓方向变化的情况。在1个给定的轮廓点,曲率的符号描述了轮廓在该点的凹凸性。如果曲率大于零,则曲线凹向朝着该点法线的正向。如果曲率小于零,则曲线凹向是朝着该点法线的负方向。曲率的局部极值点称为角点。,4基于多边形的特征参数,多边形的特征参数主要有顶点数、凹点数、内角分布等。(a)多边形的顶点数、凹点数和凸点数 多边形的顶点数表明了多边形的复杂程度,而且凹点增加,多边形变得复杂。多边形的凹凸点比例反映了物体边界的齿状情况。(b)多边形的内角直方图 多边形的内角可以用余弦公式计算。多边形的内角分布反映了多边形的许多性质。例如,分布在(0,180)度中的内角对应凸顶点,分布在(180,360)中的内角对应凹顶点,分布在180左右的内角对应平滑线或弧线等。,4基于多边形的特征参数,(c)内角方差 多边形的内角方差反映了形状的规则程度,如等边多边形、矩形、圆的内角方差为0。内角方差的计算公式如下:是内角均值,N是多边形的顶点数。,4基于多边形的特征参数,(d)最小外接凸多边形、最大内接凸多边形、凹凸度 最小外接凸多边形指连接部分凸点形成的包含原图的凸多边形,最大内接凸多边形指连接部分凸点和凹点形成的包含在原图中的最大凸多边形。下图示出一个凹边形的最小外接凸多边形和最大内接凸多边形的例子。,4基于多边形的特征参数,凹凸度(concavo-convex)是反映物体形状凹凸程度的一个重要度量定义如下:其中,S0是多边形的面积,Sc是最小外接凸多边形的面积,Sr是最大内接凸多边形的面积。显然,凸形的凸度、凹凸度为1,而星形的凹度较大,凹凸度较小。利用凹凸度,可以识别物体的姿态,如飞禽类的飞、栖,走兽类的卧、站、奔跑等。,基于空间域描述轮廓的方法给出的结果太概括,对轮廓特性的描绘比较抽象事实上仅由几何参数往往不能完全确定物体轮廓而基于变换域描述轮廓的方法能够以一定精度描述轮廓特性,并可以进行相似度的定量比较接下来将分别对傅里叶描述符合小波轮廓描述符进行介绍,,5傅里叶描述子,傅立叶描述子(FourierDescriptor,简称FD)常用来表示单封闭曲线的形状特征,其基本思想是将目标轮廓曲线建模成一维序列,对该序列进行一维的傅立叶变换,从而获得一系列的傅立叶系数,用这些系数对该目标轮廓进行描述。傅立叶描述子方法有一系列优点,如:计算原理简单,描述清晰,具有由粗及精的特性等10。计算原理简单可以使得特征提取更加稳定,因为在计算的过程中,无须设置大量控制参数就可以获得结果,计算的一致性好。傅立叶描述子具有明确的物理或几何意义,它比某些特征描述子(如Hu不变矩)更具直观性。此外,由于任何一个序列经傅立叶变换后,其能量主要集中于少数几个低频傅立叶系数上,因此采用极少的傅立叶系数就可以描绘该序列特征。同时,随着傅立叶系数的增多,该序列的细节特征得以更好地描述。因此,傅立叶描述子对目标轮廓有非常好的由粗及精的描述能力。一个傅立叶描述子的构建包括两步:首先,定义一种好的表示(representation)方法对轮廓曲线进行描述;然后,采用傅立叶理论对该曲线进行变换6。不同的曲线表示方法有不同的特性,一个好的表示方法应该使最终获得的傅立叶描述子具有尺度、旋转、平移不变性及起始点的无关性。,5傅里叶描述子,对轮廓的离散傅里叶变换表达可以作为定量描述轮廓形状的基础。将轮廓所在的XY平面与一个复平面UV重合,其中实部U轴与X轴重合,虚部V轴与Y轴重合。这样就可用复数u+jv的形式来表示给定轮廓上的每个点(x,y)而将XY平面中的曲线段转化为复平面上的1个序列,见下图。,5傅里叶描述子,考虑1个由N点组成的封闭边界,从任1点开始绕边界1周就得到1个复数序列:s(k)的离散傅里叶变换是S(w)可称为边界的傅里叶描述,它的傅里叶反变换是:如果我们只利用S(w)的前M个系数,这样可得到s(k)的1个近似:,5傅里叶描述子,傅立叶描述子序列C(u)反映了原曲线的形状特征,同时,由于傅立叶变换具有能量集中性,因此,少量的傅立叶描述子就可以重构出原曲线。下图给出1个由N=64个点组成的正方形轮廓以及取不同的M值重建这个边界得到的 一些结果。,5傅里叶描述子,这说明,少量的傅立叶系数就可以很好地描述轮廓特征。由于傅立叶变换将序列的主要能量集中在了低频系数上,因此,傅立叶描述子的低频系数反映了轮廓曲线的整体形状,而轮廓的细节反映在了高频系数上。第1个傅立叶描述子(即直流量)为所有轮廓曲线上的点的x坐标和y坐标的均值(以复数形式表示),它即为轮廓的质心,给出了轮廓的位置信息。第2个傅立叶描述子给出了最能拟合所有轮廓点的圆的半径。,http:/,6小波轮廓描述符,小波函数族,可如下定义,对给定的(轮廓)函数c(t),其小波变换系数为,而由小波变换系数重建c(t)的公式可写成:,其中m0。与截断系数时所需精度有关,6小波轮廓描述符,如果设尺度函数,将上式右边第一项用 的线性组合,来代替,则可将上式写为,根据小渡变换的特点,上式右边第一项可以看作c(t)在2-m0尺度下的模糊草图,第二项则是对c(t)的细节补充如果将 称为尺度系数,称 为小波系数,则所有系数组成与轮廓,c(t)对应的小渡轮廓描述符,6小波轮廓描述符,小波轮廓描述符的基本性质(1)唯一性小波变换是一一对应的映射,所以一个给定的轮廓对应一组唯一的描述符反过来,一组描述符对应唯一的一个轮廓(2)可比较性对两个轮廓的描述矢量S1和S2,可以借助它们之间的内积 d2=来定义它们之间的距离以判别相应轮廓的相似程度,即可在数学上对轮廓的相似程度进行定量比较,6小波轮廓描述符,小波轮廓描述符:小波轮廓描述符的特点是受轮廓的局部畸变影响较小以及用较少的系数可实现较高的轮廓描述精度。相比傅立叶描述符有更好的精度和稳定性,比较适合用来描述轮廓的基本特征并用来进行基于轮廓的图像查询。,1.2.基于区域的描述,1、长轴和短轴2、区域面积3、矩形度4、圆形度5、不变矩,1.2.1长轴和短轴,边界的直径是边界上相隔最远的2点之间的距离,即这2点之间的直连线段长度。有时 这条直线也称为边界的主轴或长轴(与此垂直且最长的与边界的2个交点间的线段也叫边界的短轴)。,1.2.2区域面积,区域面积是区域的一个基本特征,它描述了区域的大小。对于数字图像而言,区域的面积定义为区域中的像素点数。这个特征受尺寸、扭曲和缩放的影响,但是它具有旋转不变性。,1.2.3矩形度,矩形度定义为物体的面积A0与物体的最小外接矩形(MER)的面积AR之比,即 R=A0/AR。矩形度反映了物体在最小外界矩形中的填充程度,矩形的矩形度为1,圆的矩 形度为pi/4,三角形的矩形度为0.5。对于其它形状,矩形度的取值范围为(0,1)。利用矩形度可以区分矩形、圆形和不规则形状。,1.2.4圆形度,圆形度反映了物体接近圆形的程度,也称作区域的紧凑性(Compactness),定义为4倍的区域面积A与周长P的平方之比(有的文献定义为周长的平方与4倍的区域面积之比),即:在相同面积的情况下,具有光滑边界的形状边界较短,圆形度较大,表明形状较密集。随着边界凹凸变化程度的增加,周长P相应增加,圆形度随之减小。圆的圆形度C=1,正方形的圆形度 C=pi/4。,1.2.5不变矩,矩为一种线性特征,可用来对区域进行描述。对于二维连续函数f(x,y),其(i+j)阶矩定义为,由单值性定理(Uniqueness)7-9可知:若f(x,y)为分段连续函数且在x-y平面内仅有有限非0值部分,则存在各阶矩,并且矩构成的序列,ijM由f(x,y)唯一确定;反之,序列,ijM也唯一确定f(x,y)。图像函数为满足上述条件的函数,因此存在各阶矩。,定义离散形式的图像(i+j)阶矩为:,可求得如下0阶和1阶矩:,1.2.5不变矩,它们分别代表了图像中的目标的总质量,绕x轴的1阶矩,绕y轴的1阶矩。由0阶和1阶矩我们可求得图像目标的质心:,定义图像的中心矩为:,则0-3阶中心矩可按如下公式计算:,1.2.5不变矩,1.2.5不变矩,定义归一化中心矩为:,下面定义的7个不变矩具有平移、尺度、旋转不变性,称为Hu矩。,8HuM.K.Visualpatternrecognitionbymomentinvariants.IRETrans.Info.Theory.1962,8:179-187.此文献证明了不变矩具有平移、尺度、旋转不变性,2.边缘检测,边缘存在于目标与背景、目标与目标、区域与区域之间,是图像最基本的特征之一为人们描述或识别目标以及解释图像提供了一个重要的特征参数。它蕴含了图像丰富的内在信息(如方向、阶越性质与形状等);纹理特征的重要信息源和形状特征的基础;图像分割、图像分类、图像配准和模式识别所依赖的重要特征。如果能成功地检测出图像的边缘,图像分析、图像识别就会方便得多,精确度也会得到提高。,滤波:边缘检测算法主要是基于图像强度的一阶和二阶导数,但导数的计算对噪声很敏感,因此必须使用滤波器来改善与噪声有关的边缘检测器的性能。大多数滤波器在降低噪声的同时也导致了边缘强度的损失,因此,增强边缘和降低噪声之间需要折中。增强:增强边缘的基础是确定图像各点邻域强度的变化值。增强算法可以将邻域(或局部)强度值有显著变化的点突显出来。边缘增强一般是通过计算梯度幅值来完成的。,检测:在图像中有许多点的梯度幅值比较大,而这些点在特定的应用领域中并不都是边缘,所以应该用某种方法来确定哪些点是边缘点。最简单的边缘检测判据是梯度幅值阈值判据。定位:如果某一应用场合要求确定边缘位置,则边缘的位置可在子像素分辨率上来估计,边缘的方位也可以被估计出来。在边缘检测算法中,前三个步骤用得十分普遍。这是因为大多数场合下,仅仅需要边缘检测器指出边缘出现在图像某一像素点的附近,而没有必要指出边缘的精确位置或方向。,线性边缘检测,The basic idea is to detect the difference of intensity.,symmetric difference has less space resolution than forward difference.,在图像没有噪声的情况下,Roberts算子、Sobel算子、Prewitt算子,都能够比较准确的检测出图像的边缘。加入高斯白噪声后,三种边缘检测算子的边缘检测效果都多少受到噪声的干扰,随着噪声的增加,噪声的影响加重,检测出大量的噪声点和伪边缘,甚至无法检测出边缘。Roberts算子受噪声的影响最大,Sobel算子、Prewitt算子受噪声影响比Roberts算子小的原因:(1)Roberts边缘检测算子采用对角线方向相邻两像素之差进行梯度幅度检测,其检测水平和垂直方向边缘的性能好于斜线方向,并且检测定位精度比较高,但对噪声敏感。,(2)Sobel边缘检测算子是综合图像每个象素点的上、下、左、右邻点灰度的加权和,接近模板中心的权值较大,不但可以产生较好的边缘效果,而且对噪声具有平滑作用,减小了对噪声的敏感性。Sobel边缘检测算子也检测出了一些伪边缘,使得边缘比较粗,降低了检测定位精度。在检测定位精度要求不是很高的情况下,Sobel算子是比较常用的边缘检测算子。(3)Prewitt边缘检测算子是一种类似Sobel边缘检测算子的边缘模板算子,它同样对噪声有平滑作用。与Sobel边缘检测算子一样,它检测出的边缘比较粗,定位精度比较低,容易损失如角点这样的边缘信息。,由于各种原因,图像总是受到随机噪声的干扰,可以说噪声无处不在。经典的边缘检测方法由于引入了各种形式的微分运算,从而必然引起对噪声的极度敏感,边缘检测的结果常常是把噪声当作边缘点检测出来,而真正的边缘也由于受到噪声干扰而没有检测出来。对于有噪声图像来说,一种好的边缘检测方法应该具有良好的噪声抑制能力,同时又有完备的边缘保持特性。,经典的边缘检测算子具有实现简单、运算速度快等特点,但其检测受噪声的影响很大,检测结果不可靠,不能准确判定边缘的存在及边缘的准确位置,造成这种情况的原因:(1)实际边缘灰度与理想边缘灰度值间存在差异,这类算子可能检测出多个边缘;(2)边缘存在的尺度范围各不相同,这类算子固定的大小不利于检测出不同尺度上的所有边缘;(3)对噪声都比较敏感。这类算子存在上述缺陷的关键是其等效平滑算子过于简单。为解决这一问题发展并产生了平滑滤波边缘检测方法,也就是边缘检测理论中最成熟的线性滤波方法,也称线性滤波边缘检测算子,一阶微分是一个矢量,既有大小又有方向,和标量相比,它的存储量大。另外,在具有等斜率的宽区域上,有可能将全部区域都当作边缘检测出来。因此,有必要求出斜率的变化率,即对图像函数进行二阶微分运算,Laplacian算子提取边缘的形式,即二阶偏导数的和,它是一个标量,属于各向同性的运算,对灰度突变敏感。在数字图像中,可用差分来近似微分运算,其离散计算形式为:,改进的Laplacian算法,原来的方向外,又增加了8个方向,共有16个方向上进行检测的模板,根据Laplacian算子的可靠性设定了适当的权向量。根据该估算模板,可以提高边缘检测的精度,由于合理地设置了参数,因而避免了一些伪边缘的提取。改进的Laplacian算子相对于原来的Laplacian算子而言,不但检测出来的边缘更清晰,而且也检测出原来所没有检测出的一些边缘。,LOG边缘检测,利用图像强度二阶导数的零交义点来求边缘点的算法对噪声十分敏感,在边缘增强之前滤除噪声。将高斯滤波和拉普拉斯边缘检测结合在一起,称LOG边缘检测算子。为抑制噪声,可先作平滑滤波然后再作二次微分,通常采用高斯函数作平滑滤波,故有LOG(Laplacian of Gaussian)算子。在实现时一般用两个不同参数的高斯函数的差DOG(Difference of Gaussians)对图像作卷积来近似,这样检测出来的边缘点称为f(x,y)的过零点(Zero-crossing)。,基本特征是:(1)平滑滤波器是高斯滤波器;(2)增强步骤采用二阶导数(二维拉普拉斯函数);(3)边缘检测判据是二阶导数零交叉点并对应一阶导数的较大峰值;(4)使用线性内插方法在子像素分辨率水平上估计边缘的位置。,该方法:首先图像与高斯滤波器进行卷积,这一步既平滑了图像又降低了噪声,孤立的噪声点和较小的结构组织将被滤除。平滑会导致边缘的延展,因此边缘检测器只考虑那些具有局部梯度最大值的点为边缘点。这一点可以用二阶导数的零交叉点来实现。拉普拉斯函数用作二维二阶导数的近似,是因为它是一种无方向算子。为了避免检测出非显著边缘,应选择一阶导数大于某一阈值的零交叉点作为边缘点。,称之为墨西哥草帽算子。(1)求图像与高斯滤波器卷积,再求卷积的拉普拉斯变换;(2)求高斯滤波器的拉普拉斯变换,再求与图像的卷积。滤波、增强、检测这三个边缘检测步骤对使用LOG边缘检测仍然成立,平滑是用高斯滤波器来完成的;增强是将边缘转换成零交叉点来实现的;边缘检测是通过检测零交叉点来进行的。,5 5大小的LOG算子模板为:,canny,传统的计算方法是用模板在图像中每个象素的邻域进行卷积运算,如Roberts,Prewitt,Sobel等算子,这些算子的主要缺点是对噪声敏感和边定位精度低。对边缘检测方法的有效性进行评价,Canny提出了三个边缘检测准则:(1)最优检测:漏检真实边缘的概率和误检非边缘的概率都尽可能小;(2)最优定位准则:检测到的边缘点的位置距离实际边缘点的位置最近,或者是由于噪声影响引起检测出的边缘偏离物体的真实边缘的程度最小;(3)检测点与边缘点一一对应:算子检测的边缘点与实际边缘点应该是一一对应的。,Canny边缘检测器是高斯函数的一阶导数,是对信噪比与定位之乘积的最优化逼近算子。平滑图像:用一维高斯函数计算梯度的幅值和方向对梯度幅值进行非极大值抑制双阈值方法检测和连接边缘,在没有噪声的情况下,Laplacian算子、LOG算子和Canny算子都可以得到比较好的检测效果,检测效果优于经典边缘检测方法,Laplacian算子检测出的边缘较粗,而且存在大量的伪边缘。当加入高斯白噪声后,Laplacian算子、LOG算子检测效果都不同程度的受到噪声的影响,Laplacian算子受噪声影响最明显,几乎检测不出边缘;而LOG算子检测出大量伪边缘和噪声点,并且检测出的边缘不全;虽然Canny算子在噪声严重的情况下,也受到一定的影响检测出的边缘有少量残缺,并出现少量的伪边缘,但Canny算子的检测效果总体上还是比较满意的。1)Laplacian算子是不依赖于边缘方向的二阶微分算子,对图像中的阶越性边缘点定位准确,该算子对噪声非常敏感,它使噪声成分得到加强,这两个特性使得该算子容易丢失一部分边缘的方向信息,造成一些不连续的检测边缘,同时抗噪声能力比较差;,(2)LOG算子首先用高斯函数对图像作平滑滤波处理,然后才使用Laplacian算子检测边缘,因此克服了Laplacian算子抗噪声能力比较差的缺点,在抑制噪声的同时也可能将原有的比较尖锐的边缘也平滑掉了,造成这些尖锐边缘无法被检测到。应用LOG算子时,高斯函数中方差参数的选则很关键,这对图像边缘检测效果有很大的影响。高斯滤波器为低通滤波器,越大,通频带越窄,对较高频率噪声的抑制作用越大,避免了虚假边缘的检出,但同时信号的边缘也被平滑了,造成某些边缘点的丢失。越小,通频带越宽,可以检测到图像的更高频率的细节,但对噪声的抑制能力相对下降,容易出现虚假边缘。因此,应用LOG算子时,为取得更佳的效果应该对不同图像选择不同参数;,(3)Canny算子虽然是基于最优化思想推出的边缘检测算子,但实际效果并不一定最优,原因在于理论和实际有许多不一致的地方。该算子同样采用高斯函数对图像进行平滑处理,因此具有较强的噪声抑制能力;同样该算子也将一些高频边缘平滑掉,造成边缘丢失。Canny算子之后采用了双阈值算法检测和连接边缘,它采用的多尺度检测和方向性搜索较LOG算子要好。,传统基于微分边缘检测的优缺点,图像边缘:图像亮度发生突变。信号的突变常常运用微分进行表示。1)Roberts:采用对角线方向相邻两像素之差表示信号的突变,检测水平和垂直方向边缘的性能好于斜线方向,定位精度比较高,但对噪声敏感,检测出的边缘较细。(2)Sobel边缘检测算子是像素邻域的加权和,模板中心值较大,不但产生较好的边缘效果,而且对噪声具有平滑作用。但存在伪边缘,边缘比较粗定位精度低。(3)Prewitt对噪声有平滑作用,检测出的边缘比较粗,定位精度,容易损失角点。,上述边缘检测算子具有实现简单、运算速度快等特点,但受噪声的影响很大,不能准确判定边缘存在及准确定位,造成这种情况的原因:(1)实际边缘灰度与理想边缘灰度值间存在差异,可能检测出多个边缘;(2)算子尺度固定不利于检出不同尺度的边缘;(3)平滑算子过于简单,对噪声都比较敏感。,4)Laplacian:算子二阶微分算子,对图像中的阶跃性边缘点定位准确,对噪声非常敏感,丢失一部分边缘的方向信息,造成一些不连续的检测边缘。5)LOG算子:首先用高斯函数进行滤波,然后使用Laplacian算子检测边缘,克服了Laplacian算子抗噪声能力比较差的缺点,LOG算子中高斯函数中方差参数的选则很关键,越大避免了虚假边缘的检出,边缘也被平滑造成边缘点的丢失。越小,噪声抑制能力相对下降,容易出现虚假边缘。6)Canny:采用高斯函数对图像进行平滑处理,因此具有较强的噪声抑制能力;同样该算子也将一些高频边缘平滑掉,造成边缘丢失,采用了双阈值算法检测和连接边缘,边缘的连续性较好。,基于微分边缘检测的不足,边缘是灰度不连续的结果。边缘检测是根据引起图像灰度变化来描述图像。图像灰度不连续性的物理过程可能是几何方面的,光学方面的。几何方面:深度的不连续性、表面取向、颜色和纹理的不同。光学方面:表面反射、非目标物体产生的阴影以及内部倒影等。在实际场合中,图像数据往往被噪声污染。边缘检测方法要求既能检测到边缘的精确位置,又可以抑制无关细节和噪声。,3.上下文形状描述符(shape context),上下文形状描述符动机:如何对物体形状进行有效表达,使得具有相似形状的图像中关键像素点点(key points)之间能够匹配,从而达到形状相似度计算目的。,所谓位于图像边界的像素点是这样的像素点:这些像素点灰度值与周围像素点灰度值存在较大差异。因此,可以用滤波算子来检测图像的边界信息,3.上下文形状描述符(shape context),3.上下文形状描述符(shape context),其原理:通过滤波算子,去寻找某个像素点与邻域像素点在横向或纵向上灰度变化是否超过了一定阈值,如果超过指定阈值,则该像素点是位于边界上的像素点,3.上下文形状描述符(shape context),步骤1:图像平滑以去除图像噪音 减少噪声响应,高斯算子对图像的平滑效果是最优的,二维高斯函数,对于一个3*3的高斯滤波算子,给定方差后,就可以通过如上公式来得到一个3*3的滤波算子矩阵,方差越大,表示中心像素点权重越大。,3.上下文形状描述符(shape context),步骤2:计算像素点的梯度,3.上下文形状描述符(shape context),步骤3:如下重置每个像素点梯度模的值,3.上下文形状描述符(shape context),步骤4:如下将每个极值点方向分别置为0、45、90和135度等四个方向,3.上下文形状描述符(shape context),步骤5:对每个潜在极值点,按照其方向,检查其方向上的相邻像素点是否是极值点,如果不是,置其值为零。否则保留该点不动,3.上下文形状描述符(shape context),步骤6:双阈值法检测和连接边缘:对非极大值抑制图像取高低两个阈值Tl和T2,其中T1T2,高阈值用来提取对比度相对较强的边缘点,得到强边缘图像n1,含有很少的假边缘,但是有间断,T1越高,得到的边缘越准确,丢失的信息就越多,T1越低,得到的目标边缘越精细,但混杂的伪边缘信息越多.通过低阈值T2获得的图像n2含有大量的细节,T2,越小,保留的边缘信息就越多,边缘越连续,双阈值法就是在n2中寻找与n1的强边缘点相连的像素点,并把它们不断地连接,直到n1连通为止。,阈值的选取:高阈值T1:设图像的总像素数为N,非边缘点的数目占总图像像素数目的比例为Hr,根据梯度直方图从低到高逐步累加图像点数目,当累加数目达到n*Hr时,对应的图像梯度值为高阈值。一般Hr的取值为0.7或0.8。低阈值T2:为T2=T1*lr,其中lr是一个比例因子a。,3.上下文形状描述符(shape context),3.上下文形状描述符(shape context),某个像素点Shape Context的提取,对于指定的像素点,以该像素点为中心,进行极坐标变换。,3.上下文形状描述符(shape context),对于指定的像素点,提取32Bin信息。,某个像素点Shape Context的提取,3.上下文形状描述符(shape context),观察图(a)和图(b)中菱形点和方块点,他们的形状上下文(d)、(e)图,基本上一致,而三角形点的形状上下文就有不同,这和我们实际的观察基本上是一致的。,3.上下文形状描述符(shape context),对于两个形状I,P,计算它们之间每个样本点(如g,h)之间的差别,即形状上下文的差别在得到每个点之间的差别以后,可以形成一个代价矩阵cost,然后运行一个最有匹配算法(如匈牙利算法等)找个一个最优匹配,使整个代价最小,最后基于这个最优匹配,得到整个形状代价,这个可以作为两个形状之间的差别衡量,代价越小,形状越相似。形状代价如下:,3.上下文形状描述符(shape context),不过到这里还只是找到一个对应关系而已,需要进一步用一个变换 T 来衡量形状之间的转变,所以,最后的形状距离可以用估计的变换来表示,如下:最后基于这个形状距离可以基本衡量两个物体形状之间的区别,进一步进行物体识别方面的工作。,http:/,http:/,