细胞识别统计系统的开发毕业论文.doc
细胞识别统计系统的开发【摘要】 “细胞识别统计系统”是针对医学细胞图片的识别统计算法进行探索,用Visual C+ 6.0开发的小型应用程序。它的主要功能是通过对细胞图像进行一些列图像处理从而进行识别统计,本系统是典型的医学工程领域的应用,通过传统的方法寻求到改进的识别统计方法,从而能够使本系统有更大的应用面,能够适应更多类型的图片统计,加快统计速度,并将误差严格控制在要求范围内。【关键词】 细胞;医学图像;图像处理;阈值;识别统计The System of Recognition and StatisticHU Bing-Yang(Grade 07,Class 3, Major Computer Science and Technology, Computer Science and Technology Dept., Shaanxi University of Technology, Hanzhong 723003, Shaanxi)Tutor: WEI JiaAbstract:“The System of Recognition and Statistic” is a small application that aims at a medical science cell picture to statistics algorithm to carry on quest and developed by program tool Visual C+ 6.0, Its main function is pass carry on some row icons vs the cell icon transaction to carry on an identification statistics thus .THSI issue is a typical application in medical engineering.HSI issue aims at medical cellular image to explore the arithmetic of recognition and statistic.With the hope that finds out the methods about improving on recognition and statistic,and can apply in larger respects and more kinds of images,quicken the calculate speed,and control the error in the required range strictly. Key words: cell;recognition;statistic;threshold;system毕业设计(论文)原创性声明和使用授权说明原创性声明本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得 及其它教育机构的学位或学历而使用过的材料。对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。作 者 签 名: 日 期: 指导教师签名: 日期: 使用授权说明本人完全了解 大学关于收集、保存、使用毕业设计(论文)的规定,即:按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。作者签名: 日 期: 学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名: 日期: 年 月 日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权 大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。涉密论文按学校规定处理。作者签名:日期: 年 月 日导师签名: 日期: 年 月 日目 录引 言11 图像处理的基本方法21.1 图像处理基础知识21.2图像数据格式21.3图像的直方图31.4高维直方图和彩色空间变换41.5图像的灰度拉伸61.6图像的平滑71.8图像的分割81.9图像形态学101.10图像的边缘提取111.11本章总结132 细胞识别统计系统142.1系统基本概述142.2图像的平滑152.3图像的阈值分割162.4图像的孔洞填充182.5梯度提取边界202.6图像的腐蚀212.7图像的细化222.7细胞数量的统计252.8本章总结263 改进的细胞识别统计系统273.1自适应矢量中值滤波273.2基于HSI的彩色图像分割283.3图像的修正303.4本章总结314 识别统计系统最优化讨论324.1影响因素的讨论324.2各影响因素结果的对比334.3本章总结355 总结36致谢37参考文献38附录A:科技外文文献39附录B:源程序代码41附录C:系统使用说明书54引 言近年来,随着计算机及其相关技术的迅速发展及图形图像技术的日渐成熟,使得图像处理技术逐步渗入医学领域中,开创了数字的新时代。医学是关系到千千万万人的身心健康的应用学科,医学的发展水平体现了一个国家的人民生活标准,代表了一个国家的综合国力。自古以来,“望、闻、问、切”都是国内外进行医学诊断最基本的手段。但是,自伦琴1895年发现X射线以来,医学的诊断方式发生了翻天覆地的变化。随着可视化技术的不断发展,现代医学己越来越离不开医学影像技术,医学影像在临床诊断、教学科研等方面正发挥着极其重要的作用【1】。 生物医学工程是建立在现代高科技基础上的新兴交叉学科,涉及现代图像技术、信号处理、计算机视觉、医学成像、人工智能等学科。数字图像处理和模式识别等技术在生物医学领域得到广泛的应用,如病理切片图像、X射线透视图像、CT和MRJ、核医学影像、超声影像、红外线热成像图像等。其中在染色体分析、血细胞自动分类、胸部X光照片的鉴别、眼睛虹膜和指纹识别等生物识别技术方面都开展了卓有成效的研究工作。 图像处理技术是把经过数学变换后得到数字图像信息,再由计算机进行编码、增强、复原、压缩、存储等处理,最后产生可视图像。图像处理技术在通信科学、机器人视觉、多媒体技术、高清晰度电视、医用图像、目标跟踪等领域得到了广泛的应用。自九十年代起,借助计算机图像处理与分析、计算机图形学、虚拟现实和计算机网络等技术的医学影像分析与处理一直是国内外研究与应用的热点【3】。目前生物医学工程是数字图像处理技术应用的一个非常活跃的领域。 目前,医学影像包括B超扫描图机图像、X射线透视图像、核磁共振(MRF)图像、CT图像、PET图像、SPECT图像、数字X光机(DX)图像、各种电子内窥图像、显微镜下病理切片图像等,同时,更清晰、更有诊断价值的高质量医学图像技术正在不断研究和发展中。 图像的预处理技术对图像数据进行各种处理以期达到最好的显示效果,常用的预处理技术有直方图处理、滤波、增强、恢复、插值、形态学、旋转、平移以及缩放等变换技术。几何变换可以方便的使用户从不同角度多方位的观察图像。滤波、增强、恢复操作可以消除图像数据中的噪音,提高图像质量。在所提供的医学细胞图像当中,经常存在源图像在图像质量上存在较大的噪音或者缺陷,需要进行以上一系列工作才能得到一个较为清晰的图像。 医学图像与普通图像相比,本质上具有模糊性和不均匀性的特点,一是医学影象有灰度的含糊性,即在同一类组织中,像素值也会出现大幅度的变化,同种组织里面也会有像素的不均匀。另外由于图片源的来源问题,带来的噪声信号往往模糊了物体边缘的高频信号,造成了图像在一定程度上的模糊效应。此外,还存在局部效应。比如在一个边界的体素中,常常包含了边缘和物体两种物质,图像中的物体的边缘拐角及区域间的关系都难以精确的描述,一些组织相互重叠,边缘无法界定。这就需要使用滤波以及增强等方法对其处理,使局部区域的对比度上升,方便以后的处理中进行比如分割,确定边缘等系列工作。1 图像处理的基本方法1.1 图像处理基础知识由于受到各种条件的限制和随机干扰,各种医学图像在图像获取,传输和转换过程中往往会发生一定程度的降质,比如灰度变化,噪声污染,几何畸变等。医学图像的处理的目的是简化图像数据,为后续的图像处理做准备,图像与处理的方法这里做了以下总结,其分类如图1.1所示图1.1 图像预处理方法分类下面针对图像的数据格式以及基本的图像处理方法进行介绍。1.2图像数据格式 了解图像,最简单的是从二维图像入手。二维图像最直观的例子就是计算机屏幕上的图像【11】。计算机图像由一些极小尺寸的矩形小块组合而成。组成图像的这种最小基本元素称作像素(pixel),例如,一幅图像水平方向上有256个像素,垂直方向上也有256个像素,整幅图像有256*25665536个像素,这就是图像的大小(size),又称作图像的尺度。图像的尺度计算公式为:S=N*N尺度等于图像X方向像素个数与Y方向像素个数之积。 像素本身也有自己的大小,即对应实际物体空间的大小,尽管在图像处理过程中,可以根据需要设定像素的大小,但像素对应的最小尺度受到成像设备本身的分辨能力限制,例如某个扫描图像的分辨率是2mm*2mm。知道像素所代表的实际尺寸,才能了解医学图像中具体器官或组织的准确大小。 像素除了物理尺寸外,它的另一个重要属性就是强度(Intensity),对于黑白图像来说,图像的强度用灰度的等级Gray(level)来表示【5】。等级往往用2的整数次幂表示,例如,8bit(256个灰度等级),常用的还有10bit,12bit等灰度等级。 图像在计算机中是以数据文件形式存储的,存储的格式有多种,较常用的有BMP,GIF,JPEG,TIFE,PGX等,这些图像格式原理不同,各有自己的特点和应用价值,常用的为BMP文件。 BMP文件又叫位图文件(BitMap),BitMap文件格式是微软公司为其Windows环境设置的标准图像格式,可在Windows系统环境下使用,而且是一种与设备无关的点阵位图文件格式。Windows系统软件中还同时内含了一系列支持BMP图像处理的API函数。 随着Windows在世界范围内的不断普及,BMP文件格式无疑也已经成为PC机上的流行的图像文件格式【13】。BMP图像文件格式可以存储单色、16色、256色以及真彩色四种图像数据,其数据的排列顺序与一般文件不同,它以图像的左下角为起点存储图像,而不是以图像左上角为起点。BMP图像文件的结构可以分为三个部分:文件头、位图信息数据块以及图像数据。Windows将BMP图像文件头分成两个数据结构,其中一个数据结构中包含BMP文件的类型、大小和打印格式等信息,称为BITMAP FILE HEADER,另外一个数 据结构 中则 包含BMP文 件的 尺寸定 义等 信息, 称为BIT MAP INFO HEADER,如果图像文件还需要调色板数据,则将其存放在文件头信息之后【3】。 位图信息数据由一个位图信息头和一个颜色表组成。位图数据的长度由图像尺寸,像素的位数和压缩方式等共同决定,实际尺寸可由文件头中的第1项“文件大小”减去第5项“数据偏移值”得到。1.3图像的直方图 对一幅图像所包含的全部像素的灰度做统计,并以横坐标表示灰度值,纵坐标表示图像之中具有该灰度的像素个数,这样绘制出的曲线称作图像灰度分布直方图(HSITOGRAM),对于高分辨率灰度的图像,例如,灰度分辨率8BIT的图像共有256个不同的灰度值(O,1,2,3.一255)。灰度统计分布近似为一条连续的曲线(实际为一组离散的线段),横坐标为灰度级,纵坐标为该灰度出现的频率【20】。 有一个连续图像:设A(R)代表灰度小于R的所有像素的面积,则: 如果为数字图像:设图像尺寸为MXN,共有K级灰度,并且具有灰度级RK的像素数为G(RK),则有: 其中P(R)为概率密度函数。 灰度直方图反映的是图像灰度的统计性质,它有以下性质:1) 不包含图像灰度分布的空间信息,因此无法解决目标形状问题2) 具有不唯一性,即不同图像可能对应相同的直方图3) 具有可加性,即图像总体直方图等于切分的各个子图像的直方图之和下例为一细胞源灰度图像与其直方图:图1.2细胞源图像及直方图显示1.4高维直方图和彩色空间变换 在数字图像处理中,人们根据不同应用提出了许多颜色系统。最常用的是RGB彩色系统。其它常见的还有CMYK,YIQ,YUV,YCBCR,HSI等【16】。其中CMYK用在工业印刷中,YIQ和YUV用在电视系统中(分别为北美NTSC制,和欧洲PAL制)。YIQ,YUV,YCBCR都是RGB的线性变换。1.4.1 HSI颜色模型的介绍 HSI(HUESATURATIONINTENSITY)中的H是色调,表示颜色的类别;S是饱和度,表示颜色的纯度;I是亮度,表示光亮程度。HSI颜色模型用直观的形式表示,如图1.3所示,H分量的值用弧度表示,变化范围在0到2之间;S分量的值由距离圆柱体中心轴的半径长度表示,离圆柱体的中心轴越近,S值越小,颜色越浅,H值越不稳定;I分量用圆柱体轴方向上的高度表示,它反映了颜色的灰度等级。圆柱体底平面上的点的I值最小,所有点的颜色都为黑色;圆柱体平面上的点的I值最大,所有点的颜色都为白色,此两平面上H、S的取值没有意义,图1.3中底平面上的线段和弧只起示意作用。图1.3 HSI颜色模型的图形表示1.4.2彩色空间的选择 表达颜色的彩色空间有很多种,它们常是根据不同的应用目的而提出的。最常见的色彩空间是红绿蓝(RED,GREEN,BLUE,RGB)空间,彩色图像常用R、G、B三个分量的值来表示,但R、G、B三分量之间有很强的相关性,直接利用这些分量往往不能得到所需的效果。微机上显示的彩色图像一般用RGB颜色模型来表示和存储像素点的颜色信息。RGB模型有利于图像的显示,但不符合人们的视觉习惯,也不利于程序对图像颜色特征的利用。 比较接近人对颜色视觉感知的是色度、饱和度和亮度(HUE,SATURATION,INTENSITY,HSI)空间【20】。在对色彩信息的利用中,HSI空间的优点在于它将亮度(I)与反映色彩本质特性的两个参数色度(H)和饱和度(S)分开。光照明暗给物体颜色带来的直接影响就是亮度分量(I),它与彩色信息无关,而H和S分量与人感受彩色的方式紧密相连。HSI空间比较直观并符合人的视觉特性,因此采用此空间作为图像分割的基础,会获得比较好的效果。本文中,我们将彩色图像转化到HSI彩色空间。 针对染色后得到的细胞图像,本文选用HSI模型表达细胞的颜色信息。选择该模型的原因有四个:1) 人们对颜色的感知经过外界光刺激、色感觉、色知觉三个过程,最终形成对物体颜色三方面的认识:颜色的类别、颜色的纯度、颜色的明亮程度,而根据上面的介绍,HSI颜色模型的三个分量正好与人们对颜色三方面的认识相对应,符合人们的视觉习惯与视觉心理,有利于利用计算机视觉方面的知识;2) 在HSI颜色模型中,将人眼视觉上得到的颜色感受转换为特定的数值表示,使得程序能够容易地利用颜色信息,而在RGB模型中,虽然也是用数值表示颜色,但程序不能根据人眼的视觉判断机制有效地利用其中所蕴含的信息,且三原色之问相关性大;3) HSI颜色模型将颜色信息和亮度信息分开,H分量和S分量表示颜色,I分量表示光亮强度,这点对于处理细胞图像各个部分亮度变化较大的情况尤为有用;4) 对于经过染色的红细胞,其细胞本身和另外的血小板或者白细胞在H值或S值上有明显的区别,根据这个区别设定恰当的阈值,可以分割出红细胞的区域。使用HSI颜色模型使我们能够利用人眼得到的颜色差别达到分割细胞图像的目的。显微图像是由彩色CCD摄像机获得的由R,G,B三基色组成的图像。大部分情况下,可以直接在RGB彩色空间中处理图像,但对于分割目标可能在三维空间形成混叠的情况,有必要对图像作变换,映射到其它彩色空间中,得到较好的分离效果。HSI空间是RGB的非线性变换空间,其中H分量在大多数情况下能反映出细胞的有关特性,具有良好的可分性。在分析中直方图和高维直方图对真彩色图像分割中正确选择合适的彩色模型研究有很好的作用。图2.4 一副红细胞彩色图样图2.5 对应的红、绿、蓝分量的直方图 RGB色彩空间转换到HSI色彩空间的公式: 关于从RGB转换到HSI色彩空间在后面还会讲到。1.5图像的灰度拉伸 图像的灰度拉伸是图像线性变换的一种方式。 图像的线性变换就是将图像中所有的点的灰度按照线性灰度变换函数进行变换。该线性灰度变换函数是一个一维线性函数【11】: 灰度变换方程为: 式中参数K为线性函数的斜率,B为线性函数在Y轴的截距,DA表示输入图像的灰度,DB表示输出图像的灰度。当K1时,输出图像的对比度将增大:当K1时,输出图像的对比度将减小;当K1且K0时,操作仅使所有像素的灰度值上移或下移,其效果是使整个图像更暗或更亮;如果K0,暗区域将变亮,亮区域将变暗,点运算完成了图像求补运算。特殊情况下,当K1,B0时,输出图像和输入图像相同:当K-1,B255时,输出图像的灰度正好反转。 灰度拉伸是分段线性变换,它的灰度变换函数表达式如下: 图像拉伸可以更加灵活的控制输出灰度直方图的分布,它可以有选择的拉伸某段灰度区间以改善输出的图像。如果一幅图像灰度集中在较暗的区域而导致图像偏暗,可以用灰度拉伸功能来拉伸(斜率1)物体灰度区间以改善图像;同样如果图像灰度集中在较亮的区域而导致图像偏亮,也可以使用灰度拉伸功能来压缩(斜率1)物体灰度区间以改善图像质量。1.6图像的平滑 图像的平滑是一种实用的数字图像处理技术,主要目的是为了减少图像的噪声【12】。一般情况下,在空间域内可以用平均临域来减少噪声:在频率域,由于噪声频谱通常多在高频段,因此可以采用各种形式的低通滤波的办法来减少噪声。 图像的均值滤波是一种图像空间域滤波增强技术。 图像的空间信息可以反映图像中的物理位置、形状、大小等特征,而这些特征可以通过一定的物理模式来描述。例如,物体的边缘轮廓由于灰度值变化剧烈,一般呈现高频率特征,而一个比较平滑的物体内部由于灰度值比较均一则呈现低频率特征。因此,根据需要可以分别增强图像的高频和低频特征。例如,对于人像的比对查询,就需要通过高频增强突出五官的轮廓。对图像的高频增强为高通滤波,可以突出物体的边缘轮廓,从而起到锐化图像的作用。因此,也可以称为锐化滤波。从频率域的角度讲,它能减弱甚至消除图像的低频分量,保留高频分量,故称之为高通滤波。 相应地,低通滤波则是指对图像的低频部分进行增强,它可以对图像进行平滑处理,一般用于图像的噪声消除,因此,也可以称为平滑滤波。从频率域的角度讲,可以减弱甚至消除图像的高频分量,而保留低频分量,故称之为低通滤波。滤波技术按照所在的空间不同,可以分为空间域滤波和频率域滤波,锐化滤波和平滑滤波一般在空间域进行,高通滤波和低通滤波则一般在频率域进行。 在一般的图像平滑中,常用3 X 3或者5 X 5的模板得到的平滑图像,一般用于消除图像中的随机噪声,从而起到图像平滑的作用。均值滤波法是将一个像素及其邻域中的所有像素的平均值输出作为相应的像素,从而达到平滑图像的目的。 线性滤波器是线性系统和频域滤波概念在空间域的自然延伸。其输出像素值R的计算由下列公式定义: 其中:Wi i=1,2,n是模板的系数 Zi i=1,2,n是被计算像素的值 常见的均值滤波3X3模板见图1.9图1.9 常见的均值滤波器将以上的均值滤波加以修改,可以得到以下的加权滤波器。图1.10 修正加权均值滤波器1.8图像的分割1.8.1医学图像分割技术 医学图像处理的主要研究方向有图像分割、图像配准等,而其中医学图像分割的研究具有更重要的意义【20】。结构分析、运动分析、三维可视化等后续操作,以及图像引导手术、肿瘤放射治疗、治疗评估等应用研究都假设己对图像做了准确分割,或者说都是以图像分割为基础的。这与计算机视觉中出现的情况类似。医学图像分割是正常组织和病变组织的三维重建、定量分析等后续操作的基础,也是临床医学应用的瓶颈,分割的准确性对医生判断疾病的真实情况并做出正确的诊断计划至关重要。 由于医学图像具有的极繁杂的多样性和复杂性,加上目前医学影像设备(CTMRI,PET)等成像技术上的特点,使得医学图像存在一定的噪声,图像中目标物体部分边缘也有可能局部不清晰,这使得医学图像的分割更困难。因此,目前在医学图像分割方面仍然没有可以通用的理论和方法,从指导思想上看,图像分割方法可以分为两种体系,以计算机为单一执行者的自动分割方法和人机结合的交互式分割方法。自动分割方法的指导思想是追求完全由计算机自主完成目标的分割任务,而不需要人的参与。但是,目前计算机自主分割的结果不能令人满意,准确性不能满足医学图像的应用要求,而对人机交互过于依赖又是实际应用不能接受的。因而,目前对自动分割方法的研究继续关注的同时,对交互分割方法的研究也成了医学图像分割的研究重点。 所谓图像分割是指将图像中具有特殊涵义的不同区域区分开来,这些区域是互相不交叉的【15】。 图像分割的要求主要有:图像分割所得到的全部子区域的总和应该能包括图像中所有的像素。各个子区域是相互不重叠的,分割出的区域的内部不应该有很小的孔洞;分割出的图像区域应该具有某种相同的性质。分割出的区域的边界与实际的边界要吻合;分割出的同一个子区域内的像素应当是连通的。1.8.2医学图像分割方法的分类 图像分割是当今图像技术的一个热点和焦点。对于一幅灰度图像,区域内部的像素一般具有灰度相似性,而在区域之间的边界上一般具有灰度的不连续性,所以分割算法可据此分为利用区域问灰度不连续性的基于边界的算法和利用区域内灰度相似性的基于区域的算法。另外根据分割过程中的处理策略不同,分割算法又可以分为并行算法和串行算法【12】。对于医学图像分割算法的分类依据也不统一。1.8.3并行边界技术并行边界技术的分割方法比较典型的是并行微分算子法,该算法对图像中灰度的变化进行检测,通过求一阶导数极值点或二阶导数过零点来检测边缘【12】。常用的一阶导数算子有梯度算子、PREWITT算子和Sobel算子,二阶导数算子有LAPLACIAN算子,还有KIRSCH算子和WALLIS算子等非线性算子。1.8.4串行边界技术1) 基于曲面拟合的方法:这种方法的基本思想是将灰度看成高度,用一个曲面来拟合一个小窗口内的数据,然后根据该曲面来决定边缘点。2) 基于曲线拟合的方法:这种方法用平面曲线来表示不同区域之间的图像边界线,试图根据图像梯度等信息找出能正确表示边界的曲线从而得到图像分割的目的,而且由于它直接给出的是边界曲线而不象一般的方法找出的是离散的、不相关的边缘点,因而对图像分割的后继处理如物体识别等高层处理有很大帮助。即使是用一般的方法找出的边缘点,用曲线来描述它们以便于高层处理也是经常被采用的一种有效的方式。1.8.5并行区域分割1) 阈值分割的方法:阈值分割是最常见的并行的直接检测区域的分割方法【14】。单阈值分割,将图像分为目标和背景两大类;多阈值方法,图像将被分割为多个目标区域和背景;为区分目标,还需要对各个区域进行标记。选取的阈值应位于两个峰之间的谷,从而将各个峰分开。2) 分类和空间聚类的方法:分类是模式识别领域中LEE基本的统计分析方法。主要应用有:对人脑MR图像和CT肝脏图像进行组织分类、处理微循环图像、计算血管面积、对电镜图像中的细胞特性进行提取、计算、识别和分类以及对隔膜图像的结构进行分析等。3) 基于随机场的方法:最常用的一种统计学方法是将图像看作一个马尔科夫随机场MRF(MARKOV RANDOM FIELD),统计学方法的实质是从统计学的角度出发对数字图像进行建模,把图像中各个像素点的灰度值看作是具有一定概率分布的随机变量。在很多情况下,组织的灰度分布呈高斯分布。整幅图像的直方图可以看作各组织分布的迭加。例如,对人脑的MR图像可以看作由白质(WM)、灰质(GM)、脑脊液(CSV)、脑脊液与灰质混合(NCG)及灰质与白质混合区(GW)五种成分组成。首先绘制图像的直方图,对这五种成分组成(均按高斯分布)拟合求出各类组织灰度的均值和方差2。4) 连通区域标识法:图像分割的各个区域可以通过标记分别把他们提取出来,标记区域的简单有效的方法是检查各像素与其相邻像素的连通性。包括像素标识法和游程连通法。1.8.6串行区域分割 区域生长和分裂合并是两种典型的串行区域分割方法。其特点是将分割过程分解为顺序的多个步骤,其中后续步骤要根据前面步骤的结果进行判断而确定【12】。 区域生长的基本思想是将具有相似性质的像素集合起来构成区域,该方法需要先选取一个种子点,然后依次将种子像素周围的相似像素合并到种子像素所在的区域中。与阈值分割类似,区域增长也很少单独使用,往往是与其它分割方法一起使用,特别适用于分割小的结构如肿瘤和伤疤。在区域合并方法中,输入图像往往先被分为多个相似的区域,然后类似的相邻区域根据某种判断准则迭代地进行合并。在区域分裂技术中,整个图像先被看成一个区域,然后区域不断被分裂为四个矩形区域,直到每个区域内部都是相似的。分裂合并方法中,区域先从整幅图像开始分裂,然后将相邻的区域进行合并。分裂合并方法不需要预先指定种子点,它的研究重点是分裂和合并规则的设计。但是,分裂技术可能会使分割区域的边界被破坏。1.9图像形态学1.9.1形态学基础 数学形态学是一种应用于图像处理和模式识别领域的新方法【20】。1964年,法国学者SIERRA和MATHERON在法国共同建立了枫丹白露(FONTAINEBLEAU)数学形态学研究中心,并逐步建立完善了数学形态学的理论体系,此后,又研究了基于数学形态学的图像处理系统。 形态学主要是用于获取物体拓扑和结构信息,它通过物体和结构元素相互作用的某些运算.得到物体更本质的形态。在图像处理中的应用主要是:(1)利用形态学的基本运算,对图像进行观察和处理,从而达到改善图像质量的目的;(2)描述和定义图像的各种几何参数和特征,如面积、周长、连通度、颗粒度、骨架和方向性等。数学形态学运算实质是一种二维卷积运算,当图像维数较大时特别是用灰度形态学、软数学形态学、模糊形态学等方法时,运算速度很慢。为了实现对图像的有效处理,不得不在算法上进行优化。数学形态学中的两个基本操作是腐蚀(EROSION)和膨胀(DILATION),而其后的开(OPEN)和闭(CLOSE)运算以及击中击不中运算都是以这两个基本操作为基础的。在程序设计中腐蚀膨胀这两个运算的处理速度的快慢就直接影响了开、闭运算以及击中击不中运算的速度,故而大多数优化运算都是集中在对这两种运算的优化上。传统的提高运算速度的做法是利用结构元素分解,如HOCHONGPARK,ROLANDT.CHIN用3×3的结构元素分解任意形状的大结构元素,或者是将结构元素分解成两个一维结构元素膨胀运算的结果,再把分解过的结构元素代入图像的腐蚀膨胀运算中去,以达到提高运算速度的目的。这样的做法只能在部分情况下取得令人满意的结果,并且需要大量的理论计算才能够确定合适的分解方案,限制了算法的通用性和易用性。1.9.2膨胀和腐蚀1.9.2.1图像的膨胀用结构元素B对输入图像F进行灰度膨胀记为Fb,其定义为(Fb)(S,t)=MAXF(s-x,t-y)b(x,y)(s-x),(t-y)DbandXDb2.9其中Df和Db分别是f和b的定义域。 图1.11灰度膨胀示例图中(A)和(B)分别给出F和B,图(C)是运算过程,图(D)是膨胀后的结果。膨胀的计算是在由结构元素确定的邻域中选取FB的最大值,所以对灰度图像的膨胀操作有2类效果:如果结构元素的值都为正的,则输出图像会比输入图像亮;根据输入图像中暗细节的灰度值以及它们的形状相对于结构元素的关系,它们在膨胀中或被消减或被除掉。1.9.2.2图像的腐蚀 用结构元素B对输入图像F进行灰度腐蚀记为F-b,其定义为(F-b)(S,t)=MINF(s+x,t+y)-b(x,y)(s+x),(t+y)DfandXDb2.10其中Df和Db分别是F和 B的定义域。腐蚀的计算是在由结构元素确定的邻域中选取F-B的最小值,所以对灰度图像的腐蚀操作有2类效果:如果结构元素的值都为正的,则输出图像会比输入图像暗;如果输入图中亮细节的尺寸比结构元素小,则其影响会被减弱,减弱的程度取决于这些亮细节周围的灰度值和结构元素的形状和幅值。1.10图像的边缘提取 图像的边缘对人的视觉具有重要意义,因为人类识别物体需依赖于物体的边缘。例如当人们看到一个色彩亮度变化缓慢的区域时,很难把这个区域分为轮廓分明的两部分,但是当该区域有颜色突变时,人们就能立刻感受到边缘的存在。边缘检测是图像分割的一种重要途径,它用于检测图像中具有颜色突变的地方,包括颜色的亮度和色度的不连续,这种不连续性就称为边缘。一般来说,图像中的边缘由深度不连续、表面法向量不连续,光照不连续和材料的反射性质不连续等几种不连续情况造成【14】。大家知道,边缘与物体间的边界并不等同,边缘指的是图像中像素的颜色值有突变的地方,而物体的边界则指的是现实场景中的存在于物体之间的边界,如果要找出图像上颜色值有突变的像素点,则首先必须进行不同像素点颜色之间的比较。由于灰度图像像素点的颜色都落在一条直线上.因此颜色的比较相对容易。1.10.1梯度提取边界原理 梯度的求解实际上是边缘检测的一种。边缘是指图像中灰度发生急剧变化的区域。图像灰度的变化情况可以用灰度分布的梯度来反映,给定连续图像F(X,Y),其方向导数在边缘法线方向上取得的局部最大值即可判定为边缘【16】。梯度可以定义如下:1.10.2边缘检测算子 以下是常用的边缘检测算子的形式与特点:表1.1常用边缘算子的形式与特点算子名H1H2特点Roberts边缘定位准对噪声敏感Prewitt平均,微分对噪音有抑制作用Sobel加权平均边宽2个像素Isotropic Sobel检测沿不同方向边缘时梯度幅度一致1) ROBERTS边缘算子【16】是一种利用局部差分算子寻找边缘的算子,是典型的梯度计算法。为了简化计算经常使用梯度的简便计算方法用差分来近似微分,可以看成是2×2算子,如式:g(i,j)=|f(i,j)-f(i+1,j+1)|+|f(i+1,j)-f(i,j+1)|2) 为了强有力地抑制噪声,PREWITT边缘算子计算所要处理像素的邻域区域内灰度的“和”及平均值的“差”。它也可以扩展成0°、45°、90°、135°、180°、225°、270°、315°这8个方向,这里不做赘述。称其0°和90°的样板算子为SMOOTHED算子。在程序设计中,依次用样板去检测图像与被检测区域最为相似的样板给出最大值,并用该最大值作为算子的输出值。3) 3)8个卷积组成了KIRSCH边缘算子,图像中的每个点都有8个掩模对某个特定方向边缘做出最大响应,可以将所有8个方向中的最大值作为边缘幅度图像的输出。最大响应掩模的序号构成了对边缘方向的编码,也可结合系统需要灵活组织样板。每个点都用这2个做卷积,一个对通常的垂直边缘响应最大,而另一个 基于医学图像的细胞识别统汁系统对水平边缘响应最大。2个卷积的最大值作为该点的输出值。运算结果是一幅边缘幅度图像,对上一F左右的像素赋予比对角线上大的权重可以有效地抑制噪声。4) ROBINSON算子是一个样板算子,是Sobel边缘算子的扩展,由8个样板组成,8个卷积核形成了ROBINSON算子。图像中的每个点都有8个掩模对某个特定方向边缘做出最大响应,可以将所有8个方向中的最大值作为边缘幅度图像的输出。最大响应掩模的序号构成了对边缘方向的编码。也可结合系统需要灵活组织样板。 Sobel算子的处理效果较好,轮廓线清晰,各类噪声较少,有利于进一步的轮廓跟踪与修补。在系统的实际使用过程中,经该算子增强处理的图像可实现关键部位的自动识别定位,由轮廓线的模糊变形引起的测量误差可在实际应用中尽量消除。所以在本文中,选用的是Sobel算子。1.11本章总结本章主要是对图像的基本性质,灰度图像以及彩色图像(24位)的直方图显示,直方图的拉伸、均衡化以及数字图像形态学做一个简要的介绍,这也是图像预处理工作中重要的基础工作,对于把握好图像的基本信息很重要。2 细胞识别统计系统2.1系统基本概述2.1.1血液细胞识别统计系统 本系统是医院中血液红细胞记数的实用系统。它主要是以病人的血液样本(切片样本)为原始数据,通过一系列的图像处理与分析,最后识别出血液中感兴趣的细胞(红细胞或白细胞),同时给出他们的个数【2】。在得到他们的个数以后,通过检测的血液量,就可以得出血液中细胞的密度以检查患有何种病变,该系统可以很方便的应用在临床诊断以及全功能监护仪上,大大提高速度和效率。2.1.2系统基本技术要求 在系统开发前,首先需要确定系统的基本技术要求。以下是血液细胞自动识别统计系统的基本技术要求,也是所有医院统一的技术要求:1) 系统稳定,要求系统能够至少连续无错运行一个星期;2) 系统对细胞的统计误差不能超过5:3) 要求系统能够处理一些比较特殊的情况,比如比较严重的细胞粘连(多个细胞重叠在一起),或者有多个细胞处于采