信息与计算机学毕业论文.doc
安徽建筑工业学院毕 业 设 计 (论 文)专 业 信息与计算科学 班 级 06信息班 学生姓名 张大林 学 号 06207010388 课 题 知识产权保护知识产权保护知识 指导教师 知识产权 2010年6月摘 要知识产权保护传输过程中,由于所使用的器件和传输通道的局限性,而被加入了大量的噪声,知识产权保护像的视觉效果,甚至妨碍了人们的正常识别,而知识产权保护息也是非常重要的信息。因此,知识产权保护除和图像分割就成为图像处理的重要内容。本课题主要是应用知识产权保护策规则对数字图像进行处理,例如,图像分割和图像去噪等。主要工作如下: (1)阐述基于知识产权保护贝叶斯决策、基于知识产权保护斯决策和在限定一类错误率条件下使另一类错误率为最小的两类别决策的理论和方法; (2)设计出用知识产权保护分割知识产权保护分类器,并编写出代码实现了图像去噪和图像分割的实验; (3)对所获得的实验结果进行比较和分析,并对没有解决的问题提出进一步工作的若干想法。知识产权保护关键词:贝知识产权保护;分类知识产权保护割;图像去噪 ABSTRACTWhen there are mportant contents in the image processing process, because limitations of access devices and transmission lead them to have been joined the massive noises, they have seriously affected visual mportant contents in the image processing normal recognition. Similarly, the outline information of images is also important to us. Therefore the noise elimination and segmentation of images become important contents in the image processing.The main mportant contents in the image processing decision theory to the digital image processing, for example, image segmentation, noise elimination. There are some key issues: 1. Some theories and methods on Bayesian decision-making based on the smallest error rate, Bayesian decision-making based on the minimum risk and Bayesian decision-making of the smallest two categories of decision-making in a limited category of the error rate under conditions of the other error rate are discussed. 2. Bayesian mportant contents in the image processing, which are applied to the noise elimination and segmentation of images. And the experiment for the noise elimination and segmentation of images is made by using programming. 3. The rmportant contents in the image processing e noise elimination and segmentation of images are analyzed, some of which are unresolved issues that are focused on in next steps.Key words: mportant contents in the image processing, mportant contents in the image processing, image noise elimination目 录第一章 引 言11.1 课题相关背景11.2 课题研究目的和主要内容1第二章 多媒体技术理论22.1 贝叶斯分类决策规则32.2.1 基于多媒体技术多媒体技术决策32.2.2 基于最小风险的贝叶斯分类决策52.2.3 在多媒体技术率条件下使另多媒体技术最小的两类别决策62.2 概率密度函数估计72.2.1 参数估计72.3.2最多媒体技术计8第三章 分多媒体技术设计理论93.1 多类别分类器93.2 两类别分类器10第四章 分多媒体技术用124.1 数字图像基本概念124.2 图像去噪124.2.1 多媒体技术124.2.2 贝叶斯分类器图像去噪134.3 图像分割174.3.1 多媒体技术分割174.3.2 边缘检测224.4 相关实验效果的分析与比较224.4.1 图多媒体技术结果比较与分析224.4.2 图像多媒体技术果比较与分析23第五章 结束语24致 谢25参考文献26附 录27第一章 引 言1.1 课题相关背景随着计算机网络和多媒体技术的发展,人们获取知识和能够及时处理的数据之间的差距在加大,从而导致了一个尴尬的境地,即“丰富的数据”和“贫乏的知识”相并存。在数据的获取方面,有大量的信息需要处理,因此就产生了分类技术。分类技术要对大量的数据进行分析,并建立相应问题领域的分类模型。分类问题是根据识别对象特征的观察值将其分到某个类别中去。分类技术解决问题的关键是如何构造分类器11。图像在采集、转换和传输中,常常受到成像设备与外部环境噪声的干扰而降质。图像去噪是图像处理的常用技术,经典的图像去噪方法从本质上来说,是低通滤波的方法,低通滤波器在有效消除噪声的同时,也会使图像的边缘信息模糊。因此各种图像去噪方法,其实就是要解决去噪和保留图像高频边缘信息这个“两难”问题。10而本课题为图像的噪声消除提供了一种新的方法,即用贝叶斯分类决策对图像进行去噪处理。贝叶斯分类器是一个简单的、有效的而且在实际使用中很成功的分类器, 但贝叶斯分类器存在一个问题, 它需要一个很强的条件的假设(类别的先验概率、类条件概率和分类的类别数)9,而这个假设在实际应用中常常得不到满足。 如果忽略这一点, 则会引起分类误差。针对这一问题,我们考虑对实例的分布进行假设,用正态分布密度函数来逼近条件概率, 提出一种新的基于贝叶斯定理的分类方法。1.2 课题研究目的和主要内容图像去噪的目的是既要去除噪声,又要尽可能保留图像的重要特征,如图像的边缘和纹理。边缘信息是图像最为有用的高频信息10,在图像去噪的同时,应尽量保留图像的边缘信息,基于这一思想,提出了应用贝叶斯决策理论进行图像去噪。但是由于贝叶斯决策的条件限制比较强,而在实际中很难精确的计算出所需要的条件,因此图像去噪的效果不好,并且边缘信息保持的也不好。本课题的主要内容包括以下几个部分: (1)贝叶斯决策理论。主要介绍三种决策理论,这三种决策理论是基于最小错误率的贝叶斯决策、基于最小风险贝叶斯决策和在限定一类错误率条件下使另一类错误率为最小的两类别决策。内容是其基本概念、理论基础和分类方法。 (2)分类器设计。主要介绍的是应用三种贝叶斯决策理论方法分别设计出各自的分类器,然后应用此分类器进行图像处理。 (3)分类器的应用。主要介绍三种分类器对图像进行分割、去噪声的应用,并显示效果,然后比较三种分类器的效果之间的差异。 (4)结束语。主要介绍的是对本课题的总结。第二章 知识产权保护理论 客观世界中存在着许多的事物和现象,在对他们的多种属性进行观测时,即便是基本条件不变,观测结果也具有某种不确定性,即每一次观测的结果没有重复性,这样的模式我们称为随机模式。尽管随机模式样本测量具有不确定性,但同类抽样试验的大量模式样本的观测却呈现出某种统计特性。因此随机模式的特征向量中各个特征分量不再是一个确定性的变量,而各个类别的特征响量。贝叶斯决策理论就是用概率统计的方法研究随机模式的决策问题。贝叶斯决策理论方法是统计模式识别中的一个基本方法,用这种方法进行分类时要求满足以下两个条件:(1)各类别总体的概率分布是已知的。(2)要决策的类别数是一定的。在连续的条件下,假设要识别的对象d有种特征测量值,每一种特征多时一个随机变量,因此组成维随机向量x=T,d种特征的所有的取值范围构成了维特征空间,这里T为转置符号。 客观世界中存在着许多的事物和现象,在对他们的多种属性进行观测时,即便是基本条件不变,观测结果也具有某种不确定性,即每一次观测的结果没有重复性,这样的模式我们称为随机模式。尽管随机模式样本测量具有不确定性,但同类抽样试验的大量模式样本的观测却呈现出某种统计特性。因此随机模式的特征向量中各个特征分量不再是一个确定性的变量,而各个类别的特征响量。贝叶斯决策理论就是用概率统计的方法研究随机模式的决策问于区域A的概率也往往小于1,而位于区域B的概率也不等于0。换句话说,类型A的样本可能分布到区域B中,而类型B的样本也可能分布到区域A中。这种交错分布的样本使分类发生错误,这是模式随机性一种体现。如何使分类错误率尽可能小是研究各种分类方法的中心议题。我们在下面给出几个有关的概念:先验概率、类概率密度和后验概率。(1)先验概率。预先已知的或者可以估计的模式识别系统位于某种类型的概率。在一般性的分类问题问题中,常以(i=1,2, ,c)表示类型,则各自的先验概率用表示,并且满足+ + =1。例如根据大量统计,我国理工科大学的男女生比例大约为8 :2,则在这类学校一个学生是男生的先验概率为0.8,而为女生的概率是0.2,这两类概率是互相制约的,即这两个概率之和应满足总和为1的约束。在处理实际问题时,有时不得不以先验概率的大小作为判决的依据,即使先验概率不是判决依据的唯一因素,但如果某一种类型的先验概率相当大,有时也会成为主要的因素。(2)客观世界中存在着许多的事物和现象,在对他们的多种属性进行观测时,即便是基本条件不变,观测结果也具有某种不确定性,即每一次观测的结果没有重复性,这样的模式我们称为随机模式。尽管随机模式样本测量具有不确定性,但同类抽样试验的大量模式样本的观测却呈现出某种统计特性。因此随机模式的特征向量中各个特征分量不再是一个确定性的变量,而各个类别的特征响量。贝叶斯决策理论就是用概率统计的方法研究随机模式的决策问(3)系统在某个具体的模式样本X条件下位于某种类型的概率。一个具体事物属于某种类别的概率,例如一个学生用特征响量 X 表示,它是男性或女性的概率表示成和,这就是后验概率。由于一个学生只可能为两个性别之一,因此有+=1的约束,这一点与类分布概率密度是不同的。后验概率与先验概率也不同,后验概率涉及一个具体事物,而先验概率是泛指一类事物,因此和是两个不同的概念。后验概率可以根据贝叶斯公式计算,它直接用做分类判决的依据。(4)贝叶斯公式。两个事物X与联合出现的概率称为联合概率,可写成。而它们又可与条件概率联系起来,即=,这就是贝叶斯公式。如果将上式中各个项与先验概率,类条件概率密度函以及后验概率联合起来,可以找到利用先验概率,类条件概率分布密度函数计算后验概率的方法。 2.1 贝叶斯决策决策规则2.2.1 基于最小错误率的贝叶斯分类决策在模式分类问题中,我们往往希望尽量减少分类错误的概率,因需要建立一种能使错误率为最小的决策规则。从这样的要求出发,利用概率论中的贝叶斯公式得出使错误率为最小的决策规则,我们称之为基于最小错误率的贝叶斯决策。 首先我们从一个两类情况癌细胞识别的例子出发讨论,然后推广到一般情况。 假设每个要识别的细胞已作过预处理,并抽取了d个特征描述量,用一个d维的特征向量X表示,识别的目的是要依据该X向量将细胞划分为正常细胞或者异常细胞。这里我们用表示是正常细胞,而则属于异常细胞。 客观世界中存在着许多的事物和现象,在对他们的多种属性进行观测时,即便是基本条件不变,观测结果也具有某种不确定性,即每一次观测的结果没有重复性,这样的模式我们称为随机模式。尽管随机模式样本测量具有不确定性,但同类抽样试验的大量模式样本的观测却呈现出某种统计特性。因此随机模式的特征向量中各个特征分量不再是一个确定性的变量,而各个类别的特征响量。贝叶斯决策理论就是用概率统计的方法研究随机模式的决策问判为异常细胞时小。但是仅按先验概率来决策,就会把所有细胞都划归为正常细胞,并没有达到将正常细胞与异常细胞区分开的目的。这表明由先验概率所提供的信息太少1。 客观世界中存在着许多的事物和现象,在对他们的多种属性进行观测时,即便是基本条件不变,观测结果也具有某种不确定性,即每一次观测的结果没有重复性,这样的模式我们称为随机模式。尽管随机模式样本测量具有不确定性,但同类抽样试验的大量模式样本的观测却呈现出某种统计特性。因此随机模式的特征向量中各个特征分量不再是一个确定性的变量,而各个类别的特征响量。贝叶斯决策理论就是用概率统计的方法研究随机模式的决策问 (2.1) 式中:。 客观世界中存在着许多的事物和现象,在对他们的多种属性进行观测时,即便是基本条件不变,观测结果也具有某种不确定性,即每一次观测的结果没有重复性,这样的模式我们称为随机模式。尽管随机模式样本测量具有不确定性,但同类抽样试验的大量模式样本的观测却呈现出某种统计特性。因此随机模式的特征向量中各个特征分量不再是一个确定性的变量,而各个类别的特征响量。贝叶斯决策理论就是用概率统计的方法研究随机模式的决策问从以上讨论可知,基于最小错误绿的贝叶斯决策理论就是按后验概率的大小作判决的,其决策规则为:如果>,则x,否则x 。我们注意到,在式中,后验概率主要由先验概率和类条件概率密度函数的乘积所决定,分母可仅仅看做一个标量因子,在决策时不起作用。因此我们可以得到最小错误率的贝叶斯决策规则的其它表达形式:(1)如果>,则x;否则x。 (2.2)(2)对于上述(1),可以用比值的方式表示,得到相应的决策规则为: (2.3) 我们称为关于x的似然函数或似然,式中L(x)称为似然比, 为似然比的阈值。前面给出了最小错误率贝叶斯决策规则,单尚未证明按这种决策规则进行分类时确实能使分类错误率最小。下面我们以一维情况完成证明,其结果不难推广到多维。假设模式特征x是一个连续的随机变量,显然观察到的x值不同,后验概率不同,分类错误率不同。分类错误概率是随机变量x的函数。而观察到大量模式,对它们作出决策的平均错误率应是的数学期望。从概率论知识,可以计算出这个随机变量x的函数 的数学期望:=式中:为x值出现的概率,是观测值为 x 时的条件错误概率,而积分运算则表示在整个d维特征空间上总和。在此一维情况下,x取从到的整个范围。在两类别问题中,按决策规则,当>时决策为。显然这个决策意味着,对观测值x有概率的错误率。如果我们把作出 决策的所有观测值区域记为,把作出的决策所有观测值区域记为,则在区内的每个x值,条件错误概率为值,在区中的每个x值,条件错误概率为。因此平均错误率可表示成:在区内任一个都有>,同样,在区内任一x值都有>,错误率在每个x值处都取最小者,因而平均错误率也必然达到最小,其平均错误最小。实际上,基于最小错误率的贝叶斯决策规则,对于每次观测到的特征值x,都是取错误率尽可能小的值,则整个积分值也必定达到最小,这就证实了最小错误率的贝叶斯决策法则确实使错误率达到了最小。以上证明不难推广到多维特征空间的情况。2.2.2 基于知识产权保护贝叶斯分类决策上面讨论了使错误率最小的贝叶斯决策规则,并且证明了应用这种决策法则时,平均错误率是最小的。但当接触到实际问题时,可以发现使错误率最小并不一定是一个普遍适用的最佳选择。例如:在上面讨论过的细胞分类的例子中,把正常细胞错分为癌细胞,或相反方向的错误,其严重性是截然不同的。把正常细胞误判为异常细胞固然会给人带来不必要的痛苦,但若将癌细胞误判为正常细胞,则会使病人因失去及早治疗的机会而遭受极大的损失。由此可见,根据不同性质的错误会引起不同程度的损失这一考虑出发,我们宁肯扩大一些总的错误率,也要使总的损失减少。因此需要引进一个与损失有关联、更为广泛的概念风险。在作出决策时,要考虑所承担的风险。最小风险的贝叶斯决策规则正是为了体现这一点而产生的。最小风险的贝叶斯决策就是把各种分类错误而引起的损失考虑进去的贝叶斯决策规则。在最小错误概率的贝叶斯决策方法中,分类时所作的决策单纯取决于观测值X对各类的后验概率中之最大值,因而也就无法估计作出错误决策所带来的损失。为此不妨将作出判决的依据从单纯考虑后验概率最大值,改为对该观测值X条件下各状态后验概率求加权和的方式,表示成如下形式:(x)=式中: 表示观测样本X实属类别j,而被判为状态i时所造成的损失;则表示了观测值x被判为i 时损失的均值。如果我们希望尽可能避免将某状态错判为状态,则可将相应的值选择得大些,以表明损失的严重性。因此加权和衡量了观测样本X被判为状态所需承担的风险。而究竟将X判为何类则应依据所有 中的最小值,即最小风险来定4。下面我们给出一些确切的定义,然后讨论最小风险的贝叶斯决策规则。(1)自然状态与状态空间。自然状态是指待识别对象的类别,而状态空间 则是有所有自然状态所组成的空间。(2)决策与决策空间2。在决策论中,对分类问题所作的判决,称之为决策,由所有决策组成的空间称为决策空间。决策不仅包括根据观测值将样本划归哪一类别(状态),还可包括其它决策,如”拒绝”等,因此决策空间内决策总数a可以不等于类别数c,表示成如下形式: A=(3)损失函数,也记为,这就是前面我们引用过的。它明确表示对自然状态作出决策时所造成的损失。(4)观测值X条件下的期望损失 = 这就是前面引用的符号,也称为条件风险。根据上式计算每一种决策的条件风险,则最小风险的贝叶斯决策规则为:如果=,对应的决策 。对于实际问题,最小风险的贝叶斯决策可按下列步骤进行:(1)在已知,,i=1,2,c及给出待识别的x情况下,根据贝叶斯公式计算出后验概率:(2)利用计算出的后验概率及决策表,计算出采取 时的条件风险: =,i=1,2, (2.4)(3)对(2)中得到的个条件风险值进行比较,找出使条件风险最小的决策,则就是最小风险的贝叶斯决策。对于二类问题,令为真正状态函数,而把误作为真正状态时所受到的损失。这时最小风险的贝叶斯决策法则为:如果<,则判定为真正的状态,否则为真正的状态。将式和代入式<,经过一些简单的变换,可得这个决策法则的另一种形式:如果 (),则判定为真正的状态,否则为真正的状态。2.2.3 在限定一知识产权保护两类别决策 在两类别决策问题中,有两种错误分类的可能性:(1)属于的模式被分到。(2)属于的模式被分到。实际中,有时要求限制其中一类的错误率为某个常数,而使另一类错误率尽可能地小,这就是所谓的Neyman-Pearson决策所要解决的问题。例如,在癌细胞识别中,我们知道把异常误判为正常的损失更严重,所以希望这种误判的错误率很小。假设是一个很小的常数,令=,现在希望尽可能地小。已知:=在=的条件下,求的极小值是一个典型的条件极值的问题,可以采用拉格朗日(lagrange)乘子法,建立数学模型为:L=+其中: 是lagrange乘子,目的是求L的极小值。根据类条件概率密度的性质有: =1使L极小的问题实际上就是要选择和的边界,使得L极小。假如对于某一个特定的模式x,上式的被积函数是负的,则我们可以用将x分到的方法来减少L的值;反之,假如对于某一个特定的模式x,上式中的被积函数是正的,则我们可以用将x分解到的方法来减少L的值。换句话说,对于一个待识别的模式x,如果上式中的被积函数是负值,则应将它分到中去;而如果上式中的被积函数为正值,则应将它分到中去。所以,判决规则应该是:如果 ,则 x ;如果 ,则x 。由此可得判别函数: (2.5)这样使得L达到极小,从而能在保持错误概率 为常数的条件下,使另一种错误概率达到极小。由此可见,与最小错误概率的贝叶斯方法一样,Neyman-Pearson决策也是以似然比检验为基础的方法,差别只是在于它固定一种错误概率为常数。因为区域为,而为达到极小值的必要条件是这是未知数为的方程,解得就是分界的阈值。 2.2 概率知识估计2.2.1 参数估计首先简单介绍参数估计的一些基本概念。 (1)统计量。假设每一个训练样都包含着总体的某些信息,为了估计未知参数就要把有用的信息抽取出来。为此,要构造训练样本的某种函数,这种函数在统计学中称为统计量。 我们常把未知参数记为 。例如,正态分布中的均值向量 和协方差矩阵,都可能成为的元素,甚至先验概率也可能是要估计的参数,因此一般是向量。构造出描述的数学模型是关键性的步骤,有关数学模型是统计学中的统计量。 (2)参数空间。在统计学中,把未知参数的可取值的集合称为参数空间。记为。 (3)点估计、估计量和估计值16。针对某未知参数构造一个统计量作为的估计,这种估计称为点估计;称为的估计量;若代入自变量的值得到 的值称为的估计值。 (4)区间估计。在一定置信度条件估计某一未知参数 的取值范围,称之区间估计。2.3.2最大适时知识估计最大似然估计,是参数估计中的重要方法,首先说明该方法的前提条件,然后导出估计量的计算公式。 前提条件: (1)参数是确定而未知的量。(2)按类别把样本集分开,假定c个类,则可分成c个样本集其中的样本都是从概率密度为的总体中独立抽取出来的。(3)类条件概率密度具有某种确定的函数形式例如,正态分布、指数分布等,但其参数向量,未知。例如一维正态分布,未知的参数为。为了表示同有关,就把记成。(4)假定中的样本不包含关于()的信息,也就是说不同类别的参数在函数上是独立的,这样就可以分别对每一类进行处理。也就是说中的样本只对提供有关信息,而没有关于()的任何信息。 在这些假设的前提下,就可以分别处理c个独立的问题。独立地按照概率密度抽取样本集,用去估计出未知参数。 已知某一类样本集包含有N个样本,即 =由于假设样本是独立抽取的,所以 (2.6)是的函数,把叫做相对于样本集的的似然函数。在统计学中似然函数定义为: 似然函数:N个随机变量的似然函数是N个随机变量的联合密度16=似然函数给出了从总体中抽出这样N个样本的概率。为了便于解释,暂且假定是已知的,用表示这个已知值。它能使似然函数L()极大化。一般来说,使似然函数的值最大的是样本的函数,记为=d()叫做的最大似然估计量.第三章 知识产权保护理论3.1 多类别知识产权 首先让我们来定义判别函数和决策面。 对于c类分类问题,按照决策规则可以把d 维特征空间分成c个决策域,我们将划分决策域的边界面称为决策面,在数学上用解析形式可以表示成决策面方程。用于表达决策规则的某些函数则称为判别函数。判别函数与决策面方程是密切相关的,且它们都由相应的决策规则所确定,下面就两类最小错误率贝叶斯决策给出判别函数和决策面方程。对于两类情况,设 x=T ² 多类情况(1)判别函数。通常定义一组判别函数用于表示多类决策规则: 如果使对一切成立,则将x 归于 类。这里可定义为=更一般地可以取为,其中f( )为任一单调增函数。(2)决策面方程。各决策域被决策面所分割,这些决策面是特征空间中的超曲面,相邻的两个决策域在决策面上其判别函数是相等的,如果和是相邻的,则分割它们的决策面方程应满足 = (3)分类器设计。分类器可看成是由硬件或软件组成的一个“机器”。它的功能是先计算出c个判别函数 ,再从中选出对应于判别函数为最大值的类作为决策结果。 多元正态分布3 。多元正态分布的概率密度函数。多元正态分布的概率密度函数定义为式中,x=T 是d维列向量。 T是d维均值向量。是维协方差矩阵,是的行列式。T是的转置,且 给出最小错误率的贝叶斯判别函数和决策面的有关公式,在多元正态概率下就可以立即写出相应的表达式: 3.2 知识产权保护 ² 两类情况 (1)判别函数。在两类情况下,我们可以仅定义一个判别函数 并将决策规则表示为 如果 则决策 ; 如果 则决策 。显然,可定义出如下的判别函数 (2)决策面方程。决策面方程显然是 相应于决策面方程为 其他可类似得出。 一般地说,x 为一维时,决策面为一曲面;x为二维时,决策面为一曲线;x 为 d维(d>3),决策面为一超曲面。 (3)分类器设计。两类分类器可看作只是计算判别函数 的一个“机器”,它根据计算结果的符号将x分类。 尚需指出讨论的决策规则仅就样本的观测值x是连续情况而言,即x可在d维特征空间中取任意值。然而在一些实际问题中,x的分量可能只允许在有限个离散值中取值,这种情况的决策理论完全是连续情况的推广,在此就不讨论了。正态分布概率密度函数的定义及性质² 单变量正态分布12 单变量正态分布概率密度函数定义为 式中为随机变量x的期望,为x的方差,称为标准差。 概率密度函数应满足下列关系式 单变量正态分布概率密度函数,由两个参数和就可以完全确定出来。为简单起见我们常记为,用来表示x是以均值和方差所构成的正态分布的随机变量。正态分布的样本主要集中在均值附近,其分散程度可以用来标准差来表征。从正态分布的总体中抽取样本,约有%的样本都落在区间中。 两类别的判别函数是 第四章 知识产权保护应用4.1 数字图像基本概念 虽然图像一词在人们日常交流中的使用频率很高,大多数人也知道图像是什么,但对图像却没有严格的定义。Castleman博士在其其著作 <<数字图像处理>>中,将图像定义为“在一般的意义下,一幅图像是一个东西的另一个表示”,是其所表示物体的信息的一个浓缩或者概括。朊秋 先生则将图像定义为“以某一技术手段被再现于二维平面上视觉信息”,通俗的说就是指用技术手段把目标原封不动地一模一样再现的图像。综上所述,可以认为图像是与之对应的物体或目标的一个表示,这个表示可以通过某种技术手段得到。与图像密切相关的两个概念是图片和图形。一般认为,图片是图像的一种类型,强调现实世界中的可见物体。图形与图像的数据结构不同,图形采用矢量结构,而图像采用栅格结构。 图像可根据其形式或产生方法分类。第一类是可见图像,即可以由人眼看见图像,这也是大多数人所理解的图像,这一类图像通常由照像、手工绘制等传统方法得到,一般不能直接被计算机处理,但经过数字化处理后可变为数字图像。第二类称之为物理图像,它反映的是物体的电磁波辐射能,包括可见光和不可见光。第三类称之为数学图像,是由连续函数或离散函数生成的抽象图像5。图像在计算机中是以二维矩阵来表示和存储的,其元素的值表示相应像素的灰度值。图像被与其大小完全相等网格分割成大小相同的小方格,每一方格称为像素或像元。像素是构成图像的最小基本单位,每个像素具有独立的属性。一个像素最少具有两个属性,即像元的位置和灰度值。位置由像元所在的行列坐标决定,通常用坐标对(x, y)表示,像元的灰度值可以理解为图像上对应点的亮度值。灰度图像矩阵元素的取值范围通常为0, 255,因此其数据类型一般为8位无符号整数,这就是人们经常提到的256灰度图像。“0”表示纯黑色,“255”表示纯白色,中间的数字从小到大表示由黑到白的过渡色。在某些软件中,灰度图像也可以用 精度数据类型表示,像素的值域为0, 1,0代表黑色,1代表白色,0到1之间的小数表示不同的灰度等级。虽然图像一词在人们日常交流中的使用频率很高,大多数人也知道图像是什么,但对图像却没有严格的定义。Castleman博士在其其著作 <<数字图像处理>>中,将图像定义为“在一般的意义下,一幅图像是一个东西的另一个表示”,是其所表示物体的信息的一个浓缩或者概括。朊秋 先生则将图像定义为“以某一技术手段被再现于二维平面上视觉信息”,通俗的说就是指用技术手段把目标原封不动地一模一样再现的图像。综上所述,可以认为图像是是单色图像中像素亮度的表征,量化等级越高,表现力越强。4.2 图像去噪 先输入一幅lina.bmp图像,然后对图像进行加噪(为椒盐噪声)处理,实际上就是原图像中某些点的灰度值改变了,得到两幅图像,都能显示出来。4.2.1 中值滤波中值滤波是基于排序统计理论的一种能有效抑制噪声的非线性信号处理技术。在一维形式下,一维中值滤波器含有奇数个数据的滑动模板,对模板中的数据由小到大排序,取排在中间位置上的数据作为最终的处理结果。中值滤波的核心运算是将模板中的数据进行排序,如果一个亮点(暗点)的噪声,就会在排序过程中被排在数据序列的最右侧或者最左侧,因此,最终选择的数据序列中间位置上的值一般不是噪声点的值,由此便可以达到抑制噪声的目的。直接调用Matlab工具箱中的函数(medfilt2)6得到结果如图1所示。图1 知识产权保护4.2.2 贝叶斯分类器图像去噪实验一 基相关实验结果叶斯决策规则的图像去噪类别的状态是一个随机变量,而某种状态出现的概率是可以估计的。在两种类别为 和的判定中,识别前已知先验概率和,且+=1,合理的决策规则应为:若>,则做出属于的判断;若<,则做出属于的判断。显然如果仅仅按照先验概率决策就会把所有类别都归属一类,而根本未达到正常分开来的目的。这是由于先验概率提供的分类信息太少。为此还必须利用所观测到的信息,由其灰度值抽取而得到一维观测向量,且已知类条件概率,是类状态下观察灰度值x的类条件概率密度,是类状态下观察灰度值的类条件概率密度。利用贝叶斯公式得到和,基于最小错误绿的贝叶斯决策理论就是按后验概率的大小作判决的,其决策规则为:如果*> *,则x;否则x。对没加噪声的图像,当服从正态分布时,其概率密度为 对于添加噪声的图像,当服从正态分布时,其概率密度为 如果则把x归于类;如果则把x归于类。由此可见决策结果取决于实际观察到的类条件概率密度和先验概率两者。按照这种规则进行分类,实际上是对每个x都使取小者,这就使平均错误率达到最小。实验方案:将图像的灰度值做为参数,设为非噪声类和为噪声类,非噪声点和噪声点的先验概率可由添加噪声中的参数得到,且=1,为原图像灰度的平均值,可用函数mean2计算得出,为原图像的灰度值的方差,可从原图像的灰度直方图中估计得出 14 ,为加噪图像灰度值的平均值,可函数mean2计算得出,为加噪图像灰度值,可从加噪图像的灰度直方图中估计得出。再根据基于最小错误率的贝叶斯分类器进行噪声和非噪声的判定。对图像中的每一点,若该点的灰度值x满足: (4.2)则,即为非噪声点,不需要进行处理。若满足 (4.3)则,即为噪声点,需要进行处理,用其8邻域的中位数进行代替。图像去噪结果见图2。图2 知识产权保护实验二 基于相关实验结果器的图像去噪最小风险贝叶斯决策是考虑各种错误造成损失不同而提出的一种决策规则。类别的状态是一个随机变量,而某种状态出现的概率是可以估计的。在两种类别为(非噪声)和(噪声)的判定中,识别前已知先验概率和,且+=1。类条件概率密度服从正态分布,对没加噪声的图像,当服从正态分布时,其概率密度为 对于添加噪声的图像,当服从正态分布时,其概率密度为再根据贝叶斯公式,后验概率为 (4.4) 从而得到后验概率,之后再给定损失函数(为常数),其中和都为0,则得到最小风险的贝叶斯决策规则的判别函数实验方案:将图像的灰度值做为参数,设为非噪声类和为噪声类,先验概率和,可由添加噪声的参数得到,且+=1,为原图像灰度的平均值,可用函数mean2计算得出,为原图像的灰度值的方差,可从原图像的灰