模糊聚类分析算法研究.doc
《模糊聚类分析算法研究.doc》由会员分享,可在线阅读,更多相关《模糊聚类分析算法研究.doc(51页珍藏版)》请在三一办公上搜索。
1、摘要聚类就是按照事物间的相似性进行区分和分类的过程,在这一过程中没有教师指导,因此是一种无监督的分类。聚类分析则是用数学方法研究和处理所给定对象的分类。传统的聚类分析是一种硬划分,它把每个待辨识的对象严格地划分到某个类中,具有非此即彼的性质,因此这种分类的类别界限是分明的。而实际上大多数对象并没有严格的属性,它们在性态和类属方面存在着中介性,适合进行软划分。Zadeh提出的模糊集理论为这种软划分提供了有力的分析工具,人们开始用模糊的方法来处理聚类问题,并称之为模糊聚类分析。模糊聚类分析算法的一般包括三个步骤:第一步:数据标准化;第二步:建立模糊相似矩阵;第三步:聚类。本文对模糊聚类分析中的两种
2、算法进行了重点研究。最后利用matlab实现了一个模糊聚类算法,并用实例加以验证。关键词:模糊集合,模糊聚类分析,模糊等价矩阵,传递闭包AbstractThis paper will illustrate “clustering analysis” thoroughly. Cluster is a process that assorts things by their similarity. There is no adviser in this process, so it is a non-supervised classification. “Clustering analysis”
3、research and process assort things by mathematical means. Traditional Clustering analysis assorts things strictly: therefore the limit of the classification is very clearly. But in fact most of the things have no obvious attribute by each: their limit is vague, as a result soft classification is a b
4、etter way to process them. Professor Zadeh introduced the theory of fuzzy sets, which offer a powerful means to solve the problem. People begin to use fuzzy way to deal with clustering problem, and call it “fuzzy clustering analysis”.“Fuzzy clustering analysis” contains three steps. The first is dat
5、a standardization; the second is to establish fuzzy similar matrix; the third is clustering. This paper will research two arithmetic of the Fuzzy clustering analysis. Finally, the paper will accomplish Fuzzy clustering analysis program by matlab. It is significant to use data to validate it. Key wor
6、ds: fuzzy set, fuzzy clustering analysis, fuzzy equivalent matrix, transitive closure目录第1章 引言11.1研究背景11.2本文的研究对象与工作31.3本文的内容组织3第2章 模糊聚类分析综述42.1模糊集合的基本概念42.2 模糊集合的表示法42.3 模糊集的运算及性质52.4 模糊集的分解定理62.5 模糊矩阵72.6 模糊聚类分析算法综述14第3章 基于模糊等价矩阵的模糊聚类分析193.1基于模糊等价矩阵的模糊聚类分析的主要步骤193.2 基于模糊等价矩阵的模糊聚类分析方法的评价27第4章 基于目标函数
7、的模糊ISODATA聚类分析304.1 模糊ISODATA聚类分析方法304.2 聚类效果的检验324.3 模糊ISODATA算法的改进33第5章 模糊聚类分析算法的实例实现345.1 求模糊相似矩阵355.2 计算的传递闭包355.3 计算截矩阵36结束语37参考文献40致谢42外文资料原文43外文资料译文46第1章 引言1.1研究背景聚类是人类最基本的一项认识活动,人类要认识世界就必须区别不同的事物并认识事物间的区别与联系,并且是伴随着人类的产生和发展而不断深化的一个问题。所谓聚类,它是一种研究分类的多元分析方法,就是按照事物的某些属性,将事物分成多个类或簇,所以又称为簇分析、群分析,它的
8、做法是使得在同一类中的事物相似性尽可能的大,不同类别间的事物相似性尽可能的小。聚类分析则是指用数学的方法研究和处理给定对象的分类。“人以群分,物以类聚”,聚类是一个古老的问题,它伴随着人类社会的产生和发展而不断深化,人类要认识世界就必须区别不同的事物并认识事物间的相似性。经典分类学往往是从单因素或有限的几个因素出发,凭经验和专业知识对事物分类.这种分类具有非此即彼的特性,同一事物归属且仅归属所划定类别中的一类,因此这种分类的类别界限是分明的,所以这种分类又被称为硬分类。随着人们认识的深入,发现这种分类越来越不适用于对具有含义模糊的事物进行分类。如把人按身高分为“个子高的人”,“个子矮的人”,“
9、身材中等的人”。如何判别特定的一个人的类别便产生了经典分类学解决不了的难题。而这类问题适合进行软分类,模糊数学的产生就为软分类提供了数学基础,由此产生了模糊聚类分析。我们把应用普通数学方法进行分类的聚类方法称为普通聚类分析,而把应用模糊数学方法进行分析的聚类分析称为模糊聚类分析。由于模糊聚类得到了样本属于各个类别的不确定性程度,表达了样本类属的中介性,即建立起了样本对于类别的不确定性的描述,能更客观地反映现实世界,从而成为聚类分析研究的主流。在现实生活中,人们往往会使用一些意思清楚而又不准确的语言来描述这个世界,比如“这座山很高”,“今天天气很热”等,对于有着丰富经验和常识的人来说,理解这些是
10、很容易的,但让计算机去分析这些带有模糊性的信息就很困难了,例如,我们能很容易地根据别人描述的特征找到一个东西,但让计算机去做则很困难,因为以往的计算机技术大都是基于经典数学的,经典数学能很好地处理精确信息,但对含义不明确的信息就显得无能为力了,而这种信息在日常生活中被大量使用.美国控制学专家LA.Zadeh教授充分认识到了这一矛盾,提出了模栈数学的核心思想,就是用数学的手段来模仿人的思维,建立对复杂事务进行模糊度量、模糊识别、模糊推理、模糊控制和模糊决策的本领,由此产生了模糊数学。最早是由 Rsupah将模糊理论应用于聚类分析,于是出现了数据对象聚类归属模糊化,即每个数据对象并非一定要绝对的归
11、属于某个聚类,而可以按照某一归属系数不同程度的分别属于不同的聚类。模糊聚类分析的实质就是根据研究对象本身的属性构造模糊知阵,在此基础上根据一定的隶属度来确定其分类关系。比较典型的有:基于相似性关系和模糊关系的方法(包括聚合法和分裂法),基于模糊等价关系的传递闭包方法,基于模糊图论的最大树方法,动态直接聚类法、人工神经网络模糊聚类法以及基于数据集的凸分解、动态规划和难以辨识关系等方法。模糊聚类理论的发展推动了它在生产实践中的应用。由于模糊聚类的强大功能,使得这种技术己经在很多的领域获得了成功的应用。而且随着模糊聚类理论的不断发展和完善,必将发挥更大的作用。由于模糊聚类与模式识别的有着自然联系,使
12、得它在识别领域首先获得了最为广泛的应用;其次,在图像处理中经常需要处理无监督的分类问题,因此理所当然的成为重要的分析工具,图像处理是计算机视觉的重要组成部分,由于人眼视觉的主观性使图像比较适合用模糊手段处理,同时训练样本图像的缺乏又需要无监督分析,而模糊聚类正好满足这两方而的要求,因此成为图像处理中一个强大的研究分析工具。模糊聚类在图像处理中最为广泛的应用为图像分割,由于图象分割问题可以等效为象素的无监督分类,因此早在1979年Coleman和Andrews就提出用聚类算法进行图像分割,此后基于二维直方图、塔型结构、小波分析、分形分维等一系列新技术,人们又相继提出了多种基于模糊聚类的灰度图像分
13、割的新方法,并且在纹理图像分割、彩色图像分割、序列图像分割、遥感图像分割等方而也获得了很大的进展。基于模糊聚类的方法在边缘检测、图像增强、图像压缩、曲线拟合等众多方而的研究同样一也取得了丰硕的成果。现在数据挖掘技术是当今数据库系统研究和应用领域的热点问题,聚类分析是数据挖掘中非常重要的研究领域和应用技术之一,由于人们有待处理的问题越来越多,因此要求数据库处理的数据种类也越来越多,这其中就有含义不明确的模糊数据,所以将模糊信息处理技术加入到聚类分析中,便可以有助于数据挖掘技术的发展。此外,在通讯系统中的信道均衡、矢量量化编码中的码书设计、时间序列的预测,神经网络的训练、参数估计、医学诊断、气候分
14、类、食品分类、水质分析等领域中模糊聚类分析也发挥着重大的作用。例如,在对耕作土壤进行分类时,红壤、黄壤和棕壤之间的界限不是很清晰,那么介于两者之间的土壤归属问题,用模糊聚类分析来处理更加合理。各种形式的聚类分析方法以及广阔的应用领域为聚类分析研究提供了宽广的舞台。同时,在聚类分析中加入模糊理论,可以使现有的聚类分析方法更加符合复杂的实际情况,模糊聚类分析方法也在各个领域有着更好的应用前景。1.2本文的研究对象与工作本文通过阐述模糊集合知识,引出模糊数学中一个重要的研究领域,即模糊聚类分析,综述了当前常见模糊聚类分析的原理及方法,并对模糊聚类分析中两种重要的方法即基于模糊等价矩阵的模糊聚类分析法
15、和ISODATA法进行了重点研究,之后给出改进算法。最后使用Matlab语言实现一个模糊聚类分析程序。1.3本文的内容组织 本文的内容一共分为五章。第一章为“引言”,介绍模糊聚类分析的背景意义、研究现状和发展情况,本文的研究对象与工作概述及内容组织。第二章为“模糊聚类分析综述”,先介绍模糊集合的基本概念,然后阐述模糊集合的基本运算方法,给出分解定理,它是联系模糊集合与经典集合的桥梁。接着介绍了几种当前较为常见的模糊聚类分析方法的主要思路。第三章为“基于模糊等价矩阵的模糊聚类分析”,说明模糊聚类分析是如何通过模糊矩阵的变化来实现的,以及模糊聚类分析的步骤和能实现分类的各种方法。第四章为“基于目标
16、函数的模糊ISODATA聚类分析”,介绍了ISODATA算法的主要思路,给出了一些改进的思路。第五章为“模糊聚类分析算法的实例实现”,用Matlab语言实现了一个模糊聚类分析程序。最后为“结束语”,是对全文的总结与展望。第2章 模糊聚类分析综述2.1模糊集合的基本概念人们所熟悉的经典集(为了与模糊集相区别,故称之为经典集)论要求:对论域中的任何元素,或者属于某一集合,或者不属于这个集合,两者必居其一且仅居其一。然而在现实世界中,有许多概念都是很模糊的,比如说“天气好”、“水温很低”、“个子很高”等都是模糊的概念。这样就使得经典集合论对于这样的概念显得力不从心了,因为模糊概念很难简单地用“属于”
17、或“不属于”来表示,而只能通过属于的程度来描述。换句话说,就是论域中的元素符合某一概念的程度不能仅仅用0或1来表示,而需要借助于介于0到1之间的实数来表示。:论域上的“模糊集合”定义为:或者其中或者称为“隶属函数”,它满足: :,这里称为“隶属空间”,最常见的隶属空间为。隶属函数用于刻画元素对模糊集合的隶属程度,即“隶属度”。所以模糊集合的每个元素都能明确地表现出的隶属等级。的值越大,的隶属程度就越高。比如,=1时,说明完全属于,而=0时,说明不属于,而值介于0和1之间时,说明隶属于的程度也介于“属于”与“不属于”之间是模糊的。由定义可以看出,模糊集合是由隶属函数唯一确定的,以后可以把模糊集合
18、与隶属函数看成是等同的,另外,隶属程度的思想是模糊数学的基本思想。当的值域为集合时,模糊集合就是经典集合,可见经典集合是模糊集合的特殊情形。上的所有模糊集合组成的集合称为的模糊幂集,记为。2.2 模糊集合的表示法对于模糊集合,可以有各种不同的表示方法:(2) 序偶表示法 序偶表示法又称为向量表示法,它的形式为:(2)符号法:这种表示法适合用于任何种类的论域,特别是论域为无限集合的模糊集合的描述。设论域为,为上的一个模糊集合,则可以记为:这里的积分符号仅仅是一种表示,而并不意味着是进行积分运算。(3)符号法:这种表示法适合用于论域为有限集合或可列集合的模糊集合的描述。设论域为,为上的一个模糊集合
19、,则可以记为:式中“”和“”只是一种记号,不是通常意义下的分数线与求和,只是表示上的元素与其隶属度的对应关系的一个总括。2.3 模糊集的运算及性质2.3.1定义:设,,若对于任意的,有,则称包含,记为,如果且,则称与相等,记为.:设,定义并:对于任意的,的隶属函数为 ,交:对于任意的,的隶属函数为 ,补:对于任意的,称为的补集,也称为余集,其隶属函数为2.3.2模糊集运算的性质 幂等律:, 交换律:, 结合律:, 吸收律:, 分配律:, 零-壹律:,;, 复原律: 对偶律:,值得注意的是,与经典集合交、并和补运算性质不同的是,在这里互补律不再成立,这一事实表明模糊集合不再具有“非此即彼”的特点
20、,这正是模糊性带来的特征。2.4 模糊集的分解定理2.4.1 截集:设为论域中的模糊集合,定义的“截集”为集合实数称为“阈值”或“置信水平”。:设为模糊集合,则下面的等式成立,:令为模糊集合,且,则. 这个定理从理论上回答了“值越小,包含的元素越多”的问题。这种让由大到小取值,而所含的元素由少到多的过程,实际上是一种分类过程。值取得越大,包含的元素越少,分出的类就越多,分类就越细;反之亦然,这是以后模糊聚类分析的基础。2.4.2 分解定理模糊集合的截集是经典集合,那么能否用经典集合来表示模糊集合呢?下面介绍的分解定理就可以解决这个问题。为了叙述分解定理,首先引入一种新运算,即:数与模糊集合的乘
21、积。(3) 数与模糊集合的乘积 :设,,规定,其隶属函数为,并称为数与模糊集合的乘积。可见是一个模糊集合。 数与模糊集合的乘积运算的性质: 2. :设,则 推论2.1:设,则 推论2.2:设,对任意的,则 分解定理是模糊数学的重要定理之一,由分解定理可知各数积项的最终计算是取最大值,所以只需计算各区间中上界与其相应截集的数积。2.5 模糊矩阵2.5.1 模糊矩阵的概念当论域为有限集合时,对于普通二元关系分的描述常常采用关系矩阵的方法,与此类似,对于有限论域上的二元模糊关系,也常常采用模糊矩阵描述.(4) 模糊矩阵的定义如果与都是有限集,则到的模糊关系的隶属函数值可用一个矩阵表示。设,是到的一个
22、模糊关系,令 ,若其所有元素满足则称矩阵为模糊矩阵。显然,布尔矩阵式模糊矩阵的特例。在有限论域中,普通关系与布尔矩阵具有一一对应的关系,与此同时,在模糊数学中,有限论域中的模糊关系与模糊矩阵之间也具有一一对应的关系。设,均为阶模糊矩阵,则(5) 当且仅当时,“等于”,记为=当且仅当时,“包含”,记为定义与的“并运算”为定义与的“交运算”为定义补运算为2.5.2 模糊矩阵的运算及其性质一模糊矩阵之间的关系设,记,则相等:,包含:,二模糊矩阵的并,交,补运算模糊矩阵的并,交,补运算具有与模糊集合性质相同的性质(交换律,结合律,分配律等)设记,则 并: 交: 补: 模糊矩阵的并,交,补运算的性质:设
23、,,,则有 幂等律:, 交换律:, 结合律:, 吸收律:,(6) 分配律:,(7) 零-壹律:,;, 复原律: 对偶律:,下面是包含性质:设,,,则有 , 三:模糊矩阵的合成运算模糊矩阵的合成运算相当于矩阵的乘法运算。1. 定义设,称模糊矩阵为与的合成,其中,即。 合成运算不满足交换律:即,和普通矩阵乘法一样,只有模糊矩阵的列数等于模糊矩阵的行数时,合成运算才有意义。2. 模糊方阵的幂设 ,模糊方阵的幂定义为合成“”运算的性质: 结合律: 分配律:下面是包含性质四:模糊矩阵的转置模糊矩阵的转置定义与线性代数中矩阵的转置定义是相同的。设,称为的转置矩阵,其中,。模糊矩阵的转置具有以下性质: 五
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模糊 聚类分析 算法 研究
链接地址:https://www.31ppt.com/p-3972058.html