第30章基于PSO的聚类算法.ppt
《第30章基于PSO的聚类算法.ppt》由会员分享,可在线阅读,更多相关《第30章基于PSO的聚类算法.ppt(22页珍藏版)》请在三一办公上搜索。
1、第三十章,MATLAB优化算法案例分析与应用,第30章 基于PSO的聚类算法,第三十章,MATLAB优化算法案例分析与应用,30.1 聚类分析法,聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。聚类分析作为数据挖掘中的一个很重要的研究领域,有着许多不同的聚类算法。传统的聚类算法一般分为五类:层次方法、划分方法、基于网格方法、基于密
2、度方法和基于模型方法。,第三十章,MATLAB优化算法案例分析与应用,30.1 聚类分析法,传统的聚类算法已经足够成熟,能够解决低维数据的聚类问题。但因为实际应用中数据的复杂性,处理许多问题时,现有的算法容易失效,特别是对高维数据和大型数据等情况。因此传统聚类在高维数据集中进行聚类时,主要存在以下两个问题:(1)高维数据集中大量存在无关的属性使得在所有维中存在簇的可能度几乎为零;(2)高维空间中数据较低维空间中数据分布要稀疏,其中数据间距离几乎相等是普遍现象,而传统聚类方法是基于距离进行聚类的,因此传统聚类方法在高维空间数据分析较吃力。基于人工免疫粒子群的聚类算法,这将使得聚类算法具有很好的全
3、局收敛性,不仅能够有效地克服传统聚类算法对初始值敏感和易陷入局部极小值的问题,并且使得算法具有更快的收敛速度。,第三十章,MATLAB优化算法案例分析与应用,30.2 PSO优化算法分析,粒子群优化算法(Particle Swarm Optimization,PSO)又翻译为粒子群算法、微粒群算法、或微粒群优化算法。是通过模拟鸟群觅食行为而发展起来的一种基于群体协作的随机搜索算法。通常认为它是群集智能(Swarm intelligence,SI)的一种。它可以被纳入多主体优化系统(Multiagent Optimization System,MAOS)。,个体极值为,全局极值为,速度更新为,位
4、置更新为,第三十章,MATLAB优化算法案例分析与应用,30.2 PSO优化算法分析,PSO算法执行步骤如下:Step1:初始化一个规模为 m 的粒子群,设定初始位置和速度。Step2:计算每个粒子的适应值。Step3:对每个粒子将其适应值和其经历过的最好位置 的适应值进行比较,若较好,则将其作为当前的最好位置。Step4:对每个粒子将其适应值和全局经历过的最好位置 的适应值进行比较,若较好,则将其作为当前的全局最好位置。Step5:对粒子的速度和位置进行更新。Step6:如果满足终止条件,则输出解;否则返回Step2。,第三十章,MATLAB优化算法案例分析与应用,30.3 人工免疫特性分析
5、,30.3.1 生物免疫系统及其特性,多样性:免疫系统的重要特征之一,研究表明,通过细胞分裂分化作用,抗体的可变区与不变区基因重组,体细胞超变异等方式,免疫系统可产生大量的不同抗体来抵御各种抗原,从而使免疫抗体库具有丰富的多样性。在使用人工免疫系统来求最优解的问题时,一般用抗原表示满足约束条件的最优解,抗体表示候选解,用抗体和抗原之间的亲和力来表示候选解和最优解的接近程度,也就是在约束条件下候选解对于目标函数的满足程度;而抗体和抗体之间的亲和力可反映出不同候选解之间的差异,即抗体的多样性。从而防止算法陷入局部最优。通过比较抗体与抗原间的亲和力来选择有效抗体更好地体现了“优胜劣汰”的原则,特别是
6、当待选抗体之间相差不明显时,“优胜劣汰”的效果更能得到体现,搜索效率会更高.而免疫记忆的引入能够有效地抑制进化算法优化过程中出现的退化现象,提高进化算法的性能。免疫接种即是免疫记忆引入的一个方面,有选择、有目的地利用待求问题中的一些特征信息或知识,提取“疫苗”并接种“疫苗”,从而达到引进的目的。,第三十章,MATLAB优化算法案例分析与应用,30.3 人工免疫特性分析,30.3.2 种群分布熵,粒子群进化寻优的过程,实际上是不确定性不断减少的过程。算法的早熟收敛,可理解为熵的过度损失。种群分布熵一般用来表达搜索空间中各区域粒子的分布情况,反映种群中不同类型个体的散乱程度。但实际计算过程中,算法
7、无法得知某代种群内个体的不同类属情况,因此种群每进化一代,算法都必须重新对种群内的个体做聚类分析,这样才能得到新的种群分布熵,这样计算量较大。而过早收敛现象的发生,一般是因为那些粒子适应度暂时最优的个体相互趋同,而那些适应度较小的个体依然是分散的,这时的种群分布熵无法及时下降,而等到种群分布熵明显下降时,种群却已经严重地早熟收敛。这说明从进化计算的角度来看,分布熵这一指标在实际运用过程中使用率较低。,第三十章,MATLAB优化算法案例分析与应用,30.3 人工免疫特性分析,30.3.3 平均粒距,平均粒距指种群中各个个体相互间的分散程度,平均粒距描述种群的多样性的方法存在许多不足之处。首先是计
8、算量大,种群每代进化,都要计算整个种群各个个体分布方差,在中却规模和粒子维度较大是,计算量明显过大;再者是方差仅能达到反映种群个体分布离散程度的目的,并不能有效刻划出种群的多样性。,30.3.4 精英均值偏差,精英均值偏差使用适应度分布离散程度来表现种群内个体分布的多样性程度。研究分析粒子群的进化过程中发现,种群过早收敛的主要表现是:种群存在迅速向适应度暂时最优个体趋近的趋势,因此导致寻优过程十分缓慢,从而降低搜索效率。因此,一般通过观察该种群当前适应度暂时最大的那部分个体是否重复或者相互趋同来判断一个种群会否发生过早收敛。,第三十章,MATLAB优化算法案例分析与应用,30.4 基于人工免疫
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 30 基于 PSO 算法
链接地址:https://www.31ppt.com/p-6617776.html