欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    做聚类分析.ppt

    • 资源ID:5784786       资源大小:1.03MB        全文页数:39页
    • 资源格式: PPT        下载积分:10金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    做聚类分析.ppt

    用SPSS作聚类分析,以经济效益数据为例,用聚类分析法对各省市作分类(见spssex-4/全国各省市经济效益数据)以城镇居民消费资料为例,用聚类分析法对各省市作分类(见spssex-4/城镇居民消费支出资料),毛本清 2010.08.27,SPSS中的聚类分析,Spss中的聚类功能常用的有两种:快速聚类(迭代过程):K-Means Cluster系统聚类:Hierarchical Cluster,毛本清 2010.08.27,一、Hierarchical Cluster聚类,系统聚类由两种方法:分解法和凝聚法。系统聚类的功能:即可进行样品的聚类,也可进行变量的聚类。系统聚类的原理:即我们前面介绍过的系统聚类方法的原理和过程。,毛本清 2010.08.27,系统聚类的中要进行以下的选择:数据的标准化测度方法的选择:距离方法的选择或相似性、关联程度的选择。聚类方法的选择:即以什么方法聚类,spss中提供了7中方法可进行选择。输出图形的选择:树形图或冰柱图。,毛本清 2010.08.27,系统聚类,毛本清 2010.08.27,见(一)聚类方法,见(二)各种距离和相似系数,毛本清 2010.08.27,Method,聚类方法,标准化变换,亲疏关系指标,毛本清 2010.08.27,(一)聚类方法1.Between-groups linkage 类间平均法 两类距离为两类元素两两之间平均平方距离2.Within-groups linkage 类内平均法两类距离为合并后类中可能元素两两之间平均平方距离3.Nearest neighbor 最短距离法 4.Furthest neighbor 最长距离法5.Centroid clustering 重心法(欧式距离)6.Median clustering 中间距离法(欧式距离)7.Ward Method 离差平方法(欧式距离),毛本清 2010.08.27,1.squared euclidean distance 平方欧式距离2.euclidean distance 欧式距离3.cosine 夹角余弦(R型)4.pearson correlation 皮尔逊相关系数(R)5.chebychev 切比雪夫距离,(二)各种距离和相似系数(亲疏关系指标),毛本清 2010.08.27,6.block 绝对值距离7.minkowski 明考斯基8.customized,毛本清 2010.08.27,毛本清 2010.08.27,Statistics,聚类进度表,相似矩阵,样品或变量的分类情况,毛本清 2010.08.27,毛本清 2010.08.27,凝聚状态表的第一列表示聚类分析的第几步;第二列、第三列表示本步聚类中哪两个样本或小类聚成一类;第四列是相应的样本距离或小类距离;第五列、第六列表明本步聚类中,参与聚类的是样本还是小类。0表示样本,数字n(非0)表示由第n步聚类产生的小类参与本步聚类;第七列表示本步聚类的结果将在下面聚类的第几步中用到。,毛本清 2010.08.27,毛本清 2010.08.27,Plot,树状结构图,冰柱图,冰柱的方向,毛本清 2010.08.27,Vertical Icicle,67,毛本清 2010.08.27,冰柱图因其样子非常象冬天房顶垂下的冰柱得名,它以图形的方式显示层次聚类分析结果,一般从冰柱图的最后一行开始观察,第一列表示类数。两样品之间的“”表示将其两边的样品(类)联结起来聚成新类。,毛本清 2010.08.27,毛本清 2010.08.27,应用举例:,4-1,毛本清 2010.08.27,首先对表4-1中的原始数据进行标准化变换处理,经过运算使数据标准化得到表4-2,使它的每列数据的平均值为0,方差为1,这样表4-1中5列具有不同量纲、不同数量级的数据,不同地区数据求出欧氏距离。,就能放在一起比较;其次用表4-2中经过标准化处理后的30个,毛本清 2010.08.27,毛本清 2010.08.27,毛本清 2010.08.27,表4-1,毛本清 2010.08.27,毛本清 2010.08.27,表 4-2,毛本清 2010.08.27,毛本清 2010.08.27,毛本清 2010.08.27,K-Means Cluster聚类,毛本清 2010.08.27,K-Means Cluster原理,首先,选择n个数值型变量参与聚类分析,最后要求的聚类数为k个;其次,由系统选择k个(聚类的类数)观测量(也可由用户指定)作为聚类的种子。第三,按照距离这些类中心的距离最小的原则把所有观测量(样品)分派到各类重心所在的类中去。第四,这样每类中可能由若干个样品,计算每个类中各个变量的均值,以此作为第二次迭代的中心;第五,然后根据这个中心重复第三、第四步,直到中心的迭代标准达到要求时,聚类过程结束。,毛本清 2010.08.27,K-Means Cluster聚类过程,由AnalyzeClassify K-Means Cluster将个变量放入Variable;输入最后聚类的个数;,毛本清 2010.08.27,例 饮料数据(spssex/drink.sav),16种饮料的热量、咖啡因、钠及价格四种变量,毛本清 2010.08.27,快速聚类,毛本清 2010.08.27,选项,读写凝聚点,人为固定分类数,ANOVA表,初始凝聚点等,毛本清 2010.08.27,快速聚类法的聚类数由用户指定,分类是唯一的。1.分类数:如希望聚成K类2.聚类方法:method:iterate and clussify(聚类分析的 clussify only(聚类分析过程类中心3.聚类中心:centers4.迭代次数:iterate5.保存分类结果:save,每一步都重新计算新的类中心点),点始终为初始类中心点,仅作一次迭代),毛本清 2010.08.27,Initial Cluster Center:快速聚类的初始类中心点(本例由系统自行指定四个类的初始类中心点),指定聚成四类,毛本清 2010.08.27,Iteration History:快速聚类的迭代步骤 在迭代过程中,完成第一次迭代后形成的四个新类中心点距初始类中心点的欧氏距离分别为5.065、12.532、12.275、25.901。第四次迭代后形成的四个新类中心点几乎与上次确定的中心点没有差别。经过四次迭代,快速聚类完成。,毛本清 2010.08.27,快速聚类的最终类中心点,毛本清 2010.08.27,Number of Cases in each Cluster:快速聚类的最终结果,快速聚类的类成员情况,各样本距其所在的类中心的欧氏距离,各类中的成员数,毛本清 2010.08.27,

    注意事项

    本文(做聚类分析.ppt)为本站会员(sccc)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开