聚类分析clusteranaly.ppt
《聚类分析clusteranaly.ppt》由会员分享,可在线阅读,更多相关《聚类分析clusteranaly.ppt(44页珍藏版)》请在三一办公上搜索。
1、统计本科应用多元分析教学,Cluster Analysis,聚类分析(第2部分),第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,(二)最长距离法(complete linkage,furthest neighbor),B2A2*B1 A1*B3*,样品间:欧氏距离类类间:两类间样品两两距离最长。即图中样品A2
2、和B3之间的距离,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,(三)中间距离法(median method),最长距离夸大了类间距离,最短距离低估了类间距离。介于两者间的距离即为中间距离,K,L,J,M,第四军医大学卫生统计学教研室,2002年11月,(四)中间距离法的变形可变法,第四军医大学卫生统计学教研室,2002年11月,(五)类平均法(avera
3、ge linkage between group),SPSS作为默认方法,称为 between-groups linkage,K,L,J,M,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,(六)可变类平均法(flexible-beta method),类平均法的变型,K,L,J,M,第四军医大学卫生统计学教研室,2002年11月,(七)重心法(centroid method),B2A2*B1 A1*B3*,类类间的距离用各自重心间的距离表示,第四军医大学卫生统计学教研室,2002年11月,(八)Ward最小方差法(Ward minimum va
4、riance method),先将n个样品各自成一类,然后每次每缩小一类,每缩小一类离差平方和就要增加,选择使离差平方和增加(SSMSSKSSL)最小的两类合并,直至所有的样品归为一类为止。,第四军医大学卫生统计学教研室,2002年11月,第四军医大学卫生统计学教研室,2002年11月,(九)八种系统聚类方法的统一,以上聚类方法的计算步骤完全相同,仅类与类之间的定义不同。Lance和Williams于1967年将其统一为:,第四军医大学卫生统计学教研室,2002年11月,八种系统聚类法公式的参数,第四军医大学卫生统计学教研室,2002年11月,系统聚类法的性质,单调性 中间距离法、重心法不具有
5、单调性空间的浓缩与扩张 不同聚类法作图,横坐标的范围可相差很大。最短距离法与重心法比较浓缩;可变类平均比较扩张;类平均法比较适中。,第四军医大学卫生统计学教研室,2002年11月,有关问题,几种聚类方法获得的结果不一定相同 指标聚类采用相似系数,相似系数大或距离小则表示类间关系密切,为了统一,可采用以下公式变换。,第四军医大学卫生统计学教研室,2002年11月,五、快速聚类法(quick cluster method k-means model)也叫动态聚类、逐步聚类、迭代聚类),样本量很大,用系统聚类法计算的工作量极大,作出的树状图也十分复杂,不便于分析,第四军医大学卫生统计学教研室,200
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 聚类分析 clusteranaly
链接地址:https://www.31ppt.com/p-6338152.html