SPSS数据分析教程-10聚类分析.ppt
《SPSS数据分析教程-10聚类分析.ppt》由会员分享,可在线阅读,更多相关《SPSS数据分析教程-10聚类分析.ppt(47页珍藏版)》请在三一办公上搜索。
1、SPSS数据分析教程,SPSS数据分析教程,第10章聚类分析,目录,10.1聚类分析简介10.2个案间的距离定距数据(Scale Mearsurement)距离定义方式分类数据的频数数据(Count)二分类数据10.3类之间的距离10.4系统聚类算法过程10.5系统聚类案例10.6K-均值聚类K-均值法简介K-均值法案例10.7两步法聚类两步法简介两步法案例分析10.8聚类分析注意事项,本章学习目标,理解聚类分析的基本概念;了解个案之间距离的定义方式;了解类之间距离的定义方式;掌握系统聚类方法;掌握两步法聚类方法;掌握K均值聚类方法。,10.1 聚类分析简介,根据对象的某些属性把它们分到一些组
2、中,使得同组内的对象尽可能地相似,不同组中的对象尽可能地不一样,即所谓的聚类分析。聚类分析方法被称为“无监督的分析方法”,意即没有因变量。而另外一种分类的方法是判别分析,它是把样本归入到已知的事先已经确定下来的类中去,它有因变量(即事先确定的类别),是“有监督的分析方法”。,聚类分析不必事先知道分类对象的结构,从一批样品的多个观测指标中,找出能度量样品之间或指标(变量)之间相似程度或亲疏关系的统计量,构成一个对称相似性矩阵,并按相似程度的大小,把样品或变量逐一归类。根据对样品聚类还是对变量聚类,聚类分析分Q型聚类和R型聚类。对变量的聚类称为R型聚类,而对样品(即观测值)聚类称为Q型聚类。通俗讲
3、,R型聚类是对数据中的列分类,Q型聚类是对数据中的行分类。,SPSS Statistics提供了3种聚类方法,它们是系统聚类法(又称层次聚类)、K-均值聚类(又称快速聚类法)和两步法聚类。,10.2 个案间的距离,定距数据距离定义方式欧式(Euclidean)距离 平方欧式距离 余弦距离 皮尔逊(Pearson)相关性距离 切比雪夫(Chebychev)距离 块(Block)距离 闵考斯基(Minkowski)距离 幂(Power)距离,10.2.2 分类数据之间的距离,卡方度量 Phi方度量,10.3 类之间的距离,SPSS提供了7种计算两个类距离的方法。组间连接法(Between-grou
4、ps Linkage)组内连接法(Within-Groups Linkage)最近邻元素法(Nearest Neighbor)最长距离法(Furthest Neighbor)质心聚类法(Centroid Clustering)中位数聚类法(Median Clustering)离差平方和法(Wards Method),10.4 系统聚类算法过程,系统聚类的步骤,第1步:数据标准化。把原始数据标准化得到标准化数据矩阵。第2步:计算相似系数矩阵。这里以余弦距离为例。计算Q型聚类任意两个样品xj和xk的相似系数矩阵。,第3步:选出有最大相似系数的样品组。第4步:把该组样品加权平均,这样就形成了一个新的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 数据 分析 教程 10 聚类分析
链接地址:https://www.31ppt.com/p-6520369.html