系统聚类分析ppt课件.ppt
《系统聚类分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《系统聚类分析ppt课件.ppt(47页珍藏版)》请在三一办公上搜索。
1、第4节 系统聚类分析,聚类要素的数据处理距离的计算直接聚类法 最短距离聚类法 最远距离聚类法系统聚类法计算类之间距离的统一公式系统聚类分析实例,一、聚类要素的数据处理,在聚类分析中,聚类要素的选择是十分重要的,它直接影响分类结果的准确性和可靠性。 在地理分类和分区研究中,被聚类的对象常常是多个要素构成的。不同要素的数据往往具有不同的单位和量纲,其数值的变异可能是很大的,这就会对分类结果产生影响。因此当分类要素的对象确定之后,在进行聚类分析之前,首先要对聚类要素进行数据处理。,假设有m 个聚类的对象,每一个聚类对象都有n个要素构成。它们所对应的要素数据可用表3.4.1给出。,表3.4.1 聚类对
2、象与要素数据,在聚类分析中,常用的聚类要素的数据处理方法有如下几种:, 总和标准化。分别求出各聚类要素所对应的数据的总和,以各要素的数据除以该要素的数据的总和,即 这种标准化方法所得到的新数据满足,(3.4.1), 标准差标准化,即 由这种标准化方法所得到的新数据,各要素的平均值为0,标准差为1,即有,(3.4.2), 极大值标准化,即 经过这种标准化所得的新数据,各要素的极大值为1,其余各数值小于1。 极差的标准化,即 经过这种标准化所得的新数据,各要素的极大值为1,极小值为0,其余的数值均在0与1之间。,(3.4.3),(3.4.4),例题:表3.4.2给出了某地区9个农业区的7项指标,它
3、们经过极差标准化处理后,如表3.4.3所示。,表3.4.2 某地区9个农业区的7项经济指标数据,表3.4.3 极差标准化处理后的数据,二、距离的计算,常见的距离有 绝对值距离 欧氏距离 明科夫斯基距离,(3.4.5),(3.4.6),(3.4.7), 切比雪夫距离。当明科夫斯基距 时,有 据表3.4.3中的数据,用公式(3.4.5)式计算可得9个农业区之间的绝对值距离矩阵如下,(3.4.8),(3.4.9),三、直接聚类法,原理 先把各个分类对象单独视为一类,然后根据距离最小的原则,依次选出一对分类对象,并成新类。如果其中一个分类对象已归于一类,则把另一个也归入该类;如果一对分类对象正好属于已
4、归的两类,则把这两类并为一类。每一次归并,都划去该对象所在的列与列序相同的行。经过m-1次就可以把全部分类对象归为一类,这样就可以根据归并的先后顺序作出聚类谱系图。,例题:根据距离矩阵式(3.4.9),用直接聚类法对某地区的9个农业区进行聚类分析,步骤如下: (1)在距离矩阵D中,除去对角线元素以外,d49=d94=0.51为最小者,故将第4区与第9区并为一类,划去第9行和第9列; (2)在余下的元素中,除对角线元素以外,d75= d57=0.83为最小者,故将第5区与第7区并为一类,划掉第7行和第7列;,(3)在第2步之后余下的元素之中,除对角线元素以外,d82= d28=0.88为最小者,
5、故将第2区与第8区并为一类,划去第8行和第8列;,(4)在第3步之后余下的元素中,除对角线元素以外,d43= d34=1.23为最小者,故将第3区与第4区并为一类,划去第4行和第4列,此时,第3、4、9区已归并为一类;,(5)在第4步之后余下的元素中,除对角线元素以外,d21= d12=1.52为最小者,故将第1区与第2区并为一类,划去第2行和第2列,此时,第1、2、8区已归并为一类; (6)在第5步之后余下的元素中,除对角线元素以外,d65= d56=1.78为最小者,故将第5区与第6区并为一类,划去第6行和第6列,此时,第5、6、7区已归并为一类;,(7)在第6步之后余下的元素中,除对角线
6、元素以外,d31= d13=3.10为最小者,故将第1区与第3区并为一类,划去第3行和第3列,此时,第1、2、3、4、8、9区已归并为一类; (8) 在第7步之后余下的元素中,除去对角线元素以外,只有d51= d15=5.86,故将第1区与第5区并为一类,划去第5行和第5列,此时,第1、2、3、4、5、6、7、8、9区均归并为一类。 根据上述步骤,可以作出聚类过程的谱系图3.4.1。,图3.4.1 直接聚类谱系图,四、最短距离聚类法,原理 最短距离聚类法,是在原来的mm距离矩阵的非对角元素中找出 ,把分类对象Gp和Gq归并为一新类Gr,然后按计算公式 计算原来各类与新类之间的距离,这样就得到一
7、个新的(m1)阶的距离矩阵; 再从新的距离矩阵中选出最小者dij,把Gi和Gj归并成新类;再计算各类与新类的距离,这样一直下去,直至各分类对象被归为一类为止。,(3.4.10),例题:以下根据式(3.4.9)中的距离矩阵,用最短距离聚类法对某地区的9个农业区进行聚类分析。,(1) 在99阶距离矩阵D中,非对角元素中最小者是d94=0.51,首先将第4区与第9区并为一类,记为G10=G4,G9。按照公式(3.4.10)式分别计算G1,G2,G3,G5,G6,G7,G8与G10之间的距离得 d1,10=mind14,d19= min2.19,2.62=2.19d2,10=mind24,d29= m
8、in1.47,1.66=1.47d3,10=mind34,d39= min1.23,1.20=1.20,d5,10=mind54,d59= min4.77,4.84=4.77d6,10=mind64,d69= min2.99,3.06=2.99d7,10=mind74,d79= min4.06,3.32=3.32d8,10=mind84,d89= min1.29,1.40=1.29 (2)这样就得到G1,G2,G3,G5,G6,G7,G8,G10上的一个新的88阶距离矩阵,(3)在上一步骤中所得到的88阶距离矩阵中,非对角元素中最小者为d57=0.83,故将G5与G7归并为一类,记为G11,即
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 系统 聚类分析 ppt 课件
链接地址:https://www.31ppt.com/p-1901053.html