全国21个城市社会经济发展指标的聚类分析.ppt
全国21个城市社会经济发展指标的聚类分析,100830108 谢昊喆,2007年全国21个城市社会经济发展的相关指标资料来源:数据来源于中经统计网,要对表中的21个城市按照5个指标变量进行聚类,首先要解决的问题就是要将其分为几类。在对分类的个数没有明确根据时,系统聚类可以给我们提供一个客观的依据。所以在此先对表中数据进行层次聚类,最终得到聚类的树状图,如下图所示:,从层次聚类的树状图来看,可以将全国21个城市氛围三个大类,参考这个树形图,将21个城市用两步聚类分为三类,得到最终的聚类中心和聚类结果如下图所示:,通过聚类将全国21个城市分成了三个大类,接下来我们要考虑的是这三个类别的城市在各个指标上是否存在显著差异,为此以城市为自变量,以其他各项指标为因变量做方差分析,得到如图所示的结果:,表中结果显示,在显著性水平为0.1的前提下,人均地区生产总值、职工平均工资和人均绿地面积这三个变量是显著的,三个不同类别城市的主要差别主要在这三个指标上。,为了更直观的分析各个类别城市的特点,计算各个类别城市在各项指标上的均值,如下图所示:,从图中可以看出,这三类城市在每万人拥有公共汽电车的辆数、人均公共图书馆藏书的册数和职工的平均工资这三个方面相差不大,而在人均地区生产总值和人均绿地面积上有明显差别,这两个指标称为区分这三类城市的主要指标。,为了印证前面的结论,根据上图得出雷达图如下:,注:图中各指标的数据单位是:人均地区生产总值(万元)、每万人拥有公共汽电车(10辆)、人均公共图书馆藏书(册)、职工平均工资(万元)、人均绿地面积(10平方米/人)。,因此,就得出结论,三个类别的城市在人均地区生产总值和人均绿地面积两个指标上存在显著差异。,因此,得出结论如下第一类城市:北京、天津、沈阳、大连、上海、南京、杭州、厦门、济南。这些城市除人均绿地面积之外,其他各项指标均处于一个相对较高的水平,高于总体水平或者与总体水平齐平。而其人均绿地面积却低于平均水平,说明绿化是这些城市一个相对薄弱的方面。第二类城市:长春、哈尔滨、武汉、重庆、成都、西安。各项指标均比较落后,需要全面发展。第三类城市:无锡、苏州、宁波、青岛、广州、深圳。各项发展指标均相对较好,尤其是在人均生产总值和人均绿化面积两个方面,其指标值明显高于总体平均水平。,谢谢观赏!,