基于SPSS的多元统计分析报告.ppt
部分省会城市和计划单列市,主要经济指标的多元统计分析,小组成员:崔媛、孔燕华、黄睿、邱明、谷红蕊、李亮报告人:崔媛 时间:2009年12月16号,研究目的:.探究青岛市、广州市、太原市的城市生活水平及其在全国省会及计划单列市的城市生活水平中的位置,研究方法:因子分析、聚类分析、判别分析资料来源:统计年鉴,摘要,为研究青岛市、广州市和太原市在全国省会城市和计划单列市的城市生活水平中的位置,我们以统计年鉴(2007年)中省会城市及计划单列市主要经济指标为基础,随机剔除5个样本后,首先对剩余样本进行因子分析做降维处理,利用特征向量实现原指标值向几个主要指标的转换;然后将除青岛市、广州市和太原市之外的城市利用Ward法进行聚类分析,将指标分成3类,最后利用判别分析实现这三个城市生活水平的判别。关键词 城市生活水平 因子分析 聚类分析 判别分析,原始数据如下:,从上面的数据,我们可以看到统计的指标很多,不便于分析做 出指标的相关系数矩阵进一步观察如下:,因此,我们可以利用因子分析将相关性很大的指标综合为数量较少的几个因子,利用spss软件实现,其中各输出及统计量等的选择如下:描述 统计量:单变量描述性、原始分析结果 相关阵:系数、KMO和Bartlett的球形检验抽取 方法:主成分 分析:相关性矩阵 输出:未旋转的因子解 抽取:因子的固定数量3旋转 方法:最大方差法 输出:旋转解、载荷图得分 保存为变量:回归 显示因子得分系数矩阵缺失值 使用均值替换结果如下:,各个变量的数字特征描述如下:,相关矩阵年底总人数地区生产总值客运量货运量固定资产投资总额城乡居民储蓄在岗职工平均工资邮局数社会商品零售总额货物进出口总额剧场影剧院数高校学生人数医院卫生院个数环境污染治理投资总额相关年底总人数1.000.459.870.670.692.484.000.928.530.140.466.471.854.386地区生产总值.4591.000.307.756.895.964.671.505.975.890.775.392.306.742客运量.870.3071.000.522.532.275-.013.896.354.078.230.303.733.145货运量.670.756.5221.000.806.689.336.599.718.514.517.385.467.824固定资产投资总额.692.895.532.8061.000.893.498.639.924.625.741.568.514.679城乡居民储蓄.484.964.275.689.8931.000.669.509.979.825.813.435.393.705在岗职工平均工资.000.671-.013.336.498.6691.000.098.625.726.526.042.119.524邮局数.928.505.896.599.639.509.0981.000.541.312.445.284.845.290社会商品零售总额.530.975.354.718.924.979.625.5411.000.805.820.523.378.682货物进出口总额.140.890.078.514.625.825.726.312.8051.000.627.090.059.592剧场影剧院数.466.775.230.517.741.813.526.445.820.6271.000.360.376.538高校学生人数.471.392.303.385.568.435.042.284.523.090.3601.000.241.314医院卫生院个数.854.306.733.467.514.393.119.845.378.059.376.2411.000.242环境污染治理投资总额.386.742.145.824.679.705.524.290.682.592.538.314.2421.000,可以看出KMO值达到了0.748 0.5 通过了检验,可见:特征值的累计贡献率已前三个达到85.745%。,所以取前三个特征值所对应的特征向量如下:,旋转前的成分矩阵如下:,这样并不好清晰地把各变量归并重新命名,旋转后的成分矩阵如下:,针对原始变量的更直观变量的因子分析结果如下图:,由成分转换矩阵可见,每个因子只有少数几个指标的因子载荷较大,因此可据上表进行分类,将14个指标按高载荷分成三类,列于下表:,另外,我们还得到了碎石图如下:,这样,通过因子分析,我们将14个有相关关系的指标用三个主成分进行重新解释特征向量如下:,则可以用主成分表示如下:,F1=0.2537X1+.03255X2+0.2586X14F2=0.4005X1-0.1906X2+-0.1696X14F3=0.0236X1-0.019X2+0.1248X14,这样,我们把原来14个指标转换成了3个成分,现在对指标进行聚类分析利用离差平方合法(Ward)法进行聚类分析,结果如下:,冰柱图:,树状图:,新变量的数字特征:,从上面的树状图可以很清楚的将31个城市样本分成3类,接下来,针对处理后的数据做判别分析结果如下,判别分析的结果:(分2页显示),广州,青岛,太原,这样,我们实现了对青岛市、广州市和太原市的分类。,其中:青岛市城市生活水平和大部分东部地区较发达城市相当太原市归属于中西部地区城市而广州市发展水平已经达到北京上海深圳这样经济发达的少数几个城市的水平,谢谢大家,