欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    现代统计分析方法与应用(第12章)课件.ppt

    • 资源ID:1594035       资源大小:1.43MB        全文页数:77页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    现代统计分析方法与应用(第12章)课件.ppt

    2022/12/9,中国人民大学六西格玛质量管理研究中心,1,第十二章 主成分分析,目录 上页 下页 返回 结束,12.1 主成分分析的基本思想,12.2 主成分分析的几何意义,12.3 总体主成分及其性质,12.4 样本主成分的导出,12.5 主成分分析步骤及框图,12.6 主成分分析的应用,2022/12/9,中国人民大学六西格玛质量管理研究中心,2,第十二章 主成分分析,目录 上页 下页 返回 结束,主成分分析(principal components analysis)也称主分量分析,是由Hotelling于1933年首先提出的。主成分分析是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法。通常把转化生成的综合指标称之为主成分,其中每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,这就使得主成分比原始变量具有某些更优越的性能。这样在研究复杂问题时就可以只考虑少数几个主成分而不至于损失太多信息,从而更容易抓住主要矛盾,揭示事物内部变量之间的规律性,同时使问题得到简化,提高分析效率。本章主要介绍主成分分析的基本理论和方法、主成分分析的计算步骤及主成分分析的上机实现。,2022/12/9,中国人民大学六西格玛质量管理研究中心,3,12.1 主成分分析的基本思想,目录 上页 下页 返回 结束,一、主成分分析的基本思想 在对某一事物进行实证研究中,为了更全面、准确地反映出事物的特征及其发展规律,人们往往要考虑与其有关系的多个指标,这些指标在多元统计中也称为变量。这样就产生了如下问题:一方面人们为了避免遗漏重要的信息而考虑尽可能多的指标,而另一方面随着考虑指标的增多增加了问题的复杂性,同时由于各指标均是对同一事物的反映,不可避免地造成信息的大量重叠,这种信息的重叠有时甚至会抹杀事物的真正特征与内在规律。基于上述问题,人们就希望在定量研究中涉及的变量较少,而得到的信息量又较多。主成分分析正是研究如何通过原来变量的少数几个线性组合来解释原来变量绝大多数信息的一种多元统计方法。,2022/12/9,中国人民大学六西格玛质量管理研究中心,4,12.1 主成分分析的基本思想,目录 上页 下页 返回 结束,既然研究某一问题涉及的众多变量之间有一定的相关性,就必然存在着起支配作用的共同因素,根据这一点,通过对原始变量相关矩阵或协方差矩阵内部结构关系的研究,利用原始变量的线性组合形成几个综合指标(主成分),在保留原始变量主要信息的前提下起到降维与简化问题的作用,使得在研究复杂问题时更容易抓住主要矛盾。一般地说,利用主成分分析得到的主成分与原始变量之间有如下基本关系: 1.每一个主成分都是各原始变量的线性组合; 2.主成分的数目大大少于原始变量的数目 3.主成分保留了原始变量绝大多数信息 4.各主成分之间互不相关 通过主成分分析,可以从事物之间错综复杂的关系中找出一些主要成分,从而能有效利用大量统计数据进行定量分析,揭示变量之间的内在关系,得到对事物特征及其发展规律的一些深层次的启发,把研究工作引向深入。,2022/12/9,中国人民大学六西格玛质量管理研究中心,5,12.1 主成分分析的基本思想,目录 上页 下页 返回 结束,二、主成分分析的基本理论,2022/12/9,中国人民大学六西格玛质量管理研究中心,6,12.1 主成分分析的基本思想,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,7,12.1 主成分分析的基本思想,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,8,12.2 主成分分析的几何意义,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,9,12.2 主成分分析的意义,目录 上页 下页 返回 结束,图12-1,2022/12/9,中国人民大学六西格玛质量管理研究中心,10,12.2 主成分分析的意义,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,11,12.2 主成分分析的意义,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,12,12.2 主成分分析的意义,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,13,12.2 主成分分析的意义,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,14,12.2 主成分分析的意义,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,15,12.2 主成分分析的意义,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,16,12.2 主成分分析的意义,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,17,12.2 主成分分析的意义,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,18,12.3 总体主成分及其性质,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,19,12.3 总体主成分及其性质,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,20,12.3 总体主成分及其性质,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,21,12.3 总体主成分及其性质,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,22,12.3 总体主成分及其性质,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,23,12.3 总体主成分及其性质,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,24,12.3 总体主成分及其性质,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,25,12.3 总体主成分及其性质,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,26,12.3 总体主成分及其性质,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,27,12.3 总体主成分及其性质,目录 上页 下页 返回 结束,由上图可知,第二个及第三个特征值变化的趋势已经开始趋于平稳,所以,取前两个或是前三个主成分是比较合适的。这种方法确定的主成分个数与按累积贡献率确定的主成分个数往往是一致的。在实际应用中有些研究工作者习惯于保留特征值大于1的那些主成分,但这种方法缺乏完善的理论支持。在大多数情况下,当m=3时即可使所选主成分保持信息总量的比重达到85以上。,2022/12/9,中国人民大学六西格玛质量管理研究中心,28,12.3 总体主成分及其性质,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,29,12.3 总体主成分及其性质,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,30,12.3 总体主成分及其性质,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,31,12.3 总体主成分及其性质,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,32,12.3 总体主成分及其性质,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,33,12.3 总体主成分及其性质,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,34,12.3 总体主成分及其性质,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,35,12.4 样本主成分的导出,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,36,12.4 样本主成分的导出,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,37,12.4 样本主成分的导出,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,38,12.4 样本主成分的导出,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,39,12.4 样本主成分的导出,目录 上页 下页 返回 结束,为了得到上面齐次方程的非零解,,2022/12/9,中国人民大学六西格玛质量管理研究中心,40,12.4 样本主成分的导出,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,41,12.4 样本主成分的导出,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,42,12.5 主成分分析步骤及框图,目录 上页 下页 返回 结束,一、主成分分析步骤 由上面讨论大体上已经可以明了进行主成分分析的步骤,我们对此进行归纳如下: 1.根据研究问题选取初始分析变量; 2.根据初始变量特性判断由协方差阵求主成分还是由相关阵求主成分; 3.求协差阵或相关阵的特征根与相应标准特征向量; 4.判断是否存在明显的多重共线性,若存在,则回到第一步; 5.得到主成分的表达式并确定主成分个数,选取主成分; 6.结合主成分对研究问题进行分析并深入研究。,2022/12/9,中国人民大学六西格玛质量管理研究中心,43,12.5 主成分分析步骤及框图,目录 上页 下页 返回 结束,二、主成分分析的逻辑框图,图12-4主成分分析逻辑框图,2022/12/9,中国人民大学六西格玛质量管理研究中心,44,12.6 主成分分析的应用,目录 上页 下页 返回 结束,SPSS软件FACTOR模块提供了主成分分析的功能。例12.1 在企业经济效益的评价中,设计的指标往往很多。为了简化系统结构,抓住经济效益评价中的主要问题,我们可由原始数据矩阵出发求主成分。在对我国部分省、市、自治区独立核算的工业企业的经济效益评价中,涉及到9项指标,原始数据见表12-1,即样品数n=28,变量数p=9。,2022/12/9,中国人民大学六西格玛质量管理研究中心,45,12.6 主成分分析的应用,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,46,12.6 主成分分析的应用,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,47,12.6 主成分分析的应用,目录 上页 下页 返回 结束,首先标准化原始数据,标准化后的数据见表12-2,2022/12/9,中国人民大学六西格玛质量管理研究中心,48,12.6 主成分分析的应用,目录 上页 下页 返回 结束,将表12-2 数据导入spss软件,依次点选Analyze-Data Reduction-Factor进入Factor Analysis对话框。(在spss中,主成分分析与因子分析均在Factor Analysis模块中完成。)如图所示:,2022/12/9,中国人民大学六西格玛质量管理研究中心,49,12.6 主成分分析的应用,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,50,12.6 主成分分析的应用,目录 上页 下页 返回 结束,此时,数据集12-2.sav中的变量名均显示在对话框左边的窗口中,选择变量x1,x2,x3,x4,x5,x6,x7,x8,x9进入variables窗口中,操作如下图所示:,2022/12/9,中国人民大学六西格玛质量管理研究中心,51,12.6 主成分分析的应用,目录 上页 下页 返回 结束,点击descriptives按钮,在弹出的对话框中,在correlation matrix中选择coefficients 。回到原对话框点击右侧的ok,即可得到输出结果表12-3 、12-4。,2022/12/9,中国人民大学六西格玛质量管理研究中心,52,12.6 主成分分析的应用,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,53,12.6 主成分分析的应用,目录 上页 下页 返回 结束,由表12-3我们看到前面2个主成分,的方差和占全部方差的比例为84.7%。我们就选取为第一主成分,为第二主成分,且这两个主成分之方差和占全部方差的91.6%,即基本上保留了原来指标的信息,这样由原来的9个指标转化为2个新指标,起到了降维的作用。,2022/12/9,中国人民大学六西格玛质量管理研究中心,54,12.6 主成分分析的应用,目录 上页 下页 返回 结束,Spss软件得到主成分系数矩阵如下:,2022/12/9,中国人民大学六西格玛质量管理研究中心,55,12.6 主成分分析的应用,目录 上页 下页 返回 结束,(12.11),对所选主成分作经济解释。主成分分析的关键在于能否给主成分赋予新的意义,给出合理的解释,这个解释应根据主成分的计算结果结合定性分析来进行。主成分是原来变量的线性组合,在这个线性组合中,各变量的系数有大有小,有正有负,有的大小相当,因而不能简单地认为这个主成分是某个原变量的属性的作用。线性组合中个变量的系数的绝对值大者表明该主成分主要综合了绝对值大的变量,有几个变量系数大小相当时,应认为这一主成分是这几个变量的总和,这几个变量综合在一起应赋予怎样的经济意义,要结合经济专业知识,给出恰如其分的解释,才能达到深刻分析经济成因的目的。,2022/12/9,中国人民大学六西格玛质量管理研究中心,56,12.6 主成分分析的应用,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,57,12.6 主成分分析的应用,目录 上页 下页 返回 结束,通常为了分析各样品在主成分所反映的经济意义方面的情况,还将标准化后的原始数据带入主成分表达式计算出各样品的主成分得分,由各样品的主成分得分(当主成分个数为2时)就可在二维空间中描出各样品的分布情况。 将表12-2数据代入式(12.11)式,得到28个省、市、自治区的主成分得分,见表12-5。将这28各样品在平面直角坐标系上描出来,进而可进行样品分类。主成分得分图见图12-5。,2022/12/9,中国人民大学六西格玛质量管理研究中心,58,12.6 主成分分析的应用,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,59,12.6 主成分分析的应用,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,60,12.6 主成分分析的应用,目录 上页 下页 返回 结束,由图12-5可看出,分布在第一象限的是上海、北京、天津、广西这4个省,这四个省、市、自治区的经济效益在全国来说属于比较好的,其中上海的经济效益最好。分布在第四象限的江苏、浙江、安徽、福建、山东、湖北、广东七个省、市、自治区。因为第四象限的主要特征是第一主成分,第一主成分占信息总量的比重最大,所以这七个省的经济效益也算比较好。分布在第二象限和第三象限的地区可属同一类,经济效益较差。 主成分得分操作:在Factor Analysis主对话框,点击下方的Scores按钮,进入Factor Scores对话框,选中save as variables复选框,点击continue。系统默认用回归方法求得因子得分。,2022/12/9,中国人民大学六西格玛质量管理研究中心,61,12.6 主成分分析的应用,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,62,12.6 主成分分析的应用,目录 上页 下页 返回 结束,例122全国重点水泥企业经济效益综合评价例。 利用主成分综合评价全国重点水泥企业的经济效益。原始数据(数据来自1984年中国统计年鉴)见表12-6,2022/12/9,中国人民大学六西格玛质量管理研究中心,63,12.6 主成分分析的应用,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,64,12.6 主成分分析的应用,目录 上页 下页 返回 结束,经标准化后的数据取名为“重点水泥厂”。,2022/12/9,中国人民大学六西格玛质量管理研究中心,65,12.6 主成分分析的应用,目录 上页 下页 返回 结束,导入spss中计算出其相关阵R如下:,2022/12/9,中国人民大学六西格玛质量管理研究中心,66,12.6 主成分分析的应用,目录 上页 下页 返回 结束,在确定主成分个数之前,与例12.1相同的spss操作,得出软件输出结果如下:,2022/12/9,中国人民大学六西格玛质量管理研究中心,67,12.6 主成分分析的应用,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,68,12.6 主成分分析的应用,目录 上页 下页 返回 结束,从上表及上图可看出,前3个主成分解释了全部方差的87.085%,也即包含了原始数据的信息总量达到了87.085%,这说明前三个主成分代表原来的8个指标评价企业的经济效益已经有足够的把握。设这3个主成分分别用,来表示,按照例12.1操作,只不过在点击extraction按钮时,在number of factors中填写3,即可得到相关矩阵的前三个特征根的特征向量,结果如下:,2022/12/9,中国人民大学六西格玛质量管理研究中心,69,12.6 主成分分析的应用,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,70,12.6 主成分分析的应用,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,71,12.6 主成分分析的应用,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,72,12.6 主成分分析的应用,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,73,12.6 主成分分析的应用,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,74,12.6 主成分分析的应用,目录 上页 下页 返回 结束,表12-7,2022/12/9,中国人民大学六西格玛质量管理研究中心,75,12.6 主成分分析的应用,目录 上页 下页 返回 结束,在表12-7的经济效益得分中,有许多企业的得分是负数,但并不是企业的经济效益就为负。这里的正负仅表示该企业与平均水平的位置关系,企业的经济效益的平均水平算作零点,这是我们在整个过程中将数据标准化的结果。 从表12-7可看到,湘乡水泥厂的综合经济效益最好,是第一名;华新水泥厂的综合经济效益为第二名;,峨嵋水泥厂的综合经济效益最差。从影响企业经济效益的三个主要因子的得分看,峨嵋水泥厂不管在企业盈利能力、资金和人力利用及产能消耗方面,都处于最差地位,,2022/12/9,中国人民大学六西格玛质量管理研究中心,76,12.6 主成分分析的应用,目录 上页 下页 返回 结束,因此,他们反映出峨嵋水泥厂在盈利能力方面缺乏活力,资金和人力利用率也不高,产值能耗也相对较高。企业要改变落后的状况,只能改进各项工作,提高经济效益。华新水泥厂的盈利能力最强,但这个厂的资金和人力利用效率最差,这似乎是个矛盾。有的管理者认为只要企业盈利就一好百好,因而忽视企业的资金周转,不注重提高劳动生产率。然而,这种经济效益好、盈利能力强可能是由于企业具有得天独厚的优越条件。华新水泥厂若能正视自己,努力加快资金周转,进一步提高劳动生产率,保持自己强有力的盈利能力,该厂的经济效益从而会更好,将会立足于全国重点水泥厂的最前列。,The end!Thanks!,2022/12/9,中国人民大学六西格玛质量管理研究中心,77,

    注意事项

    本文(现代统计分析方法与应用(第12章)课件.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开