SPSS统计分析第10章主成分分析和因子分析课件.ppt
SPSS统计分析第10章主成分分析和因子分析,1,主要内容,10.1 主成分分析和因子分析简介10.2 主成分分析10.3 因子分析,10.1主成分分析和因子分析简介,10.1.1 基本概念和主要用途(1)基本概念 主成分分析就是考虑各指标之间的相互关系,利用降维的方法将多个指标转换为少数几个互不相关的指标,从而使进一步研究变得简单的一种统计方法。主成分分析是由Hotelling于1933年首先提出的,是利用“降维”的思想,在损失很少信息的前提下把多个指标转化为几个综合指标,称为主成分。每个主成分均是原始变量的线性组合,且各个主成分之间互不相关,这就使得主成分比原始变量具有某些更优越的性能。因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的分析方法,最早是由心理学家Chales Spearman在1904年提出的,它的基本思想是将实测的多个指标,用少数几个潜在指标(因子)的线性组合表示。,10.1主成分分析和因子分析简介,(2)主要用途解决共线性问题;评估问卷的结构效度;寻找变量之间的潜在结构;内在结构证实。(3)常用术语因子载荷变量共同度公共因子的方差贡献,10.1主成分分析和因子分析简介,10.1.2主成分和公因子数量的确定(1)确定时遵循几个原则主成分的累积贡献率:一般来说,提取主成分的累积贡献率达到80%85%以上就比较满意了,可以由此确定需要提取多少个主成分。特征值:特征值在某种程度上可以看成表示主成分影响力度大小的指标,如果特征值小于1,说明该主成分的解释力度还不如直接引入原变量的平均解释力度大。因此一般可以用特征值大于1作为纳入标准。综合判断:大量的实际情况表明,如果根据累积贡献率来确定主成分数往往较多,而用特征值来确定又往往较少,很多时候应当将两者结合起来,以综合确定合适的数量。,10.1主成分分析和因子分析简介,10.1.3 两者的区别与联系(1)两者都是在多个原始变量中通过它们之间的内部相关性来获得新的变量(主成分变量或因子变量),达到既能减少分析指标个数,又能概括原始指标主要信息的目的。(2)提取公因子主要有主成分分析法和公因子法,若采用主成分法,则主成分分析和因子分析基本等价。(3)因子分析提取的公因子比主成分分析提取的主成分更具有解释性。(4)两者分析的实质和重点不同。(5)两者的SPSS操作都是通过“分析降维因子分析”过程实现的,主成分分析不需要因子旋转,而因子分析需要经过旋转。,主要内容,10.1 主成分分析和因子分析简介10.2 主成分分析10.3 因子分析,10.2 主成分分析,10.2.1 统计原理与分析步骤(1)统计原理,10.2 主成分分析,(1)统计原理,10.2 主成分分析,10.2.1 统计原理与分析步骤(2)分析步骤 第1步 原始数据的标准化处理。第2步 计算相关系数矩阵。第3步 计算特征值及单位特征向量。第4步 计算主成分的方差贡献率和累积方差贡献率。第5步 计算主成分。,10.2 主成分分析,10.2.2 SPSS实例分析【例10-1】为了从总体上反映世界经济全球化的状况,现选择了具有代表性的16个国家的数据,这些国家参与经济全球化的程度指标值如下表所示。试分析一个国家参与经济全球化的程度主要受哪些因素的影响。,10.2 主成分分析,第1步 分析:从数据来看,一共有15个因素,但有些因素是存在相关性的,同时各因素对全球化影响的程度也是不一样的,故可采用主成分分析。第2步 数据组织:按如教材所示的“指标”一列定义变量,输入数据并保存。第3步 主成分分析的设置:按“分析降维因子分析”顺序打开“因子分析”对话框,将x1x15这15个变量移入“变量”对话框中,并按如下所示的图形进行设置。,10.2 主成分分析,10.2 主成分分析,说明:由于在SPSS中并没有完整的主成分分析过程,其主成分分析过程是集成在“因子分析”过程中的,但并不完善。由于主成分的得分需要对因子得分情况进行进一步计算,故不需设置“得分”子对话框,即不需保存因子得分情况,即使保存了,因子得分也不是各主成分得分的结果。对于提取因子的个数问题,一般遵循两个标准,其一是累计方差贡献率在80%以上,其二是其特征值大于1。本例之所以设置为3,是因为通过预先分析,发现前3个主成分可以解释总体信息的86.7%。,10.2 主成分分析,第四步 因子分析的结果:特征值和方差贡献表,从表中可以看出前3个主成分已经解释了总方差的近86.7%,故可以选择前3个主成分进行分析。,10.2 主成分分析,第四步 因子分析的结果:主成分的碎石图,该图从另一个侧面说明了取前三个主成分为宜。,10.2 主成分分析,第四步 因子分析的结果:旋转前的因子载荷矩阵,说明:教材中公式10.7中的 是标准化正交向量,并不是SPSS输出“因子载荷矩阵”中的系数。而“因子载荷矩阵”中各分量的系数为单位特征向量乘以相应的特征值的平方根的结果,其公式为。故需进一步利用因子分析的结果进行主成分分析。,10.2 主成分分析,第五步 利用因子分析的结果进行主成分分析。,10.2 主成分分析,第六步 主要结果:,过综合得分的高低可知各国参与国际化水平的高低,其中美国最高,印度最低。,主要内容,10.1 主成分分析和因子分析简介10.2 主成分分析10.3 因子分析,10.3 因子分析,10.3.1 统计原理与分析步骤(1)统计原理,其中x1,x2,xp为p个原有变量,是均值为零,标准差为1的标准化变量,F1,F2,Fm为m个因子变量,m小于p,表示成矩阵形式为:,10.3 因子分析,10.3.1 统计原理与分析步骤(2)分析步骤第1步 将原始数据进行标准化;第2步 确定待分析的原有若干变量是否适合于因子分析;第3步 构造因子变量;第4步 利用旋转使得因子变量更具有可解释性;第5步 计算因子变量的得分。计算因子得分和模型为:,j=1,2,m,10.3 因子分析,10.3.2 SPSS实例分析【例10-2】为了研究几个省市的科技创新力问题,现取了2005年8个省市的15个科技指标数据,试分析一个省的科技创新能力主要受哪些潜在因素的影响?,10.3 因子分析,第1步 分析:如题所述,要分析一个省的科技创新能力受哪些潜在因素的影响,可用因子分析法进行分析。第2步 数据组织:建立x1x15共15个数据变量和一个“省市”字符型变量,将北京、天津等8个省市作为个案数据输入并保存。第3步 因子分析设置:按“分析降维因子分析”打开“因子分析”对话框,将x1x15这15个变量移入“变量”对话框中,表示对这15个变量数据进行因子分析。,10.3 因子分析,“得分”对话框的设置:单击“得分(S)”按钮,弹出此子对话框,选择“保存为变量”,即将因子得分保存下来。第4步主要结果及分析:特征值与方差贡献表,可以看出前3个特征值大于1,同时这3个公共因子的方差贡献率占了93.924%,说明提取这3个公共因子可以解释原变量的绝大部分信息。,10.3 因子分析,旋转前的因子载荷矩阵,表的底部表明使用的是主成分分析法,3个主成分被抽取出来。,10.3 因子分析,旋转后的因子载荷矩阵,是按照前面设定的“方差极大法”对因子载荷矩阵旋转的结果。在表10.10所示未经旋转的载荷矩阵中,因子变量在许多变量上均有较高的载荷,从旋转后的因子载荷矩阵可以看出,因子1在1、3、4、6、7、12、13、14上有较大载荷,反映科技投入与产出情况,可以命名为创新水平因子;因子2在指标5、8、15上有较大载荷,反映地区经济发展及财政科教投入水平,可以命名为创新环境因子;因子3在指标9和指标10上有较大载荷,可以命名为高技术产业发展因子。,10.3 因子分析,因子转换矩阵表,表明因子提取的方法是主成分分析,旋转的方法是方差极大法。,因子得分及综合因子得分情况,