《因子分析》课件.ppt
《《因子分析》课件.ppt》由会员分享,可在线阅读,更多相关《《因子分析》课件.ppt(74页珍藏版)》请在三一办公上搜索。
1、1,第七章 因子分析,2,第一节 引言,一般认为因子分析是从Charles Spearman在1904年发表的文章对智力测验得分进行统计分析开始,他提出这种方法用来解决智力测验得分的统计方法。目前因子分析在心理学、社会学、医学、经济学等学科中都取得了成功的应用,是多元统计分析中典型方法之一。因子分析(factor analysis)也是一种降维、简化数据的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个“抽象”的变量来表示其基本的数据结构。这几个抽象的变量被称作“因子”,能反映原来众多变量的主要信息。原始的变量是可观测的显性变量,而因子一般是不可观测的潜在变量
2、。因子分析的目的,是用几个不可观测的“隐变量”来解释原始变量之间的协方差关系。,3,因子分析就是一种通过显性变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。在医学研究中有一些现象是难以直接观测的,通常称为不可测现象,它们只能通过其它多个可观测的指标来间接地反映。如脑部疾病患者的意识清醒状态是不可测现象,但可通过患者的语言能力、辩识能力、记忆能力、理解能力、思维的逻辑能力等一系列可观测的指标来反映。这里,由于各个指标都不同程度地反映了意识清醒状态这一不可测现象,因此这些不可测指标这之间呈现一定的相关性。很自然地,人们可以认为这些可观测指标之间的相关性主要是由它们所共同反映的不可测现象支
3、配。,4,先看一个例子:观测5个生理指标X1(收缩压)、X2(舒张压)X3(心跳间隔)、X4(呼吸间隔)、X5(舌下温度)。从生理知识知道,这5个指标是受自主神经的交感神经和副交感神经支配的,而这交感神经和副交感神经又不可直接测。若用F1、F2分别表示交感神经和副交感神经这两个因子,则可设想,可测指标Xi是不可测因子Fj的线性函数,即Fj对各Xi的影响是线性的,再加上其它对这些Xi有影响因子ei,则各Xi与F1、F2的关系可表示为:,5,由于F1、F2为各Xi的公因子或共性因子(common factor),而ei只与相应的一个Xi有关,故ei称为Xi的特殊因子或个性因子(specific f
4、actor),我们感兴趣的是如何从一组观测数据出发,找出起支配作用的较少个数的公因子。,6,这二个公共因子可以表示为:,是不可观测的潜在因子,5个变量共享这二个因子,所以称为公共因子。但是每个变量又有自己的个性,不被包含的部分,称为特殊因子。,7,其他例子,在医学领域,描述疾病的影响因素和诊断的指标很多,过多的指标容易导致分析过程复杂化。一个合适的做法是从这些指标中提取少数几个主要因子,每一个主要因子都能反映相互依赖的疾病指标或诊断指标间共同作用,抓住这些主要因素就可以帮助我们对复杂的疾病危险因素或诊断问题进行深入分析、合理解释和正确评价。再比如,调查青年对于婚姻、家庭的态度。邀请n个青年,每
5、人回答p50的问卷,这些问题可归纳为如下方面:对相貌的重视;对老人的态度;对孩子的观点;等等。每一个方面,就是一个因子。公司老板对48名应聘者进行面试,并给出他们在15个方面所得的分数,这15个方面是:X1简历的制作质量;X2外貌;X3专业能力;X4讨人喜欢;X5自信心;X6精明;X7诚实;X8推销能力;X9经验;X10积极性;X11抱负;X12理解能力;X13潜力;X14交际能力;X15适应性。通过因子分析,这15个方面归结为应聘者的五项能力:1、外露能力;2、讨人喜欢的程度;3、经验;4、专业能力;5、外貌。,8,主成分分析与因子分析有很大不同:主成分分析不能作为一个模型来描述,它仅仅是变
6、量变换,主成分是可观测的原始变量的线性组合;而因子分析需要构造因子模型,公共因子一般不能表示为原始变量的线性组合。两者在表达形式上的区别是:主成分分析:原始变量的线性组合表示新的综合变量,即主成分;因子分析:潜在的假想变量(公共因子)和随机影响变量(特殊因子)的线性组合表示原始变量。从计算方法上来说,主成分分析,可以视为因子分析的一个特例;或者说,因子分析是主成分分析的推广。,主成分分析与因子分析的区别,9,因子模型形式上与线性回归模型很相似,但它们却有着本质的区别:1、回归分析模型中的自变量是可以被观测得到的真实变量;而因子分析中的因子是一个比较抽象的概念,是不可观测的“隐变量”;2、两个模
7、型的参数意义不同。,回归分析与因子分析的区别,10,因子分析的内容非常丰富,常用的因子分析类型是R型因子分析和Q型因子分析。R型的因子分析是对变量作因子分析,Q型因子分析是对样品作因子分析。本章侧重讨论R型因子分析。,11,第二节 因子分析模型,12,一、因子分析的数学模型,13,无论是R型或Q型因子分析,都用公共因子F代替X,一般要求mp,mn,因此,因子分析与主成分分析一样,也是一种降低变量维数的方法。我们下面将看到,因子分析的求解过程同主成分分析类似,也是从分析协方差阵出发的。因子分析与主成分分析有许多相似之处,但这两种模型又存在明显的不同。主成分分析的数学模型本质上是一种线性变换,是将
8、原始坐标变换到变异程度大的方向上去,相当于从空间上转换观看数据的角度,突出数据变异的方向,归纳重要信息。因子分析从本质上看是从显性变量去“提炼”潜在因子的过程。正因为因子分析是一个提练潜在因子的过程,因子的个数m取多大是要通过一定规则确定的,并且因子的形式也不是唯一确定的。一般说来,作为“自变量”的因子F1,F2,Fm是不可直接观测的。这里我们应该注意几个问题:,14,二、因子模型的性质,15,16,17,18,三、因子载荷阵的统计意义,前面的因子分析模型中出现了一个概念叫因子载荷矩阵,实际上因子载荷矩阵存在明显的统计意义。为了对因子分析过程和计算结果做详细的解释,我们对因子载荷矩阵的统计意义
9、加以说明。,19,20,21,变量共同度的统计意义,22,23,24,第三节 因子模型参数的估计,25,一、主成分法,26,例题7.1 对六门考试成绩的因子分析,我们继续使用主成份例题6.3提供的100名学生的六门成绩(数学、物理、化学、语文、历史、英语),采用主成分法,对学生成绩进行因子分析。,27,变量共同度,变量共同度为1(当m6时)为什么?,28,特征值和各因子的贡献率,该表显示了六个公共因子解释原始变量总方差的情况。第二列为特征值,第三、四列为每个公共因子的贡献率和累计贡献率。可见,使用2个公共因子就够用了。为什么?,29,因子载荷矩阵,30,这里,第一个因子主要和语文、历史、英语三
10、科有很强的正相关;而与数学、物理、化学三科有很强的负相关。因此可以给第一个因子起名为“偏科因子”。而第二个因子作用比较均衡,可起名为“综合因子”。,31,二、主轴因子法(Principal Axis Factoring),A矩阵每行元素的平方和,也即变量共同度!,32,(7)主轴因子法小节,33,例题7.2 对六门考试成绩的因子分析,使用主轴因子法,继续对主成份例题6.3提供的100名学生的六门成绩(数学、物理、化学、语文、历史、英语)进行因子分析。,34,35,36,三、极大似然法*,37,例题7.3 对六门考试成绩的因子分析,使用极大似然法,继续对主成份例题6.3提供的100名学生的六门成
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因子分析 课件

链接地址:https://www.31ppt.com/p-6076423.html