探索性因子分析课件.ppt
《探索性因子分析课件.ppt》由会员分享,可在线阅读,更多相关《探索性因子分析课件.ppt(66页珍藏版)》请在三一办公上搜索。
1、一、基本概念 因子分析(factor analysis),也称因素分析,可分为探索性因子分析(Exploratory Factor Analysis,EFA)和验证性因子分析(Confirmatory Factor Analysis,CFA)两种。在旅游研究领域,有许多涉及心理学方面的抽象概念,如游客的动机和满意度、景区所在地居民对旅游影响的感知等均很难用单一指标来表述,通常研究者们会通过构建繁杂的指标体系来进行测量。如何将上述繁杂的指标体系缩减为较少数量具有代表性意义的公共评价因子,就需要借助探索性因子分析方法。,表1 美国马萨诸塞州科德角游客满意度评价指标,资料来源:Pizam,Neuma
2、nn,and Reichel(1978).,探索性因子分析的目的在于找出量表的潜在结构,减少题项的数目,使之变为一组较少而彼此相关较大的变量。因而探索性因子分析是一种资料推导的分析。如果一个量表层面及所包含的题项已非常明确,使用者为再确认该量表各层面及所包含的题项是否如原先使用者所预期的,需要采用一定的方法加以验证,以探究量表的因素结构是否能与抽样样本适配,此种因子分析称为验证性因子分析。因而验证性因子分析是一种理论推导的分析。目前探索性因子分析方法在旅游研究领域的应用相对较广,因而这里仅讨论探索性因子分析。,二、基本原理(一)潜在变量模型与基本原则 因子分析所得到的潜在变量,就是社会科学中所
3、谓的抽象构念,因而因子模型又被称为潜在变量模型(latent variable model)。因子分析是一种潜在结构分析法,其假定每个变量(在量表中称为题项)均由两个部分所构成,一为公共因子(common factor),一为独特因子(unique factor)。公共因子的数目会比指标(原始题项)数少,而每个指标皆有一个独特因子,如果一个量表共有n个题项数,则也会有n个独特因子。,独特因子有两个假定:(1)所有的独特因子间互不相关;(2)所有的独特因子与所有的公共因子间也不相关。而公共因子间则可能彼此相关,也可能不存在相关。如在直交转轴状态下,所有的公共因子间彼此没有相关;而在斜交转轴的情况
4、下,所有的公共因子彼此间就有相关。潜在变量的一个重要统计原则是局部独立性原则(principal of local independence)。如果一组观察变量背后确实存在潜在变量,当统计模型正确确定了潜在变量后,各观察变量之间所具有的相关就会消失,即具有统计独立性。如果观察变量的剩余方差中仍带有相关,那么局部独立性即不成立,此时因子分析所得到的结果并不适切。,因子分析对于潜在变量的定义与估计,有一个重要的方法学原则,称为简约原则(principle of parsimony)。简约有结构简约和模型简约双重涵义,前者指观察变量与潜在变量之间具有最简化的结构特性,后者指最简单的模型应被视为最佳模
5、型。测验所得的最佳化因子结构,称之为简化结构(simple structure),是因子分析的最重要的基本原则。,(二)因子与共变结构 因子分析所处理的材料是观察变量之间的共变,亦即利用数学原理来抽离一组观察变量之间的公共变异成分,然后利用这个公共变异成分来反推这些变量与此一公共部分的关系。如有一组观察变量,以X表示,第i与第j个观察变量间具有相关,从因子分析模型的观点来看,系指两者的公共部分,此一公共部分可以系数 和(因子载荷量factor loading)来表示,于是有,以三个观察变量(、)为例,在两两之间具有相关的情况下,可以计算出三个相关系数(、),如图(a)所示。这三个观察变量的公共
6、变异部分,可以F来表示,其与三个观察变量的关系可以图(b)表示(a)相关模型(b)潜在变量模型,三个相关系数可以、表示,亦即、。在不同的数学算则与限定条件下,可以求得前述方程中、的、三个系数的最佳解,此即因子分析所得到的参数估计结果。估计得出的共同部分F则称为公因子(common factor),此因子模式建立后,研究者即可利用F的估计分数来代表观察变量,达到资料简化的目的。,(三)因子分析方程式 因子分析的一般数学模型可以表达为:式中,代表第j个变量的标准化分数;为第i个公共因子;m为所有变量公共因子的数目;为变量 的特殊因子;为因子载荷量(factor loading),表示第i个公共因子
7、对第j个变量的方差贡献。,(四)几个重要指标的计算 在因子分析中,涉及几个重要指标的计算:共同性、特征值和解释量。这里以三个变量抽取两个公共因子为例,三个变量的线性组合为:,表2 共同性、特征值与解释量的计算,三、因子分析的几个关键问题(一)使用因子分析的可能性 并非所有的多变量数据均适合采用因子分析方法。SPSS软件提供4个统计量来判断观测数据是否适合进行因子分析。1.KMO检验(Kaiser-Meyer-Olkin Measure of Sampling Adequacy)KMO是Kaiser-Meyer-Olkin的取样适当性量数,其值变化于01之间。KMO值越接近于1,表示变量间的公共
8、因子越多,变量间的偏相关(partial correlation)系数越低,越适合进行因子分析;当KMO系数过小时,表示变量偶对之间的相关不能被其他变量解释,进行因子分析不适合。,表3 KMO统计量的判断原理,资料来源:Kaiser(1974),根据Kaiser(1974)的观点,当KMO的值小于0.50时,较不宜进行因子分析,KMO的值至少要在0.60以上,才可以进行因子分析。,2.巴特利特球体检验(Bartlett test of sphericity)巴特利特球体检验的目的在于检验零假设(null hypothesis)“相关矩阵是一个单位矩阵”和备择假设“相关矩阵不是一个单位矩阵”何者
9、成立。若检验结果的Sig.值0.05,就要拒绝零假设而接受备择假设,表示该相关矩阵不是单位矩阵,代表总体的相关矩阵间有公共因子存在,适合进行因子分析。如检验结果的Sig.值0.05,就要接受零假设,表示相关矩阵是单位矩阵,数据就不适宜进行因子分析。,3.反映像相关矩阵(Anti-image correlation matrix)若以第n个题项变量为因变量(校标变量),其余各题项变量为预测变量进行多元回归分析,此第n个校标变量能被预测变量预测的部分称为Pn,不能被预测变量预测的部分称为En,Pn即为该变量的映像,En为该变量的反映像。根据每个变量的反映像En即可求得各变量反映像共变量矩阵及反映像
10、相关系数矩阵。反映像相关系数越小,表示变量间公共因子越多,变量越适合进行因子分析;反之,如果反映像相关系数越大,表示公共因子越少,越不适合进行因子分析。,反映像相关系数矩阵的对角线数值代表每一个变量的取样适当性量数(Measure of Sampling Adequacy;简称MSA),SPSS软件输出结果中的MAS的数值的右边会加注“(a)”的标示。个别题项的MSA值越接近1,表示此个别题项越适合投入于因子分析程序中。一般而言,当个别题项的MSA值小于0.50时,表明该题项不适合进行因子分析,在进行因子分析时可以考虑将之删除。,4.共同性(communalities)共同性也称为公共因子方差
11、,在SPSS软件输出的共同性结果中,如果共同性越低,表示该变量越不适合投入因子分析程序之中;共同性越高,表示该变量与其他变量可测量的共同特质越多,亦即该变量越有影响力。初始共同性表示萃取前各个变量的全部公共因子的载荷系数平方和,采用主成分分析方法萃取公共因子时,公共因子数等于变量因子数,所以初始共同性估计值均为1。萃取(extraction)对应的是萃取的共同性,如果因子分析时要求输出全部公共因子,所萃取的共同性也等于1,如果以特征值大于1为标准输出公共因子,所萃取的共同性就会小于1。共同性估计值也可以作为项目分析时筛选题项是否合适的指标之一,若是题项的共同性低于0.20,可考虑将该题项删除。
12、,(二)样本规模的确定 一般而言,样本的规模越大越好。由于小样本变量之间的相关性随样本的波动大于大样本,因而来自大样本分析的因子比来自小样本的因子更适用。许多研究者曾对因子分析的样本规模进行有关研究,譬如,Gorsuch(1983)建议每个测量变量需要平均观察5个样本,而总样本规模不应少于100。Everitt(1975)和Nunnally(1978)则提出样本与题项的比率为10:1。随着样本规模的增加,测量的随机误差会相互抵消,项目和实验参数开始稳定,增加样本就会显得不再重要。因而,对于超过300的样本而言,题项与调查样本的关系变得越来越不重要。Kass和Tinsley(1979)因而主张,
13、每个题项调查人数为5-10人,直至总样本达到300。,Comrey和Lee(1992)认为,样本规模小于50时是非常不佳的(very poor),样本规模达100时是不佳的(poor),200是普通的(fair),300是好的(good),500是非常好的(very good),1000左右则是理想的(excellent)。但这些简单的准则并不考虑所分析变量的数量和类型。当确定样本的适当规模时,应该考虑测量变量的属性。在良好的条件下(共同性达0.70或更高,4-5个变量组成一个因子),样本规模达100就应该是足够的(虽然在可能的情况下,最好获得大样本)。在中等共同性(如0.40-0.70)和中
14、等超估因子的情况下,获取200个或更多样本似乎是明智的。最后,在较差的条件下,任何样本规模可能都无法产生关于母体参数的准确估计。,(三)公共因子的数量确定 经常令研究者困扰的一个问题是根据什么标准来确定公共因子的数量。在探索性因子分析中,常用的筛选原则有如下几种:1.Kaiser的特征值大于1的原则 2.碎石图检验法 3.方差百分比决定法 4.事先决定准则法,1.Kaiser的特征值大于1的原则 Kaiser(1960)认为,可以保留特征值大于1的因子作为公共因子。目前,很多研究者都根据该原则确定公共因子的数量。但该原则也存在着一定的局限性,如在题项较多的情况下,可能会高估公共因子的数量;反之
15、,如果题项较少,则可能会低估公共因子的数量。低估因子的数量通常比高估因子的数量更槽糕,因为低估因子的数量意味着还有公共因子未被发现,从而限制新结构的发现。有关研究证实,当变量数目介于10-30,且共同性大于0.70时,采用特征值大于1的标准来确定公共因子的数量是最正确的(Stevens,2002)。当变量数目超过40或共同性低于0.40时,采用特征值大于1作为公共因子萃取的准则可能会萃取过多的公共因子。,2.碎石图检验法 碎石图是以未转轴前的因子变异量(特征值)为纵坐标,因子数目为横坐标依序而绘制的折线图。根据碎石图因子变异量递减的情况,可以确定公共因子的数量。一般在碎石图中,因子变异量会有一
16、个从由斜坡转为平坦的过程,在这个转折点以上的因子可以代表公共因子,而在这个转折点以下的因子则为特殊因子,不予采用。有关研究证实,当样本数量大于250,变量的共同性达0.60以上,且因子数目与题项数目的比值小于0.3时,使用碎石图准则可以产生精确的公共因子数量,如果变量的平均共同性只有0.30,且因子数目与题项数目的比值大于0.30时,采用碎石图无法获得精确的结果(Stevens,2002)。,3.方差百分比决定法 该方法是根据所萃取的公共因子能够解释总方差的百分比来确定公共因子的数目,当所萃取的公共因子累积解释方差占总方差的百分比达到某一预设指标时,就可以停止抽取公共因子,之后的因子就不予以保
17、留。在社会科学领域中,当所萃取的公共因子累积解释方差占总方差的百分比达到70%以上时,效果最佳;达60%以上时,就表示公共因子是可靠的;最低要求要达到50%以上(吴明隆,2010)。,4.事先决定准则法 如果研究者在进行因子分析前,已经参考相关理论或文献,对有关题项的因子构面已经有很明确的了解,也可以根据已有的构面确定公共因子的数目。但需要说明的是,这种事先决定准则法更适合于验证性因子分析。,由于以上四种准则都有其内部局限性,因而一些研究者认为,这四个标准不应单独使用,Fabrigar等(1999)因而建议使用多种准则来确定模型中因子的合适数量。有人建议至少3-5个测量变量代表研究中的1个公共
18、因子(MacCallum et al.,1999;Velicer&Fava,1998)。所包括的测量变量总数应该是期望公共因子的3-5倍,选定的变量应该包括可能受各公共因子影响的多变量。台湾学者邱皓政(2010)也指出:“无论在哪一种因素分析模式下,每个因素至少要有三个测量变数是获得稳定结果的最起码标准”。,(四)转轴方法的选择 因子萃取的转轴方法可分为直交转轴和斜交转轴两类。1.直交转轴 直交转轴限定各因子间不存在相关。方差最大旋转法通常被认为是最佳的正交转轴方法(Kaiser,1958),在许多领域具有广泛的应用。一些研究人员偏好使用正交旋转,因为其简单和概念清晰。然而,该观点在几方面值得
19、质疑:其一,对于许多结构而言,有许多理论和实证基础均期望这些结构是互相相关的,因此,斜交旋转提供了更准确和更现实的各结构可能是如何相关的陈述。因而从实质上看,通过最大方差和其他直交旋转施加的不相关因子的限制往往是不必要的,而且可能产生误导的结果。其次,由于直交旋转要求因子在多维空间相交,于90度,而斜交旋转允许小于90度取向,当变量集群在多维空间的相交小于90度时,直交旋转可能产生较差的简单结构。最后,斜交旋转可以提供比直交旋转更多的信息。斜交旋转可以提供公共因子间的相关性估计。了解因子间的相关程度对于解释公共因子的概念性质经常是有用的。事实上,因子间大量相关表明高价因子可能存在。可以对因子相
20、关矩阵进行进一步分析,以洞察这些高价因子的数量和性质,因而可以进一步完善研究者对数据的理解。由于正交旋转不提供因子间的相关性,因而不能确定数据中是否存在一个或多个高价因子。,2.斜交转轴 与直交转轴相反,斜交转轴允许因子间具有相关性。不像直交转轴,在斜交转轴中不存在某种占主导地位的方法。几种斜交旋转方法均被经常使用,而且均可以得到令人满意的结果。这些方法包括直接Oblimin方法(Direct Oblimin),Promax方法(Promax)等。由于在现实世界中各公共因子之间完全没有相关的可能性极小,因而一些研究者认为采用斜交转轴方法萃取公共因子效果可能更好。Nunnally和Bernste
21、in(1994)认为可以利用成份相关矩阵来判断应该选择直交转轴还是斜交转轴,当各因子间的相关系数大于.30时,最好采用斜交转轴,如果因子间的相关系数小于.30时,则可采取直交转轴法。,(五)因子载荷选取指标准则 一些学者从个别共同因子可以解释题项变量的差异程度,提出因子载荷选取的指标准则。一般而言,因子载荷越大,变量能测量到的公共因子特质越多,因而选取的因子载荷越大,因子结构越佳。但是,如果选取的载荷阀值过高,可能又会低估公共因子的数量。Comrey和Lee(1992)指出,因子载荷大于0.71时,公共因子可以解释指标变量50%的方差,此时的因子载荷属于理想状况;但如果因子载荷小于.32,则公
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 探索 因子分析 课件
链接地址:https://www.31ppt.com/p-3050969.html