因子分析的上机操作.ppt
因子分析的上机操作,(01)建立数据文件,(02)选择分析变量 选SPSS Analyze菜单中的(Data Reduction)(Factor),出现【Factor Analysis】对话框;在【Factor Analysis】对话框中左边的原始变量中,选择将进行因子分析的变量选入(Variables)栏。,(03)设置描述性统计量在【Factor Analysis】框中选【Descriptives】按钮,出现【Descriptives】对话框;选择 Initial solution(未转轴的统计量)选项选择KMO 选项点击(Contiue)按钮确定。,(04)设置对因子的抽取选项 在【Factor Analysis】框中点击【Extraction】按钮,出现【Factor Analysis:Extraction】对话框;在Method 栏中选择(Principal components)选项;在Analyze 栏中选择Correlation matrix选项;在Display 栏中选择Unrotated factor solution选项;在Extract 栏中选择Eigenvalues over 并填上 1;点击(Contiue)按钮确定,回到【Factor Analysis】对话框中。,(05)设置因子转轴 在【Factor Analysis】对话框中,点击【Rotation】按钮,出现【Factor Analysis:Rotation】(因子分析:旋转)对话框。在Method 栏中选择 Varimax(最大变异法)在Display栏中选择 Rotated solution(转轴后的解)点击(Contiue)按钮确定,回到【Factor Analysis】对话框中。,(06)设置因素分数 在【Factor Analysis】对话框中,点击【Scores】按钮,出现【Factor Analysis:Scores】(因素分析:分数)对话框。一般取默认值。点击(Contiue)按钮确定,回到【Factor Analysis】对话框。,(07)设置因子分析的选项在【Factor Analysis】对话框中,单击【Options】按钮,出现【Factor Analysis:Options】(因素分析:选项)对话框。在Missing Values 栏中选择Exclude cases listwise(完全排除缺失值)在Coefficient Display Format(系数显示格式)栏中选择Sorted by size(依据因素负荷量排序)项;在Coefficient Display Format(系数显示格式)勾选“Suppress absolute values less than”,其后空格内的数字不用修改,默认为0.1。如果研究者要呈现所有因素负荷量,就不用选取“Suppress absolute values less than”选项。在例题中为了让研究者明白此项的意义,才勾选了此项,正式的研究中应呈现题项完整的因素负荷量较为适宜。单击“Continue”按钮确定。,对SPSS因子分析结果的解释,取样适当性(KMO)检验 KMO值越大,表示变量间的共同因素越多,越适合进行因素分析,要求KMO0.5 要求Barletts的卡方值达到显著程度,2.共同度检查,3.因子陡坡检查,除去坡线平坦部分的因子图中第三个因子以后较为平坦,故保留3个因子,4.方差贡献率检验 取特征值大于 1 的因子,共有3 个,分别(6.358)(1.547)(1.032);变异量分别为(63.58%)(15.467%)(10.32%),5.显示未转轴的因子矩阵,6.分析转轴后的因子矩阵-根据因子负荷量形成3个公共因子,7.形成综合分析结果,例1:对美国洛杉矶12个人口调查区的5个经济学变量的数据进行因子分析(12个地区调查表.sav)菜单:AnalyzeData ReductionFactorVariables:pop,School,employ,Services,house其他使用默认值(主成分分析法Principal components,选取特征值1,不旋转),输出结果:,比较有用的结果:两个主成分(因子)f1,f2及因子载荷矩阵(Component Matrix),根据该表可以写出每个原始变量(标准化值)的因子表达式:Pop0.581f1+0.806f2 School 0.767f1-0.545f2 employ 0.672f1+0.726f2 Services 0.932f1-0.104f2 house 0.791f1-0.558f2每个原始变量都可以是5个因子的线性组合,提取两个因子f1和f2,可以概括原始变量所包含信息的93.4%。f1和f2前的系数表示该因子对变量的影响程度,也称为变量在因子上的载荷。但每个因子(主成分)的系数(载荷)没有很明显的差别,所以不好命名。因此为了对因子进行命名,可以进行旋转,使系数向0和1两极分化。,由于系数没有很明显的差别,所以要进行旋转(Rotation:method一般用Varimax方差最大旋转),使系数向0和1两极分化。菜单:AnalyzeData ReductionFactorVariables:pop,School,employ,Services,houseExtraction:使用默认值(method:Principal components,选取特征值1)Rotation:method选VarimaxScore:Save as variables 和Display factor score Coefficient matrix,输出结果:(表13同前),旋转后的因子载荷矩阵:,因子旋转中的正交矩阵:,因子得分系数矩阵:,因子得分协方差矩阵:,比较有用的结果:两个主成分(因子)f1,f2及旋转后的因子载荷矩阵(Rotated Component Matrix),根据该表可以写出每个原始变量(标准化值)的因子表达式:Pop 0.01602 f1+0.9946f2 School 0.941f1-0.00882f2 employ 0.137f1+0.98f2 Services 0.825f1+0.447f2 house 0.968f1-0.00605f2F1 0.01602 Pop+0.941 School+0.137 employ+0.825 Services+0.968 houseF2 0.9946 Pop-0.00882 School+0.98 employ+0.447 Services-0.00605 house第一主因子对中等学校平均校龄,专业服务项目,中等房价有绝对值较大的载荷(代表一般社会福利-福利条件因子);而第二主因子对总人口和总雇员数有较大的载荷(代表人口-人口因子).,比较有用的结果:因子得分fac1_1,fac2_1。其计算公式:因子得分系数和原始变量的标准化值的乘积之和。fac1_1-0.091 Pop+0.392 School-0.039 employ+0.299 Services+0.403 housefac2_1 0.484 Pop 0.096 School+0.465 employ+0.138 Services-0.098 house然后可以利用因子得分进行聚类、回归分析等。,