第八章因子分析.ppt
《第八章因子分析.ppt》由会员分享,可在线阅读,更多相关《第八章因子分析.ppt(50页珍藏版)》请在三一办公上搜索。
1、第八章 因子分析,8.1 引言 8.2 正交因子模型 8.3 参数估计 8.4 因子旋转 8.5 因子得分,8.1 引言,主成分分析的成功需满足如下两点:(1)前(少数)几个主成分具有较高的累计贡献率;(通常较易得到满足)(2)对主成分给出符合实际背景和意义的解释。(往往正是主成分分析的困难之处)因子分析的用途与主成分分析类似,它也是一种降维方法。由于因子往往比主成分更易得到解释,故因子分析比主成分分析更容易成功,从而有更广泛的应用。,从方法上来说,因子分析比主成分分析更为精细,自然理论上也就更为复杂。主成分分析只涉及一般的线性变换,不涉及模型,仅需假定二阶矩存在。而因子分析需建立一个数学模型
2、,并作一定的假定。因子分析起源于20世纪初,K.皮尔逊(Pearson)和C.斯皮尔曼(Spearman)等学者为定义和测定智力所作的努力,主要是由对心理测量学有兴趣的科学家们培育和发展了因子分析。因子分析的目的是为了降维,降维的方式是试图用少数几个潜在的、不可观测的随机变量来描述原始变量间的协方差关系。,例8.1.1 林登(Linden)根据他收集的来自139名运动员的比赛数据,对第二次世界大战以来奥林匹克十项全能比赛的得分作了因子分析研究。这十个全能项目为:100米跑(x1),跳远(x2),铅球(x3),跳高(x4),400米跑(x5),11米跨栏(x6),铁饼(x7),撑杆跳高(x8),
3、标枪(x9),1500米跑(x10)。经标准化后所作的因子分析表明,十项得分基本上可归结于他们的短跑速度、爆发性臂力、爆发性腿力和耐力这四个方面,每一方面都称为一个因子。十项得分与这四个因子之间的关系可以描述为如下的因子模型:xi=i+fi1+fi2+fi3+fi4+i,i=1,2,10 其中f1,f2,f3,f4表示四个因子,称为公共因子(common factor),aij称为xi在因子fj上的载荷(loading),i是xi的均值,i是xi不能被四个公共因子解释的部分,称之为特殊因子(specific factor)。,例8.1.3 公司老板对48名应聘者进行面试,并给出他们在15个方面
4、所得的分数,这15个方面是:x1:申请书的形式x9:经验x2:外貌x10:积极性x3:专业能力x11:抱负x4:讨人喜欢x12:理解能力x5:自信心x13:潜力x6:精明x14:交际能力x7:诚实x15:适应性x8:推销能力通过因子分析,这15个方面可以归结为应聘者的外露能力、经验、讨人喜欢的程度、专业能力和外貌这五个因子。,8.2 正交因子模型,一、数学模型 二、正交因子模型的性质三、因子载荷矩阵的统计意义,一、数学模型,设有p维可观测的随机向量,其均值为,协差阵为=(ij)。因子分析的一般模型为其中f1,f2,fm为公共因子,1,2,p为特殊因子,它们都是不可观测的随机变量。公共因子出现在
5、每一个原始变量的表达式中,可理解为原始变量共同具有的公共因素。上式可用矩阵表示为x=+Af+,式中 为公共因子向量,为特殊因子向量,称为因子载荷矩阵。通常假定该假定和上述关系式构成了正交因子模型。由上述假定可以看出,公共因子彼此不相关且具有单位方差,特殊因子也彼此不相关且和公共因子也不相关。,二、正交因子模型的性质,1.x的协差阵的分解2.模型不受单位的影响3.因子载荷是不惟一的,1.x的协差阵的分解,故得=AA+D如果x为各分量已标准化了的随机向量,则就是相关阵R=(ij),即有R=AA+D,例8.2.1 设随机向量x=(x1,x2,x3,x4)的协方差矩阵为则可分解为=AA+D其中,若取,
6、则有分解式此时m=p,没有达到降维目的,故所作的因子分析没有意义。出于降维的需要,我们常常希望m要比p小得多,这样前述的分解式通常只能近似成立,即有=AA+D近似程度越好,表明因子模型拟合得越佳。一般来说,m选取得越小,上述近似效果就越差,即因子模型拟合得越不理想。拟合得太差的因子模型是没有什么实际意义的,故实践中m也不应选得过小。,2.模型不受单位的影响,将x的单位作变化,通常是作一变换x*=Cx,这里C=diag(c1,c2,cp),ci0,i=1,2,p,于是x*=C+CAf+C 令*=C,A*=CA,*=C,则有x*=*+A*f+*这个模型能满足类似于前述因子模型的假定,即,其中 因此
7、,单位变换后新的模型仍为正交因子模型。,3.因子载荷是不惟一的,设T为任一mm正交矩阵,令A*=AT,f*=Tf,则模型能表示为x=+A*f*+因为E(f*)=TE(f)=0V(f*)=TV(f)T=TT=ICov(f*,)=E(f*)=TE(f)=0所以仍满足模型条件。也可分解为=A*A*+D因此,因子载荷矩阵A不是惟一的,在实际应用中常常利用这一点,通过因子的旋转(见稍后的8.4),使得新的因子有更好的实际意义。,三、因子载荷矩阵的统计意义,1.A的元素aij2.A的行元素平方和3.A的列元素平方和,1.A的元素aij,xi=i+ai1f1+ai2f2+aimfm+i即aij是xi与fj之
8、间的协方差。若x为各分量已标准化了的随机向量,则xi与fj的相关系数 此时aij表示xi与fj之间的相关系数。,2.A的行元素平方和,xi=i+ai1f1+ai2f2+aimfm+i令于是,反映了公共因子对xi的影响,可以看成是公共因子f1,f2,fm对xi的方差贡献,称为共性方差(communality);而 是特殊因子i对xi的方差贡献,称为特殊方差(specific variance)。当x为各分量已标准化了的随机向量时,ii=1,此时有,3.A的列元素平方和,其中 反映了公共因子fj对x1,x2,xp的影响,是衡量公共因子fj重要性的一个尺度,可视为公共因子fj对x1,x2,xp的总方
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 因子分析

链接地址:https://www.31ppt.com/p-5304956.html