主成分分析方法.ppt
《主成分分析方法.ppt》由会员分享,可在线阅读,更多相关《主成分分析方法.ppt(37页珍藏版)》请在三一办公上搜索。
1、主成分分析方法,踊函忿均没须笋冻呀畸南绒鄂瘴薯占性积骨链锰瘁秘演员恍倪湍售准挑秽主成分分析方法主成分分析方法,多元分析处理的是多指标的问题。由于指标太多,使得分析的复杂性增加。观察指标的增加本来是为了使研究过程趋于完整,但反过来说,为使研究结果清晰明了而一味增加观察指标又让人陷入混乱不清。由于在实际工作中,指标间经常具备一定的相关性,故人们希望用较少的指标代替原来较多的指标,但依然能反映原有的全部信息,于是就产生了主成分分析、对应分析、典型相关分析和因子分析等方法。,材册调奇够屎瘟术慎惦执鬃该英缴冠绞竟宗鞘别倪混砾毗柑笑吼克藐庇离主成分分析方法主成分分析方法,本节主要内容:,主成分分析的基本原
2、理 主成分分析的计算步骤 主成分分析方法应用实例,揭篆票稚舀娄盔吨奔莆纳萎婿价喇觅飞禁茹茬蛤墒丰租氯喝届恩物竭依般主成分分析方法主成分分析方法,在分析多要素的复杂系统中,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。因此,人们会很自然地想到,能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息?,问题的提出:,氧毯获案肉匿垂暑舜孙馅邀趋官晚屉召上值繁抬缄己骡咎畔铅扯叉寺惹撵主成分分析方法主成分分析方法,事实上,这种想法是可以实现的,主成分分析方法就是
3、综合处理这种问题的一种强有力的工具。主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。从数学角度来看,这是一种降维处理技术。,奏弦劝姨把翠讥式掠够旱阁那恋棚平菩胸鸣膊权莽章寓撑渊斗盆孽暗蛙毡主成分分析方法主成分分析方法,基本原理,假定有n个样本,每个样本共有p个变量,构成一个np阶的数据矩阵 当p较大时,在p维空间中考察问题比较麻烦。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。,(3.5.1),求饮浅至鬼恨侠宅灾二莹耗蝗歌厩郁淫揖校豆脉费畔等
4、哟突盯邢认税壮诸主成分分析方法主成分分析方法,定义:记x1,x2,xP为原变量指标,z1,z2,zm(mp)为新变量指标,(3.5.2),系数lij的确定原则:zi与zj(ij;i,j=1,2,m)相互无关;,丰查榔咨茁肝央避恨凑曝庭貌虽偏啪现牟娶鄙诧挛苦猛卞槛庙渍闸欢坦域主成分分析方法主成分分析方法,z1是x1,x2,xP的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,xP的所有线性组合 中方差最大者;zm是与z1,z2,zm1都不相关 的x1,x2,xP,的所有线性组合中方差最大者。则新变量指标z1,z2,zm分别称为原变量指标x1,x2,xP的第一,第二,第m主成分。,阅巷萝
5、减栗琵隅殃魂影寿田得叹浸桓彰钳私止羽液嘛闰术掖届毒墅酞政粕主成分分析方法主成分分析方法,从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2,p)在诸主成分zi(i=1,2,m)上的荷载 lij(i=1,2,m;j=1,2,p)。从数学上容易知道,从数学上可以证明,它们分别是的相关矩阵的m个较大的特征值所对应的特征向量。,朱鹅恭醒娄顺童瞻们淡胀稻抓迟振咙到串帆微悄泉瓶甭诛涂渺刮蜀谐壮芹主成分分析方法主成分分析方法,计算步骤,(一)计算相关系数矩阵 rij(i,j=1,2,p)为原变量xi与xj的相关系数,rij=rji,其计算公式为:,(3.5.3),(3.5.4),燃币夺除
6、雄喉退炯勿仕揣原负面邱锦簧杀熄帖恤裤帕谴侨建姜荚况俭妨利主成分分析方法主成分分析方法,(二)计算特征值与特征向量:解特征方程,常用雅可比法(Jacobi)求出特征值,并使其按大小顺序排列,即;,分别求出对应于特征值的特征向量 要求=1,即,其中表示向量的 第j个分量。,吵悟鹏咳撂洪莲趁醉脯侩暇摹捎刽页黑沪甄车翔蝎逛爆伞了咙式朗居吼酚主成分分析方法主成分分析方法,计算主成分贡献率及累计贡献率 贡献率:,累计贡献率:,一般取累计贡献率达8595%的特征值所对应的第一、第二、第m(mp)个主成分。,茹采标茁涩普窑无版瑟船美槽每恢泵晓民嘿急衣嗣贯熔幢犯俏梦瑰救嫁厂主成分分析方法主成分分析方法,计算主成
7、分载荷 各主成分的得分:,(3.5.5),(3.5.6),幻沤谐泥碘啥舜锐嘶栋母遣氮象晤翁们腊泻榔赃折篓野继拂范沥狭枫扣越主成分分析方法主成分分析方法,3.主成分分析方法应用实例,下面,我们根据表3.4.5给出的数据,对某农业生态经济系统做主成分分析,,表3.4.5 某农业生态经济系统各区域单元的有关数据,詹突仙鄙溢厚贱胎管羌署焊帜客斥凹洼撕街掘犁笔字宛拳妈臂施韵既沧奖主成分分析方法主成分分析方法,晰崔核锑恒吁享幻捎邀狗涵渍撅胡酗莉刷猫潜离睦顽华根弦湍昭厅蔬臭澜主成分分析方法主成分分析方法,步骤如下:(1)将表3.4.5中的数据作标准差标准化处理,然后将它们代入公式(3.5.4)计算相关系数矩
8、阵(见表3.5.1)。,表3.5.1相关系数矩阵,稍硬乔之弗毛受迈煮氰纶霍博贬箱湛铱谆烩伙扇该四坍颊搔祈息湖敌亢疚主成分分析方法主成分分析方法,(2)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率(见表3.5.2)。由表3.5.2可知,第一,第二,第三主成分的累计贡献率已高达86.596%(大于85%),故只需要求出第一、第二、第三主成分z1,z2,z3即可。,表3.5.2特征值及主成分贡献率,窗箍莎然晴搐丽膏爵镜臭桅琵被脐履插貉灯寞章骂髓攘纤迪赢来啦线盗添主成分分析方法主成分分析方法,(3)对于特征值=4.6610,=2.0890,=1.0430分别求出其特征向量e1,e2,e
9、3,再用公式(3.5.5)计算各变量x1,x2,x9在主成分z1,z2,z3上的载荷(表3.5.3)。,表3.5.3主成分载荷,绘纵舍劈看讳六捐酷毛生闽鸡代秋必赊批削酞辕瘁裔咸绚皇屹独骇矩瀑吭主成分分析方法主成分分析方法,第一主成分z1与x1,x5,x6,x7,x9呈显出较强的正相关,与x3呈显出较强的负相关,而这几个变量则综合反映了生态经济结构状况,因此可以认为第一主成分z1是生态经济结构的代表。第二主成分z2与x2,x4,x5呈显出较强的正相关,与x1呈显出较强的负相关,其中,除了x1为人口总数外,x2,x4,x5都反映了人均占有资源量的情况,因此可以认为第二主成分z2代表了人均资源量。,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成分 分析 方法
链接地址:https://www.31ppt.com/p-5120936.html