数理统计12主成分分析.ppt
《数理统计12主成分分析.ppt》由会员分享,可在线阅读,更多相关《数理统计12主成分分析.ppt(42页珍藏版)》请在三一办公上搜索。
1、第七章,主成分分析与因子分析,多元问题的复杂性:指标(变量)多,指标间存在相关性。问题能否构造出一些综合指标使满足如下条件 指标个数尽可能少,指标间相互独立,尽可能多地包含原指标所含的关于总体的信息。例如做一件上衣要测量的指标有身长、袖长、胸围、腰围、肩宽、肩厚等等十几项指标。某服装厂生产一批新型服装,需将十几项指标综合为3项指标(分别反应长度、胖瘦、特体),用作分类的型号。,7.1 主成分分析,主成分(主分量)分析是将原来众多具有相关性的指标化为少数几个相互独立的综合指标的一种统计方法。,化高维为低维 降维 化相关为独立 追源,1、主成分的求法,设 为 维随机向量,,那么如何将这 个指,标综
2、合成很少的几个指标,且要尽可能反映原来指标的作用,又彼此不相,关呢?一个自然的方法是寻找指标,的一个综合指标 线性组合。,我们先来考虑第一个综合指标,其中 是待定的常向量。现在的任务是选取适,当 的使得 最大限度地反映原来指标用,,这就相当于要求 要有尽可能大的方差,即选,取 使得,尽可能地大。,说明 是 的无界函数。,然而不能通过加大向量 的长度使 的方差变,因为对任意的常数,有,因此如果对 不加,大,,即只要 变长 倍,相应的方差就扩大 倍,也,限制,问题就会变得毫无意义。,一个自然的限,制是令,即要求 是单位向量。,问题变为:在 的条件下,求使,达到最大的。,定理1,设总体 的均值和协方
3、差阵分别为,是总体 的 个指标,令,其中,则使得 的方差,和,达到最大的 正好是矩阵 的最大特征根 所,对应的特征向量。,证明,用Lagrange乘数法来证明。令,则有,令,可得,这样就有,由于,根据克莱姆法则知,上述齐次线性,方程有非零解的充要条件是系数行列式为零,,即,这说明 是矩阵 的特征根,且由 可知,是对应于 特征根 的特征向量。,又由,可知欲使 的方差 最大,只要取,为的最大特征根即可,这样 就是对应的单,位特征向量。,第一个综合指标为,其中 是的对应于矩阵 最大特征值 的单位,特征向量,称 为第一主成分。,若协方差矩阵 即是非负定的,由矩阵论,知它有 个非负的特征根,不妨设为,是
4、对应的 个特征向量。,自然 应为 的第二大特征根 所对应的单位,特征向量,并称 为第二主成分。,类似地,第二个综合指标可以取为,重复以上过程,可得 的第 个综合指标,称为 的第 个主成分。,总之,我们可得到 个主成分,且,其中 是协方差阵 的非零特征根并,有,而 是,对应的单位特征向量。,若用矩阵可表示如下,其中,且,即矩阵 是行正交矩阵。,因此,主成分分析也可以看作是对原来,的 个指标 进行了一次正交变,换,而得到 个互不相关的综合指标,即主,成分,寻找总体 的主成分就转化为求 的协差阵 的特征值和相应的单位特征向量问题。,求主成分的步骤:,1.,求 的协方差阵 的特征值,记为,2.,求 对
5、应的单位特征向量,3.,获得第 个主成分,在实际应用时,经常会遇到 个指标的量,纲不尽相同,或取值差异很大的问题,处理,的一般方法是先将各指标进行标准化,即,的协差阵为,即为相关矩阵,其中,求 的主成分就是求 的特征值和相应,的单位特征向量,然后可得 的分量的线性,组合,即为所求的主成分。,2主成分的几何意义,3、贡献率和主成分的解释,构造综合指标的目的是想用尽可能少的主,成分,来代替原有的 个指标,,且能对原始资料所具有的意义做出合理的解释。,那么到底应该选择多少主成分才合理呢?下面,就来讨论总体主成分个数的选取问题,对样本,主成分也有类似的分析。,设 维总体 的协方差阵为,的第 个主成分为
6、,由于这些主成分 时互不相关的,因,此有,这说明 的“总方差”(即个分量的方差之和),等于 个互不相关的随机变量 的方,差之和,其中 具有最大的方差,,次之且,有方差,具有最小方差,这样主成,分依次集中了 各分量的变化的主要部分,第,一主成分 的方差最大,即是以变化最大的方,向向量为系数所得到的线性函数作为,比值,表明了方差 在“全部方差”中所占的比重,,显,然这个比值越大,表明 这个变量“综合”原始,资料 的能力越强。通常称这个比值,为第一主成分的贡献率。类似地称,为第 个主成分的贡献率。而称,为前 个主成分的累计贡献率。,这就是说,贡献率约达,则对应的主成分,反映 的能力就越强,反之则弱。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数理统计 12 成分 分析
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-6297300.html