应用多元统嫛分析.ppt
《应用多元统嫛分析.ppt》由会员分享,可在线阅读,更多相关《应用多元统嫛分析.ppt(57页珍藏版)》请在三一办公上搜索。
1、1,应用多元统计分析,第十章 典型相关分析,2,第十章 典型相关分析目 录,10.1 总体典型相关10.2 样本典型相关10.3 典型冗余分析,3,第十章 典型相关分析,相关分析是研究多个变量与多个变量之间的相关关系.如研究两个随机变量之间的相关关系可用简单相关系数表示;研究一个随机变量与多个随机变量之间的相关关系可用全相关系数表示.1936年Hotelling首先将相关分析推广到研究多个随机变量与多个随机变量之间的相关关系,故而产生了典型相关分析,广义相关系数等一些有用的方法.,4,第十章 典型相关分析 什么是典型相关分析,在实际问题中,经常遇到要研究一部分变量和另一部分变量之间的相关关系,
2、例如:在工业中,考察原料的主要质量指标(X1,.,Xp)与产品的主要质量指标(Y1,.,Yq)间的相关性;在经济学中,研究主要肉类的价格与销售量之间的相关性;在地质学中,为研究岩石形成的成因关系,考察岩石的化学成份与其周围围岩化学成份的相关性;在气象学中为分析预报24小时后天气的可靠程度,研究当天和前一天气象因子间的相关关系;,5,第十章 典型相关分析 什么是典型相关分析,在教育学中,研究学生在高考的各科成绩与高二年级各主科成绩间的相关关系;在婚姻的研究中,考察小伙子对追求姑娘的主要指标与姑娘想往的小伙子的主要尺度之间的相关关系;在医学中,研究患某种疾病病人的各种症状程度与用科学方法检查的一些
3、结果之间的相关关系;在体育学中,研究运动员的体力测试指标与运动能力指标之间的相关关系等.,6,第十章 典型相关分析 什么是典型相关分析,一般地,假设有一组变量X1,.,Xp 与另一组变量Y1,.,Yq(也可以记为Xp+1,.,Xp+q),我们要研究这两组变量的相关关系,如何给两组变量之间的相关性以数量的描述,这就是本章研究的典型相关分析.当p=q=1时,就是研究两个变量X与Y之间的相关关系.简单相关系数是最常见的度量.其定义为,7,第十章 典型相关分析 什么是典型相关分析,当p 1,q=1时(或 q 1,p=1),设,则称,为Y与(X1,Xp)的 全相关系数.,其实Y对X的回归为,且,并称R为
4、全相关系数.,def=,8,第十章 典型相关分析 什么是典型相关分析,当p,q1时,利用主成分分析的思想,可以把多个变量与多个变量之间的相关化为两个新变量之间的相关.也就是求=(1,p)和=(1,q),使得新变量:V=1X1+pXp=X W=1Y1+qYq=Y之间有最大可能的相关,基于这个思想就产生了典型相关分析(Canonical correlatinal analysis).,9,第十章10.1 总体典型相关,设X=(X1,.,Xp)及Y=(Y1,.,Yq)为随机向量(不妨设pq),记随机向量,Z=,XY,Z的协差阵为,其中 11是X的协差阵,22是Y的协差阵,12=21是X,Y的协差阵.
5、,10,第十章10.1 总体典型相关,我们用X和Y的线性组合V=aX和W=bY之间的相关来研究X和Y之间的相关.我们希望找到a和b,使(V,W)最大.由相关系数的定义:,又已知,11,第十章10.1 总体典型相关,故有,对任给常数c1,c2,d1,d2,显然有(c1V+d1,c2W+d2)=(V,W)即使得相关系数最大的V=aX和W=bX并不唯 一.故加附加约束条件 Var(V)=a11 a=1,Var(W)=b22 b=1.,问题化为在约束条件Var(V)=1,Var(W)=1下,求a和b,使得(V,W)=a12 b达最大.,12,第十章10.1 总体典型相关典型相关变量和典型相关系数的定义
6、,定义 设X=(X1,.,Xp)及Y=(Y1,.,Yq)为随机向量(不妨设pq),记Z=(X,Y).设随机向量 Z的均值为0,协差阵0.如果存在a1=(a11,alp)和b1=(b11,.,blq)使得,则称 a1 X,b1Y是X,Y的第一对典型相关变量,它们之间的相关系数称为第一个典型相关系数.,13,第十章10.1 总体典型相关典型相关变量和典型相关系数的定义,如果存在ar=(ar1,arp)和br=(br1,.,brq)使得(r=2,m;m=p):(1)arX,brY和前面r-1对典型变量都 不相关;(2)Var(arX)=1,Var(brY)=1;(3)Vr=arX,Wr=brY 的相
7、关系数最大.则称 Vr,Wr 为X,Y的第r对典型相关变量,它们之间的相关称为第r个典型相关系数.,14,第十章10.1 总体典型相关典型相关变量和典型相关系数的一般求法,典型相关变量和典型相关系数的一般求法,从第一对典型相关变量的解法中,我们知道求第一对典型相关变量和第一个典型相关系数的问题,就是求解TT的最大特征根和相应的特征向量.不仅如此,求解第r对典型相关变量和典型相关系数,类似地是求TT的第r个(从大到小排序的)特征根和相应特征向量.,15,第十章10.1 总体典型相关典型相关变量和典型相关系数的一般求法,定理 设Z=(X,Y),其中 X=(X1,.,Xp)为p维随机向量,Y=(Y1
8、,.,Yq)为q维随机向量,(不妨设pq).已知E(Z)=0,D(Z)=(0),记,定义,16,第十章10.1 总体典型相关典型相关变量和典型相关系数的一般求法,并设p阶方阵TT 的特征值依次为,相应的单位特征向量记为lk(k=1,2,p),则 Vk=akX,Wk=bkY为X,Y的第k对典型相关变量,k为第k个典型相关系数.,17,第十章10.1 总体典型相关典型相关变量的性质,性质(1):设Vi和Wi为X和Y的第i对典型相关变量(i=1,.,p).令V=(V1,.,Vp),W=(W1,Wp),则,这表明X的典型变量V1,.,Vp都是不相关的,Y的典型变量W1,.,Wp也都是不相关的;同时说明
9、Vi和Wj(ij)也是不相关的,而Vi和Wi是相关的,且相关系数为i.,其中,18,第十章10.1 总体典型相关典型相关变量的性质,性质(2):原始变量与典型变量的相关性 原始变量与典型变量之间的相关系数阵,也称为典型结构。令 V=(V1,.,Vp)=AX(A=(a1,ap),W=(W1,.Wp)=BY(B=(b1,bp),则 COV(X,V)=COV(X,AX)=11A,COV(X,W)=COV(X,BY)=12B,COV(Y,V)=COV(Y,AX)=21A,COV(Y,W)=COV(Y,BY)=22B.,19,第十章10.1 总体典型相关典型相关变量的性质,性质(3):设X和Y分别为p维
10、和q维随机向量,令X*=CX+d,Y*=GY+h;其中C为pp非退化阵,d为p1向量,G为qq非退化阵,h为q1的向量,则:X*和Y*的典型相关变量为(a*i)X*,(b*i)Y*,其中a*i=C-1ai,b*i=G-1bi(i=1,p)ai,bi是X和Y的第i对典型相关变量的系数.线性变换不改变相关性.即,(i=1,p),20,第十章10.1 总体典型相关例,已知标准化随机向量X=(X1,X2)和Y=(Y1,Y2)的相关阵R为,试求X,Y的典型相关变量和相关系数.解:,其中,21,第十章10.1 总体典型相关例,因,与,具有相同的特征值.且(1)2=42/(1+)(1+),2=0.M1 对应
11、于(1)2的单位特征向量为,22,第十章10.1 总体典型相关例,由上式求出c后,即得,类似可得,设a=(c,c)满足aR11a=1,或由下式得到:,23,第十章10.1 总体典型相关例,第一对典型相关变量为,24,第十章10.1 总体典型相关例,因|,这表明第一典型相关系数一般大于原来变量之间的相关系数:(Xi,Yj)=(i,j=1,2).,第一个典型相关系数为,25,第十章 10.1 总体典型相关例10.1.3,设Y是一个随机变量,X=(X1,Xq)是q-维随机向量(q 1),且已知,试计算Y与X这两组变量的第一对典型相关变量和第一个典型相关系数.,解:此例中第一组变量的个数p=1,第二组
12、变量的个数q1.这时1阶矩阵M1为,26,第十章 10.1 总体典型相关例10.1.3,显然M1的特征值为R2,对应的特征向量l=1.故第一典型相关系数1=R,且R就是Y与X的全相关系数.,设a满足:,由定理10.1.1,可知:,27,第十章 10.1 总体典型相关例10.1.3,第一对典型相关变量为,其中:,显然有:,28,第十章10.1 总体典型相关作业,练习1:试证明总体典型变量的 性质(3).习题十(P366-P368)10-1,,29,第十章10.2 样本典型相关,设总体Z=(X1,.,Xp,Y1,Yq).在实际问题中,总体的均值E(Z)=和协差阵D(Z)=通常是未知的,因而无法求得
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 多元 分析
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5723437.html