典型相关分析和协整.ppt
《典型相关分析和协整.ppt》由会员分享,可在线阅读,更多相关《典型相关分析和协整.ppt(118页珍藏版)》请在三一办公上搜索。
1、典型相关分析,2023/10/9,2,要 点,典型相关分析的数学表达方式,假定条件;典型相关系数的数学含义;典型变量系数的数学含义;简单相关,复相关和典型相关的意义;典型相关的应用,一、什么是典型相关分析及基本思想,通常情况下,为了研究两组变量 的相关关系,可以用最原始的方法,分别计算两组变量之间的全部相关系数,一共有pq个简单相关系数,这样又烦琐又不能抓住问题的本质。如果能够采用类似于主成分的思想,分别找出两组变量的各自的某个线性组合,讨论线性组合之间的相关关系,则更简捷。,在解决实际问题中,这种方法有广泛的应用。如,在工厂里常常要研究产品的q个质量指标 和P个原材料的指标 之间的相关关系;
2、也可以是采用典型相关分析来解决的问题。如果能够采用类似于主成分的思想,分别找出两组变量的线性组合既可以使变量个数简化,又可以达到分析相关性的目的。,例 家庭特征与家庭消费之间的关系,为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:,分析两组变量之间的关系。,变量间的相关系数矩阵,y2,y3,y1,x2,x1,典型相关分析的思想:,首先分别在每组变量中找出第一对线性组合,使其具有最大相关性,,2023/10/9,9,然后再在每组变量中找出第二对线性组合,使其分别与本组内的第一线性组合不相关,第二对本身具有次大的相关性。,u2和v2与u1和v1相互独立,但u2和v2相关。
3、如此继续下去,直至进行到r步,两组变量的相关性被提取完为止。rmin(p,q),可以得到r组变量。,二、典型相关的数学描述,考虑两组变量的向量,其协方差阵为,(一)想法,其中11是第一组变量的协方差矩阵;22是第二组变量的协方差矩阵;是X和Y的其协方差矩阵。,如果我们记两组变量的第一对线性组合为:,其中:,所以,典型相关分析就是求1和b1,使uv达到最大。,(二)典型相关系数和典型变量的求法,在约束条件:,下,求a1和b1,使uv达到最大。令,2023/10/9,13,利用柯西不等式有(参看式),2023/10/9,14,记m为12的秩,则,记为,相应的特征向量为,其余的零特征根对应的向量为,
4、2023/10/9,15,由特征向量可以构成一个正交矩阵T,有,2023/10/9,16,若取,则,2023/10/9,17,相应的特征向量为,a1和b1分别构成了第一组变量和第二组变量的第一对典型变量的系数。,2023/10/9,18,第一对典型相关变量提取了原始变量x组和y组之间相关的主要部分,那么这部分的信息不够,则还可以在剩余相关中提取第二对典型变量:,在以下的约束条件下:,2023/10/9,19,求,令,则,约束条件等价于,2023/10/9,20,2023/10/9,21,当取,这时uk和vk达到最大值k,称它为第k个典型相关系数,称ak和 bk为第k对典型变量系数。,2023/
5、10/9,22,相应的特征向量为,ak和bk分别构成了第一组变量和第二组变量的第k对典型变量的系数。,2023/10/9,23,注,有相同的特征根,而可以验证:,根据线性代数的思想,下列矩阵,2023/10/9,24,方法二 根据数学分析中条件极值的求法,引入Lagrange乘数,求极值问题,则可以转化为求,的极大值,其中和是 Lagrange乘数。,将上面的3式分别左乘 和,将 左乘(3)的第二式,得,并将第一式代入,得,的特征根是,相应的特征向量为,将 左乘(3)的第一式,并将第二式代入,得,的特征根是,相应的特征向量为,结论:既是M1又是M2的特征根,和 是相应于M1和M2的特征向量。,
6、至此,典型相关分析转化为求M1和M2特征根和特征向量的问题。,第一对典型变量提取了原始变量X与Y之间相关的主要部分,如果这部分还不能足以解释原始变量,可以在剩余的相关中再求出第二对典型变量和他们的典型相关系数。,在剩余的相关中再求出第二对典型变量和他们的典型相关系数。设第二对典型变量为:,在约束条件:,求使 达到最大的 和。,2023/10/9,30,例 家庭特征与家庭消费之间的关系,为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:,分析两组变量之间的关系。,2023/10/9,31,变量间的相关系数矩阵,三、典型变量的性质,1、同一组的典型变量之间互不相关,X组的典
7、型变量之间是相互独立的:,Y组的典型变量之间是相互独立的:,因为特征向量之间是正交的。故,2、不同组的典型变量之间相关性,不同组内一对典型变量之间的相关系数为:,2023/10/9,36,同对则协方差为i,不同对则为零。,3、原始变量与典型变量之间的相关系数,原始变量相关系数矩阵,X典型变量系数矩阵,y典型变量系数矩阵,2023/10/9,40,2023/10/9,42,2023/10/9,43,例 家庭特征与家庭消费之间的关系,为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:,分析两组变量之间的关系。,2023/10/9,44,变量间的相关系数矩阵,2023/10/
8、9,45,data xiaofei(type=corr);input _name_$x1 x2 y1-y3;_type_=corr;cards;x1 1 0.08 0.26 0.67 0.34x2 0.08 1 0.33 0.59 0.34y1 0.26 0.33 1 0.37 0.21y2 0.67 0.59 0.37 1 0.35y3 0.34 0.34 0.21 0.35 1;proc print data=xiaofei;run;proc cancorr data=xiaofei wprefix=w vprefix=v;with y1-y3;var x1-x2;run;,2023/10
9、/9,50,两个反映消费的指标与第一对典型变量中u1的相关系数分别为0.9866和0.8872,可以看出u1可以作为消费特性的指标,第一对典型变量中v1与Y2之间的相关系数为0.9822,可见典型变量v1主要代表了了家庭收入,u1和 v1的相关系数为0.6879,这就说明家庭的消费与一个家庭的收入之间其关系是很密切的;,第二对典型变量中u2与x2的相关系数为0.4614,可以看出u2可以作为文化消费特性的指标,第二对典型变量中v2与Y1和Y3之间的分别相关系数为0.8464和0.3013,可见典型变量v2主要代表了家庭成员的年龄特征和教育程度,u2和 v2的相关系数为0.1869,说明文化消费
10、与年龄和受教育程度之间的有关。,2023/10/9,52,4、各组原始变量被典型变量所解释的方差,X组原始变量被ui解释的方差比例,X组原始变量被vi解释的方差比例,y组原始变量被ui解释的方差比例,y组原始变量被vi解释的方差比例,2023/10/9,55,5、简单相关、复相关和典型相关之间的关系,若p1且q1,则x和y的典型相关就是简单相关;若p1或q1,则x和y的典型相关就是复相关;,2023/10/9,56,五、样本典型相关系数,在实际应用中,总体的协方差矩阵常常是未知的,类似于其他的统计分析方法,需要从总体中抽出一个样本,根据样本对总体的协方差或相关系数矩阵进行估计,然后利用估计得到
11、的协方差或相关系数矩阵进行分析。由于估计中抽样误差的存在,所以估计以后还需要进行有关的假设检验。,2023/10/9,57,1、假设有X组和Y组变量,样本容量为n。假设(X1,Y1),(X2,Y2),(Xn,Yn),观测值矩阵为:,2023/10/9,58,2023/10/9,59,2、计算特征根和特征向量 求M1和 M2的特征根,对应的特征向量。则特征向量构成典型变量的系数,特征根为典型变量相关系数的平方。,2023/10/9,60,六、典型相关系数的检验,典型相关分析是否恰当,应该取决于两组原变量之间是否相关,如果两组变量之间毫无相关性而言,则不应该作典型相关分析。用样本来估计总体的典型相
12、关系数是否有误,需要进行检验。,(一)整体检验,检验的统计量:,2023/10/9,61,所以,两边同时求行列式,有,事实上,2023/10/9,62,2023/10/9,63,由于 所以若M的特征根为,则(l-M)的特征根为(1-)。根据矩阵行列式与特征根的关系,可得:,相关系数越大,则,2023/10/9,64,在原假设为真的情况下,检验的统计量,近似服从自由度为pq的2分布。在给定的显著性水平下,如果22(pq),则拒绝原假设,认为至少第一对典型变量之间的相关性显著。,2023/10/9,65,依此类推,再检验下一对典型变量之间的相关性。直至相关性不显著为止。对两组变量x和y进行典型相关
13、分析,采用的也是一种降维技术。我们希望使用尽可能少的典型变量对数,为此需要对一些较小的典型相关系数是否为零进行假设检验。H0经检验被拒绝,则应进一步检验假设。,2023/10/9,66,若原假设H0被接受,则认为只有第二对典型变量是有用的;若原假设H0被拒绝,则认为第二对典型变量也是有用的,并进一步检验假设。,(二)部分总体典型相关系数为零的检验,2023/10/9,67,如此进行下去.直至对某个k,2023/10/9,68,检验的统计量,近似服从自由度为(p-k)(q-k)的2分布。在给定的显著性水平下,如果22(p-k)(q-k),则拒绝原假设,认为至少第k+1对典型变量之间的相关性显著。
14、,2023/10/9,69,可见,前面两对典型变量的相关性是很强的。,2023/10/9,70,职业满意度典型相关分析,某调查公司从一个大型零售公司随机调查了784人,测量了5个职业特性指标和7个职业满意变量。讨论 两组指标之间是否相联系。X组:Y组:X1用户反馈 Y1主管满意度X2任务重要性 Y2事业前景满意度X3任务多样性 Y3财政满意度X4任务特殊性 Y4工作强度满意度X5自主权 Y5公司地位满意度 Y6工作满意度 Y7总体满意度,2023/10/9,71,2023/10/9,72,Canonical Correlation Analysis,2023/10/9,73,当前和后面的典型相
15、关系数均为零的检验,2023/10/9,74,X组的典型变量,2023/10/9,75,Y组的典型变量,2023/10/9,76,原始变量与本组典型变量之间的相关系数,2023/10/9,77,原始变量与对应组典型变量之间的相关系数,2023/10/9,78,可以看出,所有五个表示职业特性的变量与u1有大致相同的相关系数,u1视为形容职业特性的指标。第一对典型变量的第二个成员v1与Y1,Y2,Y5,Y6有较大的相关系数,说明v1主要代表了主管满意度,事业前景满意度,公司地位满意度和工种满意度。而u1和v1之间的相关系数0.5537。,2023/10/9,79,Canonical Redunda
16、ncy Analysis Raw Variance of the VAR Variables Explained by Their Own The Opposite Canonical Variables Canonical Variables Cumulative Cumulative Proportion Proportion Proportion Proportion 1 0.5818 0.5818 0.1784 0.1784 2 0.1080 0.6898 0.0060 0.1844 3 0.0960 0.7858 0.0014 0.1858 4 0.1223 0.9081 0.000
17、6 0.1864 5 0.0919 1.0000 0.0003 0.1867 Raw Variance of the WITH Variables Explained by Their Own The Opposite Canonical Variables Canonical Variables Cumulative Cumulative Proportion Proportion Proportion Proportion 1 0.3721 0.3721 0.1141 0.1141 2 0.1222 0.4943 0.0068 0.1209 3 0.0740 0.5683 0.0011 0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 典型 相关 分析 和协
链接地址:https://www.31ppt.com/p-6243495.html