多元统计典型相关分析.ppt
《多元统计典型相关分析.ppt》由会员分享,可在线阅读,更多相关《多元统计典型相关分析.ppt(54页珍藏版)》请在三一办公上搜索。
1、多元统计分析,典型相关分析及应用,研究多个变量与多个变量之间的相关性,典型相关分析,典型相关分析基本理论,典型相关分析求解方法,典型相关系数的假设检验,典型相关分析在SPSS中的运用,统计思想和基本理论,典型相关分析(Canonical Correlation Analysis)是研究两组变量之间相关关系的一种多元计方法。它能够揭示出两组变之间的内在联系。也是一种运用于多元统计中的降维技术。其目的是识别并量化两组变量之间的联系,将两组变量相关关系的分析,转化为一组变量的线性组合与另一组变量线性组合之间的相关关系分析。,统计思想和基本理论,典型相关分析最早由1936年霍特林 Hotelling在
2、生物统计上发表的论文两组变量之间的关系提出,其计算方法后经过多年的应用日趋完善。,哈罗德霍特林(HaroldHotelling,18951973):统计学界、经济学界、数学界公认大师,典型相关分析相关实例,典型相关分析的应用十分广泛。例如,典型相关分析相关实例,再如考察一些与财政政策有关的指标-如财政支出总额的增长率,财政赤字增长率,税率降低,和与经济发展的一系列指标如国内GDP增长率,就业增长率,物价上涨率等,来研究扩张性财政政策实施后对宏观经济发展的影响.,典型相关分析求解方法,一元统计分析:用相关系数来衡量两个随机变量之间的线性相关关系;用复相关系数研究一个随机变量和多个随机变量的线性相
3、关关系。Q:遇到比较两组变量的相关性问题,怎么办?多元统计分析:运用典型相关分析研究两组变量x1,x2xp 与 y1,y2yq之间的线性关系,将每一组变量作为一个整体进行分析。两组变量间的相关关系。,典型相关分析求解方法,典型相关分析通常可采取两种方法:方法1 讨论第一组每个变量和第二组每个变量的相互关系,得到pq个相关系数,再用这些相关系数反应两组变量的关系。BUT。在两组变量较多时,方法繁琐也不容易抓到问题实际。,简单相关系数的局限性,只是孤立考虑单个X与单个Y间的相关,没有考虑X、Y变量组内部各变量间的相关。两组间有许多简单相关系数(例每组30个变量),使问题显得复杂,难以从整体描述。难
4、以抓到重点,-用来描述两个变量的之间的线性相关性。,典型相关分析求解方法,方法2 在每组变量中选择若干个由代表性的综合指标,这些指标是原始变量的线性组合,代表了原始变量的大部分信息,且两组综合指标的相关程度最大。(类似于主成分分析法)新产生的综合指标成为典型相关变量 Canonical Variable,通过少数的几个综合变量来反应两组变量的相关性质。方法2更为简洁直接 典型相关分析的中心思想。,典型相关分析的基本思想,首先在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。然后选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此继续下去
5、,直到两组变量之间的相关性被提取完毕为此。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。典型相关系数度量了这两组变量之间联系的强度。,典型相关分析的基本思想,一般情况,设为两个相互关联的随机向量,分别在两组变量中选取若干有代表性的综合变量Ui、Vi,使得每一个综合变量是原变量的线性组合,即,典型相关分析的基本思想,与,典型相关分析的基本思想,典型相关分析的基本思想,第一步:估计组合系数使得对应的典型变量和相关系数达到最大。最大的相关系数为第一典型相关系数,且称有最大相关系数的这对典型变量为典型相关变量。第二步:再次估计组合相关系数,找出第二大的典型相关系数,称为第二典型相关
6、西湖,称有第二大相关系数的这对典型变量为第二典型相关变量。设两组的变量个数为p,q,pq,那么寻求典型变量的过程可一直重复,直到得到P对典型变量。,典型相关分析的基本思想,当有少数几对或者一对典型变量能够反映原数据的主要信息,那么两个变量组的相关程度的分析就可以转化为对少数几对,或者对一对典型变量的相关分析,这就是典型相关分析的基本目的。,典型相关分析与主成分分析,典型相关分析在某些方面与主成分分析类似,但并不完全相同。二者均是通过构造原变量的适当线性组合提取不同信息,主成分分析着眼于考虑变量的“分散性”信息,考虑的是一组变量内部各个变量直接的相关关系。而典型相关分析则立足于识别和量化二组变量
7、的统计相关性,是两个随机变量之间的相关性在两组变量之下的推广。,典型相关分析求解方法,例 1985年中国28 省市城市男生(1922岁)的调查数据。记形态指标身高(cm)、坐高、体重(kg)、胸围、肩宽、盆骨宽分别为X1,X2,X6;机能指标脉搏(次/分)、收缩压(mmHg)、舒张压(变音)、舒张压(消音)、肺活量(ml)分别为Y1,Y2,Y5。现欲研究这两组变量之间的相关性。,简单相关系数矩阵,Corr(X)R11,Corr(X)R11,Corr(X)R11,Corr(Y)R22,典型相关系数和典型变量的求法,在约束条件:,下,求a1和b1,使uv达到最大。令,23,根据数学分析中条件极值的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计 典型 相关 分析

链接地址:https://www.31ppt.com/p-6456434.html