欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    多元统计典型相关分析.ppt

    • 资源ID:6456434       资源大小:1.36MB        全文页数:54页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    多元统计典型相关分析.ppt

    多元统计分析,典型相关分析及应用,研究多个变量与多个变量之间的相关性,典型相关分析,典型相关分析基本理论,典型相关分析求解方法,典型相关系数的假设检验,典型相关分析在SPSS中的运用,统计思想和基本理论,典型相关分析(Canonical Correlation Analysis)是研究两组变量之间相关关系的一种多元计方法。它能够揭示出两组变之间的内在联系。也是一种运用于多元统计中的降维技术。其目的是识别并量化两组变量之间的联系,将两组变量相关关系的分析,转化为一组变量的线性组合与另一组变量线性组合之间的相关关系分析。,统计思想和基本理论,典型相关分析最早由1936年霍特林 Hotelling在生物统计上发表的论文两组变量之间的关系提出,其计算方法后经过多年的应用日趋完善。,哈罗德霍特林(HaroldHotelling,18951973):统计学界、经济学界、数学界公认大师,典型相关分析相关实例,典型相关分析的应用十分广泛。例如,典型相关分析相关实例,再如考察一些与财政政策有关的指标-如财政支出总额的增长率,财政赤字增长率,税率降低,和与经济发展的一系列指标如国内GDP增长率,就业增长率,物价上涨率等,来研究扩张性财政政策实施后对宏观经济发展的影响.,典型相关分析求解方法,一元统计分析:用相关系数来衡量两个随机变量之间的线性相关关系;用复相关系数研究一个随机变量和多个随机变量的线性相关关系。Q:遇到比较两组变量的相关性问题,怎么办?多元统计分析:运用典型相关分析研究两组变量x1,x2xp 与 y1,y2yq之间的线性关系,将每一组变量作为一个整体进行分析。两组变量间的相关关系。,典型相关分析求解方法,典型相关分析通常可采取两种方法:方法1 讨论第一组每个变量和第二组每个变量的相互关系,得到pq个相关系数,再用这些相关系数反应两组变量的关系。BUT。在两组变量较多时,方法繁琐也不容易抓到问题实际。,简单相关系数的局限性,只是孤立考虑单个X与单个Y间的相关,没有考虑X、Y变量组内部各变量间的相关。两组间有许多简单相关系数(例每组30个变量),使问题显得复杂,难以从整体描述。难以抓到重点,-用来描述两个变量的之间的线性相关性。,典型相关分析求解方法,方法2 在每组变量中选择若干个由代表性的综合指标,这些指标是原始变量的线性组合,代表了原始变量的大部分信息,且两组综合指标的相关程度最大。(类似于主成分分析法)新产生的综合指标成为典型相关变量 Canonical Variable,通过少数的几个综合变量来反应两组变量的相关性质。方法2更为简洁直接 典型相关分析的中心思想。,典型相关分析的基本思想,首先在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。然后选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此继续下去,直到两组变量之间的相关性被提取完毕为此。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。典型相关系数度量了这两组变量之间联系的强度。,典型相关分析的基本思想,一般情况,设为两个相互关联的随机向量,分别在两组变量中选取若干有代表性的综合变量Ui、Vi,使得每一个综合变量是原变量的线性组合,即,典型相关分析的基本思想,与,典型相关分析的基本思想,典型相关分析的基本思想,第一步:估计组合系数使得对应的典型变量和相关系数达到最大。最大的相关系数为第一典型相关系数,且称有最大相关系数的这对典型变量为典型相关变量。第二步:再次估计组合相关系数,找出第二大的典型相关系数,称为第二典型相关西湖,称有第二大相关系数的这对典型变量为第二典型相关变量。设两组的变量个数为p,q,pq,那么寻求典型变量的过程可一直重复,直到得到P对典型变量。,典型相关分析的基本思想,当有少数几对或者一对典型变量能够反映原数据的主要信息,那么两个变量组的相关程度的分析就可以转化为对少数几对,或者对一对典型变量的相关分析,这就是典型相关分析的基本目的。,典型相关分析与主成分分析,典型相关分析在某些方面与主成分分析类似,但并不完全相同。二者均是通过构造原变量的适当线性组合提取不同信息,主成分分析着眼于考虑变量的“分散性”信息,考虑的是一组变量内部各个变量直接的相关关系。而典型相关分析则立足于识别和量化二组变量的统计相关性,是两个随机变量之间的相关性在两组变量之下的推广。,典型相关分析求解方法,例 1985年中国28 省市城市男生(1922岁)的调查数据。记形态指标身高(cm)、坐高、体重(kg)、胸围、肩宽、盆骨宽分别为X1,X2,X6;机能指标脉搏(次/分)、收缩压(mmHg)、舒张压(变音)、舒张压(消音)、肺活量(ml)分别为Y1,Y2,Y5。现欲研究这两组变量之间的相关性。,简单相关系数矩阵,Corr(X)R11,Corr(X)R11,Corr(X)R11,Corr(Y)R22,典型相关系数和典型变量的求法,在约束条件:,下,求a1和b1,使uv达到最大。令,23,根据数学分析中条件极值的求法,引入Lagrange乘数,求极值问题,则可以转化为求,的极大值,其中和是 Lagrange乘数。,将上面的3式分别左乘 和,由(3)式的第二式,得,代入(3)式的第一式,得,的特征根是,相应的特征向量为,由(3)式的第一式,得,代入(3)式的第二式,得,的特征根是,相应的特征向量为,结论:既是M1又是M2的特征根,和 是相应于M1和M2的特征向量。,至此,典型相关分析转化为求M1和M2特征根和特征向量的问题。,第一对典型变量提取了原始变量X与Y之间相关的主要部分,如果这部分还不能足以解释原始变量,可以在剩余的相关中再求出第二对典型变量和他们的典型相关系数。,在剩余的相关中再求出第二对典型变量和他们的典型相关系数。设第二对典型变量为:,在约束条件:,求使 达到最大的 和。,例 Text book p 277,典型相关系数的假设检验,全部总体典型相关系数均为0部分总体典型相关系数为0,30,例 家庭特征与家庭消费之间的关系,为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:,分析两组变量之间的关系。,31,变量间的相关系数矩阵,36,两个反映消费的指标与第一对典型变量中u1的相关系数分别为0.9866和0.8872,可以看出u1可以作为消费特性的指标,第一对典型变量中v1与Y2之间的相关系数为0.9822,可见典型变量v1主要代表了了家庭收入,u1和 v1的相关系数为0.6879,这就说明家庭的消费与一个家庭的收入之间其关系是很密切的;,第二对典型变量中u2与x2的相关系数为0.4614,可以看出u2可以作为文化消费特性的指标,第二对典型变量中v2与Y1和Y3之间的分别相关系数为0.8464和0.3013,可见典型变量v2主要代表了家庭成员的年龄特征和教育程度,u2和 v2的相关系数为0.1869,说明文化消费与年龄和受教育程度之间的相关性。,38,4、各组原始变量被典型变量所解释的方差,X组原始变量被ui解释的方差比例,X组原始变量被vi解释的方差比例,y组原始变量被ui解释的方差比例,y组原始变量被vi解释的方差比例,典型相关分析在SPSS中的运用,(一)操作步骤在SPSS中没有提供典型相关分析的专门菜单项,要想利用SPSS实现典型相关分析,必须在语句窗口中调用SPSS的 Canonical correlation.sps 宏。具体方法如下:1.按FileNewSyntax的顺序新建一个语句窗口。在语句窗口中输入下面的语句:INCLUDE(路径)/Canonical correlation.sps.CANCORR SET1=x1 x2 x3 x4/SET2=y1 y2 y3/.,典型相关分析在SPSS中的运用,2.点击语句窗口Run菜单中的All子菜单项,运行典型相关宏命令,得出结果。,典型相关分析求解方法,典型相关分析在SPSS中的运用,(二)主要运行结果解释1.Correlations for Set-1、Correlations for Set-2、Correlations Between Set-1 and Set-2(分别给出 两组变量内部以及两组变量之间的相关系数矩阵)2.Canonical Correlations(给出典型相关系数),3.Test that remaining correlations are zero(给出典 型相关的显著性检验),4.Raw Canonical Coefficients(分别给出两组典型变量的未标准化系数)5.Standardized Canonical Coefficients(分别给出两组典型变量的标准化系数),7.Redundancy Analysis(分别给出两组典型变量的冗余分析),6.Canonical Loadings for Set-1,2(分别给出两组数据中的典型载荷包括交叉载荷,典型载荷是衡量原始变量与典型变量的相关程度的指标。,典型相关分析在SPSS中的运用,例2,第277页SPSS算法(1952)关于典型相关的经典例子进行分析,列举了25个家庭的成年长子和次子的头长和头宽。利用典型相关分析法分析长子和次子头型的相关性。,典型相关分析求解方法,典型相关分析在SPSS中的运用,典型相关分析求解方法,典型相关分析在SPSS中的运用,典型相关分析求解方法,典型相关分析在SPSS中的运用,SPSS操作步骤1.按FileNewSyntax的顺序新建一个语句窗口。在语句窗口中输入下面的语句:INCLUDE Canonical correlation.sps.CANCORR SET1=x1 x2/SET2=y1 y2/.2.点击语句窗口Run菜单中的All子菜单项,运行典型相关宏命令,得出结果。,典型相关分析求解方法,典型相关分析在SPSS中的运用,主要运行结果解释1.典型相关系数和典型相关的显著性检验从下表可以看出,两队典型变量中,第一对的典型相关系数达到0.788,属于强相关,而第二对典型变量的相关则比较弱。在之后的显著性检验的结果在0.05的显著性水平下,只有第一对典型相关是显著的。,典型相关分析求解方法,典型相关分析求解方法,典型相关分析求解方法,典型相关分析求解方法,典型相关分析求解方法,冗余分析 以原变量与典型变量间相关为基础。通过计算X、Y 变量组由自己的典型变量解释与由对方的典型变量解释的方差百分比与累计百分比,反映由典型变量预测原变量的程度。在我们的例子中,长子的头型变量被自身的第一典型变量解释了86.7%,次子的头型变量被自身的第一典型变量解释了91.8%。,

    注意事项

    本文(多元统计典型相关分析.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开