欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    多重线回归与相关.ppt

    • 资源ID:6456759       资源大小:652.50KB        全文页数:43页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    多重线回归与相关.ppt

    第13章 多重线性回归与相关,(multiple linear regression&multiple correlation),content,第一节 多重线性回归的概念与统计推断第二节 假设检验及其评价第三节 复相关系数与偏相关系数第四节自变量筛选第五节 多元线性回归的应用与注意事项,目的:作出以多个自变量估计应变量的多元线性回归方程。资料:应变量为定量指标;自变量全部或大部分为定量指标,若有少量定性或等级指标需作转换。用途:解释和预报。更精确意义:由于事物间的联系常常是多方面的,一个应变量的变化可能受到其它多个自变量的影响,如糖尿病人的血糖变化可能受胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂等多种生化指标的影响。,第一节 多重线性回归的概念与统计推断,变量:应变量 1 个,自变量k 个,共 k+1 个。样本含量:n数据格式见表13-1回归模型一般形式:,一、数据与多元线性回归模型,多元回归分析数据格式,条件,一般步骤,建立回归方程(样本),(2)检验并评价回归方程及各自变量的作用大小,二、多元线性回归方程的建立,样本估计而得的多重线性回归方程bj为自变量Xj 的偏回归系数(partial regression coefficient),是j的估计值,表示当方程中其他自变量保持常量时,自变量Xj变化一个计量单位,反应变量Y的平均值变化的单位数。,求偏导数(一阶),原 理最小二乘法,统计软件包,第二节 假设检验及其评价,1.方差分析法:,(一)对回归方程,多元线性回归方差分析表,表13-2显示,P 0.0001,拒绝H0。说明从整体上而言,用这四个自变量构成的回归方程解释空气中NO浓度的变化是有统计学意义的。,偏回归系数的t检验,偏回归系数的t检验是在回归方程具有统计学意义的情况下,检验某个总体偏回归系数等于零的假设,以判断是否相应的那个自变量对回归确有贡献,利用SAS对例13-1的四个偏回归系数进行t检验与标准化偏回归系数的结果如表13-3所示。,第三节 复相关系数与偏相关系数,确定系数、复相关系数与调整确定系数,复相关系数的平方称为确定系数(coefficient of determination),或决定系数,记为R2,用以反映线性回归模型能在多大程度上解释反应变量Y的变异性。其定义为,复相关系数:确定系数的算术平方根,对例13-1,由方差分析表可得:SSR=0.06396 SSE=0.01727 SST=0.08123,表示变量Y与k个自变量(X1,X2,Xk)的线性相关的密切程度。,说明,用包含气车流量、气温、气湿与风速这四个自变量的回归方程可解释交通点空气NO浓度变异性的78.74%。,表示交通点空气NO浓度与气车流量、气温、气湿与风速等四个变量的复相关系数为0.8703,调整的R2(Adjusted R-Square)当回归方程中包含有很多自变量,即使其中有一些自变量(如本例中的X3)对解释反应变量变异的贡献极小,随着回归方程的自变量的增加,R2 值表现为只增不减,这是复相关系数R2的缺点。调整的R2定义为,偏相关系数,偏相关系数(partial correlation coefficient):一般地,扣除其他变量的影响后,变量Y与X的相关.,表13-5 空气中NO浓度与各自变量的相关系数和偏相关系数,(二)对各自变量 指明方程中的每一个自变量对Y的影响(即方差分析和决定系数检验整体)。,1.偏回归平方和,各自变量的偏回归平方和可以通过拟合包含不同自变量的回归方程计算得到,结果,2.t 检验法 是一种与偏回归平方和检验完全等价的一种方法。计算公式为,结 论,标准化回归系数 变量标准化是将原始数据减去相应变量的均数,然后再除以该变量的标准差。,计算得到的回归方程称作标准化回归方程,相应的回归系数即为标准化回归系数。,注意:一般回归系数有单位,用来解释各自变量对应变量的影响,表示在其它自变量保持不变时,增加或减少一个单位时Y的平均变化量。不能用各 来比较各 对 的影响大小。标准化回归系数无单位,用来比较各自变量对应变量的影响大小,越大,对 的影响越大。,第四节自变量筛选,目的:使得预报和(或)解释效果好,自变量筛选的标准与原则,1.残差平方和(SSE)缩小与确定系数(R2)增大2.残差均方(SSE)缩小与调整确定系数增大3.CP统计量 选择既具有较小CP值,在图中又接近于CP=q直线的模型作为“最优”的准则,全局择优法,目的:预报效果好意义:对自变量各种不同的组合所建立 的回归方程进行比较 择优。选择方法:,逐步选择法,1.,1.前进法,回归方程中的自变量从无到有、从少到多逐个引入回归方程。这种选择自变量的方法基于残差均方缩小的准则,不一定能保证“最优”.此法已基本淘汰。2.后退法,先将全部自变量选入方程,然后逐步剔除无统计学意义的自变量。剔除自变量的方法是在方程中选一个偏回归平方和最小的变量,作F检验决定它是否剔除,若无统计学意义则将其剔除,然后对剩余的自变量建立新的回归方程。重复这一过程,直至方程中所有的自变量都不能剔除为止。理论上最好,建议使用采用此法。3.逐步回归法,逐步回归法是在前述两种方法的基础上,进行双向筛选的一种方法。该方法本质上是前进法。,第五节 多元线性回归的应用与注意事项,多元线性回归的应用,多元线性回归应用的注意事项,1、非同质资料的合并问题 斜率相同(同质):可以利用男、女合并的资料拟合共同的回归模型;不同质:此时应按不同性别分别拟合回归模型。2、指标的数量化,3、样本含量:n=(510)m。4、关于逐步回归:对逐步回归得到的结果不要盲目的信任,所谓的“最优”回归方程并不一定是最好的,没有选入方程的变量也未必没有统计学意义。例如,例15-3中若将选入标准和剔除标准定为 和,选入的变量是,而不是,结果发生了改变。不同回归方程适应于不同用途,依专业知识定。,5、多重共线性 即指一些自变量之间存在较强的线性关系。如高血压与年龄、吸烟年限、饮白酒年限等,这些自变量通常是高度相关的,有可能使通过最小二乘法建立回归方程失效,引起下列一些不良后果:(1)参数估计值的标准误变得很大,从而t值变得很小。(2)回归方程不稳定,增加或减少某几个观察值,估计值可能会发生很大的变化。(3)t检验不准确,误将应保留在模型中的重要变量舍弃。(4)估计值的正负符号与客观实际不一致。,消除多重共线性:剔除某个造成共线性的自变量,重建回归方程;合并自变量,采用逐步回归方法。,

    注意事项

    本文(多重线回归与相关.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开