多重线性回归课件.ppt
《多重线性回归课件.ppt》由会员分享,可在线阅读,更多相关《多重线性回归课件.ppt(53页珍藏版)》请在三一办公上搜索。
1、多重线性回归分析,一、方法简介,1.2 概念 用回归方程定量地刻画一个因变量与多个自变量之间的线性依存关系,称为多重线性回归分析(multiple linear regression analysis)。自变量是相互独立的连续型变量或分类变量。,2,一、方法简介,1.3 数据结构 表1 进行多重线性回归分析资料的数据结构,3,二、基本原理,2.1 原理简介 多重线性回归模型:Y=b0+b1X1+b2X2+bkXk+e 其中,bj(j=0,1,2,k)为未知参数,e为随机误差项。,4,5,二、基本原理,2.1 原理简介 多重线性回归模型中包含多个自变量,它们同时对因变量Y 发生作用。若要考察一个
2、自变量对Y 的影响,就必须假设其他自变量保持不变。,6,二、基本原理,2.1 原理简介 因此,多重线性回归模型中的回归系数为偏回归系数。它反映的是当模型中的其他自变量不变时,其中一个自变量对因变量Y 的均值的影响。,7,二、基本原理,2.2 前提条件 多重线性回归分析要求资料满足线性(Linear)、独立性(Independence)、正态性(Normality)和方差齐性(Equal variance)。除此之外,还要求多个自变量之间相关性不要太强。,8,二、基本原理,2.2 前提条件线性指自变量与因变量之间的关系是线性的独立性指各观测值之间是相互独立的正态性指自变量取不同值时,因变量服从正
3、 态分布方差齐性指自变量取不同值时,因变量的方 差相等,三、分析步骤,1.基本任务 求出模型中参数的估计值,对模型和参数进行假设检验;对自变量进行共线性诊断,对观测值进行异常点诊断;结合统计学知识和专业知识,对回归方程进行合理的解释,并加以应用。,9,三、分析步骤,2.具体步骤2.1 回归参数估计 多重线性回归分析的参数估计,常采用最小二乘法(OLS)进行。该方法使残差平方和达到最小,从而得出模型参数估计值 表示Y的估计值,10,三、分析步骤,2.具体步骤2.2 模型检验 根据方差分析的思想,将总的离均差平方和SS总分解为回归平方和SS回和残差平方和SS残两部分。SS总的自由度为n-1,SS回
4、的自由度为k,SS残的自由度为n-k-1。,11,三、分析步骤,2.具体步骤2.2 模型检验,12,三、分析步骤,2.具体步骤2.2 模型检验 模型的显著性检验步骤为:第一步,建立检验假设。H0:b1=b2=bk=0H1:b1,b2,bk不同时为0,13,三、分析步骤,2.具体步骤2.2 模型检验 第二步,计算统计量F的值。,14,三、分析步骤,2.具体步骤2.2 模型检验 第三步,确定P值,下统计学结论。根据检验统计量F的值和自由度,确定其对应的P值。若Pa,则接受H0,认为回归模型的系数全部为0;若Pa,则拒绝H0,接受H1,认为回归模型的系数不全为0。,15,三、分析步骤,2.具体步骤2
5、.3 参数检验 回归方程有统计学意义,可以说明整体上自变量对Y 有影响,但并不意味着每个自变量对因变量的影响都有统计学意义。,16,三、分析步骤,2.具体步骤2.3 参数检验 考察各个自变量对因变量的影响,即检验其系数是否为0。若某自变量对因变量的影响无统计学意义,可将其从模型中删除,重新建立回归方程。,17,三、分析步骤,2.具体步骤2.3 参数检验 对自变量Xi的系数是否为0进行假设检验,步骤为:第一步,建立检验假设。H0:bi=0H1:bi0,18,三、分析步骤,2.具体步骤2.3 参数检验第二步,计算检验统计量。,19,三、分析步骤,2.具体步骤2.3 参数检验第三步,确定P值。根据自
6、由度和临界水平,查t分布表,可得双侧界值为ta/2(n-k-1)。,20,三、分析步骤,2.具体步骤2.3 参数检验 若t ta/2(n-k-1)或t-ta/2(n-k-1),则Pa。此时,拒绝H0,接受H1,认为该回归系数不等于0。反之,则接受H0,认为该回归系数为0。,21,三、分析步骤,2.具体步骤2.4 变量筛选 由例1的分析结果可知,不是所有的自变量对因变量的作用都有统计学意义。故需要找到一个较好的回归方程,使之满足:方程内的自变量对回归都有统计学意义,方程外的自变量对回归都无统计学意义。,22,三、分析步骤,2.具体步骤2.4 变量筛选 这就是自变量的选择问题,或称为变量筛选。选择
7、时,一要尽可能地不漏掉重要的自变量;二要尽可能地减少自变量的个数,保持模型的精简。,23,三、分析步骤,2.具体步骤2.4 变量筛选 常用的变量筛选方法有以下8种:前进法 后退法 逐步回归法 最大R2增量法 最小R2增量法 R2选择法 修正R2选择法 Mallows Cp选择法,24,三、分析步骤,2.4.1 前进法(FORWARD)回归方程中变量从无到有依次选择一个自变量进入回归方程,并计算该变量对应的F统计量及P值。当P小于纳入标准(规定的选变量进入方程的临界水平),则该变量入选,否则不能入选。,25,三、分析步骤,2.4.1 前进法 当回归方程中变量少时某变量不符合入选标准,但随着回归方
8、程中变量逐次增多时,该变量就可能符合入选标准;这样直到没有变量可入选为止。具体而言,是从仅含常数项(即截距项)的最简单模型开始,逐步在模型中添加自变量。,26,三、分析步骤,2.4.1 前进法 局限性:纳入标准取值小时,可能没有一个变量能入选;纳入标准取值大时,开始选入的变量后来在新条件下不再进行检验,因而不能剔除后来变得无统计学意义的变量。,27,三、分析步骤,2.4.2 后退法(BACKWARD)从模型中包含全部自变量开始,计算留在回归方程中的各个自变量所产生的F统计量和P值,当P值小于排除标准(规定的从方程中剔除变量的临界水准)则将此变量保留在方程中。,28,三、分析步骤,2.4.2 后
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多重 线性 回归 课件

链接地址:https://www.31ppt.com/p-3852876.html