多元线性回归-多重共线性.ppt
《多元线性回归-多重共线性.ppt》由会员分享,可在线阅读,更多相关《多元线性回归-多重共线性.ppt(49页珍藏版)》请在三一办公上搜索。
1、1,多重共线性,2,引子:发展农业和建筑业会减少财政收入吗?,为了分析各主要因素对财政收入的影响,建立财政收入模型:其中:CS财政收入(亿元);NZ农业增加值(亿元);GZ工业增加值(亿元);JZZ建筑业增加值(亿元);TPOP总人口(万人);CUM最终消费(亿元);SZM受灾面积(万公顷)数据样本时期1978年-2003年(资料来源:中国统计年鉴2004,中国统计出版社2004年)采用普通最小二乘法得到以下估计结果,3,财政收入模型的结果,4,可决系数为0.995,校正的可决系数为0.993,模型拟合很好。模型对财政收入的解释程度高达99.5%。F统计量为632.10,说明0.05水平下回归
2、方程整体上显著。t 检验结果表明,除了工业增加值和总人口以外,其他因素对财政收入的影响均不显著。农业增加值和建筑业增加值的回归系数是负数。农业和建筑业的发展反而会使财政收入减少吗?!这样的异常结果显然与理论分析和实践经验不相符。若模型设定和数据真实性没问题,问题出在哪里呢?,模型估计与检验结果分析,5,多重共线性,讨论四个问题:什么是多重共线性 多重共线性产生的后果 多重共线性的检验 多重共线性的补救措施,6,一、什么是多重共线性,基本内容:多重共线性的含义 产生多重共线性的背景,7,1、多重共线性的含义,对于模型 i=1,2,n其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之
3、间出现了相关性,则称为多重共线性包括完全多重共线性和不完全多重共线性,8,完全的多重共线性:在计量经济学中所谓的多重共线性(Multi-Collinearity),不仅包括完全的多重共线性,还包括不完全的多重共线性。对于解释变量,如果存在不全为0的 数,使得 则称解释变量 之间存在着完全的多重 共线性。,9,当 时,表明在数据矩阵 中,至少有一个列向量可以用其余的列向量线性表示,则说明存在完全的多重共线性。矩阵表示为,10,不完全的多重共线性,实际中,常见的情形是解释变量之间存在不完全的多重共线性。,11,无多重共线性,如果解释变量之间不存在上述关系,则称解释变量之间无多重共线性此时:注意:个
4、解释变量不存在多重共线性(线性相关)并不能说明它们之间无关,不存在非线性关系,12,,解释变量间毫无线性关系,变量间相互正交。这时已不需要作多元回归,每个参数j都可以通过Y 对 Xj 的一元回归来估计。,13,2、产生多重共线性的原因,1)经济变量之间往往存在同方向的变化趋势。当他们被引入同一个模型成为解释变量时,会出现多重共线性2)模型中包含滞后变量,变量各期值之间有可能高度相关。3)利用截面数据建立模型也可能出现多重共线性。4)经济变量之间往往存在着密切的内在关联度,要素之间互相制约,互相依存。5)样本数据自身的原因,数据收集的范围过窄,造成某些解释变量之间似乎有相同或相反变化趋势的假象。
5、6)在建模过程中由于解释变量选择不当,引起变量之间的多重共线性注:解释变量之间的多重共线性不可避免,只可能使多重共线性的程度尽可能地减弱,14,二、多重共线性产生的后果,基本内容:完全多重共线性产生的后果 不完全多重共线性产生的后果,15,1、完全多重共线性产生的后果,16,1)参数的估计值不确定当解释变量完全线性相关时 OLS 估计式不确定 从偏回归系数意义看:在 和 完全共线性时,无法保持 不变,去单独考虑 对 的影响(和 的影响不可区分)从OLS估计式看:可以证明此时2)参数估计值的方差无限大OLS估计式的方差成为无穷大:,17,2、不完全多重共线性产生的后果,18,如果模型中存在不完全
6、的多重共线性,可以得到参数的估计值,但是对计量经济分析可能会产生一系列的影响。1)参数估计值的方差增大为对其他解释变量做辅助回归模型的决定系数其中:称为方差膨胀因子当与其他解释变量存在严重的多重共线性时:,19,2)对参数区间估计时,置信区间趋于变大区间估计失去可靠性;预测区间变大,降低预测精度3)假设检验容易作出错误的判断,检验的可靠性降低,可能导致在假设检验中舍去重要的解释变量因为:回归参数显著性检验,20,4)可能造成可决系数较高,但对各个参数单独的 t 检验却可能不显著,甚至可能使估计的回归系数符号相反,得出完全错误的结论。无法正确反映每个解释变量对被解释变量的单独影响。5)回归模型缺
7、乏稳定性当样本观测数据发生微小变化时,模型参数的估计值会有很大的变化(氏检验),21,三、多重共线性的检验,基本内容:简单相关系数检验法 方差扩大(膨胀)因子法 直观判断法 逐步回归法,22,1、简单相关系数检验法,含义:简单相关系数检验法是利用解释变量之间的线性相关程度去判断是否存在严重多重共线性的一种简便方法。判断规则:一般而言,如果每两个解释变量的简单相关系数(零阶相关系数)比较高,例如大于0.8,则可认为存在着较严重的多重共线性。,23,Klein判别公式:,24,注意:1)较高的简单相关系数只是多重共线性存在的充分条件,而不是必要条件。2)只适用于两个解释变量之间存在线性相关检验,对
8、于三个或更多的解释变量之间存在的线性相关关系不适用 3)相关系数很大则必存在多重共线性,而相关系数很小却未必没有多重共线性.特别是在多于两个解释变量的回归模型中,有时较低的简单相关系数也可能存在多重共线性。因此并不能简单地依据相关系数进行多重共线性的准确判断。,25,2、辅助回归检验法,26,3、方差扩大(膨胀)因子法,27,经验规则,方差膨胀因子越大,表明解释变量之间的多重共性越严重。反过来,方差膨胀因子越接近于1,多重共线性越弱。经验表明,方差膨胀因子10时,说明解释变量与其余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计。,28,4、直观判断法,根据回归结果
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 线性 回归 多重
链接地址:https://www.31ppt.com/p-6382279.html