【教学课件】第6章多重共线性.ppt
《【教学课件】第6章多重共线性.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第6章多重共线性.ppt(62页珍藏版)》请在三一办公上搜索。
1、第6章 多重共线性,Multi-Collinearity,一、多重共线性的概念 二、多重共线性的原因 三、多重共线性的后果 四、多重共线性的检验 五、多重共线性的解决办法 六、案例,第6章 多重共线性,一、多重共线性的概念,对于多元线性回归模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n其基本假设之一是解释变量是互相独立的。,如果某两个或多个解释变量之间出现了相关性,则称为多重共线性(Multicollinearity)。这里,“共线性”表示存在着线性相关关系,“多重”意味着相关关系有多个组合。,也就是说,如果存在 1X1i+2X2i+kXki=0 i=1,2,n 其中:i不全
2、为0,则称为解释变量间存在完全共线性(perfect multicollinearity)即某一个解释变量可以用其他解释变量的线性组合表示。,如果存在 1X1i+2X2i+kXki+vi=0 i=1,2,n 其中i不全为0,vi为随机误差项,则称为 近似共线性(approximate multicollinearity)或不完全共线性。,在矩阵表示的线性回归模型 Y=X+中,完全共线性指:秩(X)k+1,即,中,至少有一列向量可由其他列向量(不包括第一列)线性表出。,如:X2=X1,则X2对Y的作用可由X1代替。,,解释变量间毫无线性关系,变量间相互正交。这时已不需要作多元回归,每个参数j都可
3、以通过Y 对 Xj 的一元回归来估计。,回归模型中解释变量的关系,由于存在随机变量,完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。这时,列向量不是完全线性相关的,而是近似线性相关的。,需要指出的是,多重共线性是指解释变量之间的线性关系,并不是指它们之间的非线性关系。例如,对于下述回归模型:,该模型仅是非线性关系,并不违反无多重共线性假定。,注意:,二、多重共线性产生的原因,一般地,产生多重共线性的主要原因有以下四个方面:1 经济变量相关的共同趋势 时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。横截面数据:生
4、产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。,2 经济变量之间的内在联系,在经济计量模型中,引入的经济变量之间存在内在联系。例如,农业生产函数中,影响农业产量Y的因素有耕地面积X1和施肥量X2等因素,其模型可写为,一般来说,土地面积与施肥量有密切关系,面积越大,施肥量越多,二者存在着一定的线性依存关系。,3 滞后变量的引入,在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。,再如,固定资产存量不仅与本期投资有关,还与以前有关。同一变量的前后期值可能高度线性相关。,4 样本资
5、料的限制,由于完全符合理论模型所要求的样本数据较难收集,只能被动接受,而且只能获得一个有限范围观察值,无法进行重复试验,如果解释变量个数大于观测次数,就会出现过度拟合的模型。特定样本可能存在某种程度的多重共线性。如医疗研究中,可能只有少数病人,却要收集大量变量的信息,这些变量之间就会出现相关性。从方程组的角度看,是方程个数少于变量的个数,则方程组有无数组解,其中部分解可以用其他解线性表示,即变量之间存在相关性。,三、多重共线性的后果,1、完全共线性下参数估计量不存在,如果存在完全共线性,则(XX)-1不存在,无法得到参数的估计量。,的OLS估计量为:,如果解释变量之间是相关的,当一个发生变化时
6、,与其高度相关的变量的观测值也会以相似的方式变化,这时参数的大小就不再具有原来的意义,而且参数的意义难以解释。,例如,在农业生产函数中 如果耕地面积 和施肥量 之间存在完全的共线性,比如(k为一非零常数),我们再引入 一个任意非零常数,则 代入 模型中则有虽然完全等价,但回归系数却显然不同,说明这时 参数值的估计不唯一确定.从经济意义上讲,如果取,那么()0 这表明,随耕地面积的增加农产量将会减少,这显然是十分荒谬的结论。,完全多重共线性的后果,对于二元线性回归模 型 其参数1的OLS估计式为:由 得,则,完全多重共线性的后果(一般),因此,,2.参数估计量经济含义不合理,如果模型中两个解释变
7、量具有线性相关性,例如 X2=kX1,这时,X1和X2前的参数1、2并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。1、2已经失去了应有的偏回归系数经济含义,甚至经常表现出似乎反常的现象:例如1本来应该是正的,结果却是负的。,3.不完全共线性下OLS估计量非有效,不完全共线性下,可以得到OLS参数估计量。,对于二元线性回归模型,可见X1与X2不完全的共线时,参数是可以估计的。,设X1与X2不完全的共线性关系为 其中,,则有,代入参数估计式,得:,3.不完全共线性下OLS估计量非有效,不完全共线性下,虽然可以得到OLS参数估计量,但参数估计量方差的表达式为,由于|XX
8、|0,引起(XX)-1主对角线元素较大,使参数估计值的方差增大,OLS参数估计量非有效。,仍以二元线性模型 Y=0+1X1+2X2+为例:,恰为X1与X2的线性相关系数的平方r2,由于 r2 1,故 1/(1-r2)1,其中,多重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子(Variance Inflation Factor,VIF),它表明OLS的估计量的方差随着是多重共线性的增加而“膨胀”起来。,当完全不共线时,r2=0,当不完全共线时,0 r2 1,当完全共线时,r2=1,,4、参数的置信区间明显扩大,由于存在多重共线性,变大的方差容易使参数估计量有较大的标准差,因此参数
9、真值的置信区间也将增大。,此置信区间将随 的增大而增大。而置信区间愈大,对真值的估计愈不准确。,5、变量的显著性检验失去意义,存在多重共线性时,参数估计值的方差与标准差变大,容易使通过样本计算的t值小于临界值,误导作出参数为0的推断,可能将重要的解释变量排除在模型之外,6、参数估计量及其标准误差对于样本波动非常敏感,数据即使出现轻微变动,它们都将发生较大变化,使回归模型缺乏稳定性。这可从二元线性回归模型中看出,故当样本数据的轻微变动引起 的轻微变动时,将会发生较大的变动,即 将会发生较大的变动。,注意:,当模型存在多重共线性时,OLS估计仍然为最佳线性无偏估计(BLUE)。如果我们的目的仅仅是
10、预测的未来值,且预计解释变量之间的多重共线关系在预测期不发生变化,那么,多重共线性对Y的预测就没有明显影响。问题在于,即使OLS法仍是最好的估计方法,它却不是“完美的”,尤其是在统计推断上无法给出真正有用的信息。,多重共线性表现为一种样本现象,即使总体不存在多重共线性,所得样本也可能出现多重共线性。而且由于抽样波动,对于同一总体,不同样本的共线性程度也不相同。因此,对于多重共线性的检验,可以直接对所得样本进行分析做出判断。,多重共线性表现为解释变量之间具有相关关系,所以用于多重共线性的检验方法主要是统计方法:如简单相关系数检验法、判定系数检验法、方差扩大(膨胀)因子法等。,四、多重共线性的检验
11、,1.简单相关系数检验法,含义:简单相关系数检验法是利用解释变量之间的线性相关程度去判断是否存在严重多重共线性的一种简便方法。判断规则:一般而言,如果每两个解释变量的简单相关系数(零阶相关系数)比较高,例如大于0.8,则可认为存在着较严重的多重共线性。,较高的简单相关系数只是多重共线性存在的充分条件,而不是必要条件。特别是在多于两个解释变量的回归模型中,有时较低的简单相关系数也可能存在多重共线性。因此,并不能简单地依据相关系数进行多重共线性的准确判断。命令方式COR 各个解释变量名,得两两简单相关系数矩阵如下,注意:,2.根据可决系数R2、F检验、t检验的结果判断,经验表明,多重共线性存在的一
12、个标志是模型结果具有较大的标准误差和较小的t统计量。如果模型的可决系数 很大,检验高度显著,但是偏回归系数的t检验几乎都不显著(t检验值较小),则模型很可能存在多重共线性。因为通过检验,虽然各解释变量对的联合线性影响高度显著,但每个解释变量的单独影响却都不显著,就无法辨别哪个解释变量对被解释变量的影响更大。这种矛盾结果可能是由于 较大引起的,这时很有可能存在严重的多重共线性。,3、判定系数检验法,如果存在多重共线性,需进一步确定究竟由哪些变量引起。使模型中每一个解释变量分别以其余解释变量为解释变量进行回归,并计算相应的拟合优度。如果某一种回归 Xji=1X1i+2X2i+kXki的判定系数 较
13、大,说明Xj与其他X间存在共线性。(其中 称为复相关系数),具体可进一步对上述回归方程作F检验:,式中:Rj2为第j个解释变量对其他解释变量的回 归方程的决定系数,若存在较强的共线性,则Rj2较大且接近于1,这时(1-Rj2)较小,从而Fj的值较大。因此,给定显著性水平,计算F值,并与相应的临界值比较,来判定是否存在相关性。,构造如下F统计量,在模型中排除某一个解释变量Xj,估计模型;如果拟合优度与包含Xj时十分接近,则说明Xj与其它解释变量之间存在共线性。,另一等价的检验是:,4、方差扩大(膨胀)因子法,经验规则,方差膨胀因子越大,表明解释变量之间的多重共性越严重。反过来,方差膨胀因子越接近
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 多重 线性
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5659165.html