《计量经济学-多重共线性.ppt》由会员分享,可在线阅读,更多相关《计量经济学-多重共线性.ppt(38页珍藏版)》请在三一办公上搜索。
1、回顾:,什么函数可以描述产量与其总成本关系?如果要计算两个变量之间的弹性应用什么函数形式?如何计算科技进步贡献率?用什么函数?如何计算?,第六章 多 重 共 线 性,在实践中,关于线性回归的基本假定不能全部满足,出现基本假定违背。主要包括:(1)随机项序列不是同方差,而是异方差的;(2)随机项序列相关,即存在自相关;(3)解释变量与随机项相关;(4)解释变量之间线性相关,存在多重共线性。多重共线性是对第(4)个基本假定的违反,导致OLS估计量失去优良性。,第一节 多重共线性的概念第二节 多重共线性的后果第三节 多重共线性的检验第四节 多重共线性的修正方法第五节 案例,一、多重共线性的定义,多重
2、共线性是指解释变量 Xi 之间存在完全的或近似的线性关系。在线性模型中,解释变量的观察值距阵X(包括常数项)其秩等于模型中的解释变量的个数加一 rank(X)=k+1 如果此假定不成立,则称解释变量Xi之间存在多重共线性,至少有一列向量可由其它列向量线性表示。如 X2=X1X2与 X1的相关系数为1,解释变量X2 对因变量Y 的作用可由X1 完全替代。,第一节 多重共线性的概念,1、经济变量之间的相互依存关系 如替代品价格之间会存在多重共线性2、时间趋势影响 经济繁荣和经济衰退 时间序列样本建立线性模型时,往往存在多重共线。3、样本资料方面的原因 样本资料推算数据往往存在多重共线性4、滞后变量
3、的引入 同一变量的前后期之值可能是高度线性相关的5、虚拟变量设置不合理6、变量设置过多,二、产生多重共线性的原因,多重共性的原因,一、完全多重共线性的影响1、无法估计模型参数 yi=b1 x1+b2 x2,第二节 多重共线性的后果,对上述方程两边同乘观察值距阵 X 的转置距阵,一、完全多重共线性的影响,完全共线性:XX=0,(XX)-1不存在,R23=1;例:,2、模型参数估计方差无穷大,当存在多重共线性时,利用OLS 无法估计参数,即参数估计值是不确定的,且估计值的方差无穷大。,1、可以估计参数,但参数估计不稳定2、参数估计量的方差增大,使参数估计量的精度降低。不能正确判断各解释变量对被解释
4、变量的贡献。3、由于参数估计量的方差和标准差增大,在对参数进行显著性检验性t 检验时,增大了接受零假设的可能性。4、若作区间预测也将降低预测的精度。,二、不完全多重共线性的影响,1、简单相关系数法 解释变量组的相关矩阵中解释变量间的简单相关系数的绝对值甚至大于被解释变量与解释变量之间的简单相关系数的绝对值 cor X1 X2 几何度量,第三节 多重共线性的检验,X2,X1,X3,(x,y),2、综合统计检验法 若 R2,F 均很大,而各t值均偏小,则可以认为存在多重共线性3、用 F 检验确定哪些解释变量是多重共线的 对每个解释变量 Xj 作它与其它解释变量的回归,并计算样本决定系数 R2,若F
5、 Fa(临界值,则认为Xj与X1,Xj-1,Xj+1,Xk,多重共线显著,4、用 t 检验来找出哪些解释变量是造成多重共线的原因(对自变量两两回归),若T Ta,即Xj与Xi是引起多重共线的原因。,2,第四节 多重共线性的修正方法,一、删除不重要的变量1、将证实为多重共线性原因的变量删除2、由实际经济分析确定变量的相对重要性,删除不太重要的变量3、变量删除不当,会产生模型设计偏倚二、改变解释变量形式1、采用相对数量如对于需求函数 Q=b0+b1Y+b2P0+b3P1+u 商品价格P0 和替代商品价格P1 可能高度线性相关,可将模型改为如下形式:Q=a0+a1Y+a3(P0/P1)+u,2、采用
6、增量型变量如对于消费函数 Ct=b0+b1Yt+b2Yt-1+u 本期收入Yt 和上期收入Yt-1 可能高度线性相关,可将模型改为如下形式:Ct=a0+a1Yt+a2Yt+u Yt=Yt Yt-1 3、改变解释变量样本信息(1)改变样本(2)增加样本容量 样本容量 n 增加,x2 增大,var(b1)的值会降低,抵消方差增大的影响。,三、利用已知信息进行参数约束修正如对于 CD 生产函数的对数形式 lnY=lnA+a lnL+b lnk+u 资金和劳动之间可能高度线性相关,如假定规模报酬不变,施加约束条件 a+b=1可将模型改为如下形式:ln(Y/K)=lnA+a ln(L/K)+u b=1
7、a,四、逐步回归法,逐步回归法分为逐个剔除法与逐个引入法“逐步”指的是在使用回归分析方法建立模型时,一次只能剔除(减少)一个解释变量或者一次只能引入(增加)一个解释变量。进行一次剔除或引入称为“一步”,这样逐步的进行下去,直到最后得到模型达到“最优”模型中无不显著解释变量。引入的准则:引入解释变量后使模型的拟合优度(及F)显著增加的,应当引入;否则不引入。剔除的准则:剔除解释变量后使模型的拟合优度(及F)不显著的减少,应当剔除;否则不剔除。,1、逐步剔除法,先将一切可能的解释变量全部引入模型再依据各个解释变量的显著性每次从模型中剔除一个不显著的解释变量从不显著的解释变量中,剔除t最小(对应的概
8、率P最大)的解释变量直至留在模型中的全部解释变量影响显著,得到最简洁的模型(模型中不包含不显著的解释变量)。,逐步剔除与多重共线性,如果剔除一个解释变量,使模型拟合优度(及F)显著地减少,那么这个剔除是不应当的。但证明了该剔除变量与留在模型中的解释变量不构成多重共线。它对解释变量Y的贡献不能由已在模型中的解释变量线性表出。如果剔除一个解释变量,使模型拟合优度(及F)不显著地减少,那么这个剔除是应当的。而且证明了它与留在模型中的解释变量构成多重共线。它可由这些变量线性表出,所以剔除不至于引起拟合优度的减少。,2、逐个引入法,如果引入解释变量,使模型拟合优度显著地增加,那么这个引入是应当的,而且它
9、与模型中已有的解释变量不构成多重共线。如果引入解释变量,使模型拟合优度不显著地增加,那么这个引入是不应当的,而且它与已在型中的解释变量构成多重共线,它可由这些解释变量线性表出。也就是说,它对被解释变量的贡献已由这些共线变量提供。所以,引入它并不能提高拟合优度。,第五节 案例一中国粮食生产函数,根据理论和经验分析,影响粮食生产(Y)的主要因素有:农业化肥施用量(X1);粮食播种面积(X2)成灾面积(X3);农业机械总动力(X4);农业劳动力(X5),已知中国粮食生产的相关数据,建立中国粮食生产函数:Y=0+1 X1+2 X2+3 X3+4 X4+4 X5+,1、用OLS法估计上述模型:,R2接近
10、于1;给定=5%,得F临界值 F0.05(5,12)=3.11 F=638.4 15.19,故认为上述粮食生产的总体线性关系显著成立。但X4、X5 的参数未通过t检验,且符号不正确,故解释变量间可能存在多重共线性。,(-0.91)(8.39)*(3.32)*(-2.81)*(-1.45)(-0.14),2、检验简单相关系数,发现:X1与X4间存在高度相关性。,列出X1,X2,X3,X4,X5的相关系数矩阵:,3、找出最简单的回归形式,可见,应选第1个式子为初始的回归模型。,(25.58)(11.49)R2=0.8919 F=132.1 DW=1.56,(-0.49)(1.14)R2=0.075
11、 F=1.30 DW=0.12,(17.45)(6.68)R2=0.7527 F=48.7 DW=1.11,(-1.04)(2.66)R2=0.3064 F=7.07 DW=0.36,4、逐步回归,将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。,4、逐步回归,将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。,4、逐步回归,将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。,4、逐步回归,将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。,4、逐步回归,将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。,回归方程以Y=f(X1,X2,X3)为最优:,5、结论,第五节 案例二家庭消费支出生产函数,用前10组数据建立模型:,对前10组数据运用逐步回归的思路建立模型:,扩大样本数据重新建立模型:,扩大样本数据重新建立模型:,作业:,如何判断一个方程是否存在共线性?用什么办法可以消除共线性?,
链接地址:https://www.31ppt.com/p-6343133.html