模型的建立与估计中的问题及对策ppt课件.ppt
1,第五章 模型的建立与估计中的问题及对策第一节 误设定,一、选择错误的函数形式:如:将非线性关系作为线性关系处理。二、模型中遗漏有关的解释变量:后果:OLS估计量不再是无偏的。三、模型包括无关的解释变量:后果:OLS估计量是无偏的,但估计量的方差增大。,2,四、选择解释变量的四条准则:、理论、检验、拟合优度检验、偏倚五、检验误设定的RESET方法:具体步骤:、估计方程:、添加解释变量:、检验:,第二节 多重共线性,模型中解释变量违反了基本假定4 解释变量与随机扰动项相互独立的假定,导致解释变量之间线性相关,称为多重共线性。,4,一、多重共线性的定义,对于模型如果某两个或多个解释变量之间出现多重共线:其中C不全为0,即某一个解释变量可以用其他解释变量的线性组合表示,则称为完全多重共线性。完全多重共线性的情况并不多见,一般出现不同程度的多重共线性。,5,二、实际经济问题中的多重共线,1、产出受规模的限制和影响,产出与投入要素之间 存在正比例关系,以某行业的企业为样本建立企业生产函数,那么解释变量之间存在多重共线。2、相对收入假设,时间序列数据建立消费函数(当期收入与前期消费相关),6,三、多重共线性产生的原因:(1)经济变量的内在联系(根本原因)(2)经济变量变化趋势的“共向性”(3)解释变量中含有滞后变量四、多重共线性的后果:1、完全多重共线性:OLS估计量不存在;2、共线变量参数估计量的方差很大;(主要后果)3、难以区分每个解释变量的单独影响;4、t检验的可靠性降低;5、回归模型缺乏稳定性;,7,五、多重共线的检验1、根据回归结果判别2、相关系数检验3、VIF检验(辅助回归模型)4、特征值检验,8,六、克服多重共线性的办法,1、直接剔除次要共线变量2、间接剔除重要解释变量(1)利用附加信息,增加约束(2)综合使用TS,CS数据,9,3、逐步回归:(1)选取与被解释变量相关性最强的解释变量,建立 一元回归模型;(2)在一元回归模型中分别引入剩余的变量建 立个二元回归模型,选取最优的模型;(3)在选取的二元回归模型中,引入第三个解释 变量,直至无法引入新的变量为止。取舍原则:(1)R*2增加,每个t增加,则保留引入变量;(2)R*2下降,每个t变化不大,则删除引入变量。,10,例1、服装需求函数。影响居民服装需求的主要因素有:可支配收入、流动资产拥有量K、服装类价格指数P1和总物价指数P0。,服装需求函数有关统计资料,11,(1)相关系数检验:,12,(2)逐步回归:,13,第三节 异方差性,一、异方差的定义同方差:D(ui)=2=常数 i=1,2,n 即对不同的样本点,扰动项的离散程度相同。异方差:D(ui)=2i i=1,2,n,14,二、异方差性产生的原因例1、使用横截面数据研究储蓄函数。例2、用分组资料研究CD函数。1、模型中遗漏了影响逐渐增大的因素。2、模型函数形式的设定误差。3、随机因素的影响导致异常观测值的出现而产生。,15,三、异方差性的后果1、OLS估计不再是有效估计2、无法正确估计参数的标准误差3、t检验失效4、降低预测精度,16,纺锤型,四、异方差性的检验 1、图示检验法(1)相关图分析,17,反纺锤型,18,漏斗型,19,反漏斗型,20,(2)残差分布图分析例1、我国制造工业利润函数。,21,服装需求函数有关统计资料,22,2、解析法,(1)Goldfeld-Quandt检验,23,(2)White检验:具体步骤:1、估计模型,计算e2;2、估计辅助回归模型:3、计算辅助回归模型的R2;,24,(3)帕克(Park)检验和戈里瑟(Gleiser)检验 原理:通过建立残差序列对解释变量的回归模型,判 断扰动项与解释变量之间是否存在较强的相关关系。ark检验模型:Gleijser检验模型:优点:可以近似地给出异方差的存在形式:2i=2 f(xi)。以便用模型变换消除异方差。,25,26,五、异方差性的解决方法1、模型变换法:对模型进行变量变换,消除异方差。,27,28,29,、加权最小二乘法(WLS)模型存在异方差时,WLS估计量是BLUE的。,30,模型变换法的实质就是WLS法。,31,3、加权最小二乘法(WLS)的Eviews实现(1)生成权数变量;(2)使用WLS法估计模型。例2、我国制造工业利润函数中异方差性的调整。,32,依次键入命令:LS(W=Wi)Y C X i=1,2,3,4,33,34,一、定义若随机扰动项各期之间存在相关关系,即:则称之为自相关或序列相关。主要出现在时间序列中。,第三节 自相关,35,一阶自相关:一般形式:,36,二、自相关的原因及后果1、模型中遗漏了重要的解释变量:例如,如果真实的回归方程形式为,其中,被解释变量表示牛肉需求量,解释变量分别为牛肉价格、消费者收入和猪肉价格。但是在作回归时用的是,那么,随机扰动项就会出现系统性模式,从而造成自相关。,37,2、模型函数形式的设定误差:例如:平均成本函数本应该是二次多项式模型,如果设成了直线形式,则随机误差项是自相关的。,38,、经济惯性(滞后效应):由于经济发展的连续性所形成的惯性(或粘滞性),使得经济变量的前后期之间是相互关联的。例如,在消费支出对收入的时间序列分析中,当期的消费支出除了依赖于收入等其它变量外,还依赖前期的消费支出,如:设定模型时使用的是,则可能会出现自相关。因为随机误差项:,39,、随机因素的影响:例如自然灾害、金融危机、世界经济环境的变化等随机因素的影响,往往要持续多个时期,使得随机误差呈现出自相关性。,40,三、自相关性的后果1、参数的OLS估计不再是有效估计2、OLS法会低估参数的标准误差3、t检验的可靠性降低4、降低模型的预测精度,41,四、自相关性的检验1、残差图分析:2、DW检验(Durbin-Watson):简称DW检验,是目前检验自相关性最常用的方法,只适用于检验一阶自相关,即:et=et1+vtDW检验的基本原理和步骤:(1)提出原假设H0:=0 即et不存在一阶自相关;(2)构造检验统计量:,42,43,44,计算统计量 根据n,k和显著性水平以及DW检验表,查出临界值dL、dU.若DW 4dL,则拒绝H0,认为随机误差项有负自相关;若dL DW dU 或4dU DW 4dL,则不能作出结论。,45,46,序列相关性的回归检验法,对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关。,47,五、广义最小二乘法GLS,1、当模型同时存在序列相关和异方差2、通过模型转换(GLS法)消除序列相关和异方差3、GLS估计模型的步骤,48,1、当模型同时存在序列相关和异方差,模型线性无偏但序列相关和存在异方差,OLS估计量已经不是有效的,49,模型基本假定中的表达,50,51,2、通过模型转换(GLS法)消除序列相关和异方差,存在=DD,D-1左乘模型于是可用OLS估计模型(2),得到参数估计量,52,如何得到矩阵?,首先进行OLS估计得到随机误差项的估计值,以此构造矩阵。,53,3、GLS估计模型的步骤,(1)对原模型进行OLS估计,得到矩阵的估计值(2)采用前页(3)式,计算其估计量(3)经验方法,一律采用GLS方法。不存在序列相关及异方差,GLS等价于OLS;否则,就消除了序列相关及异方差,得到具有优良性的估计。,54,六、差分法,差分法是克服序列相关的有效方法。1、一阶差分2、广义差分3、随机误差项相关系数的估计4、广义差分法在EViews中的实现,55,1、一阶差分,用OLS对模型(2)进行估计,得到BLUE估计量完全正自相并不多见,但是,只要存在一定的一阶正自相关时,可采用一阶差分法来处理序列相关,再用OLS估计模型。,56,差分在EViews中的实现,GENR DX=X-X(-1)或,GENR DX=d(X)LS DY DX1 DX2 DX3为了估计模型:直接采用命令:LS d(Y)d(X1)d(X2)d(X3),1、生成差分序列再估计模型2、直接采用差分算子d(X),或d(X,n),57,调用差分算子,无须计算差分序列,d(X)first difference of X,X-X(-1)d(X,n)n-th order difference of X,58,d(x,2)=?,d(x,2)=d(d(x)=d(x-x(-1)=d(x)-d(x(-1)=x-x(-1)-(x(-1)-x(-2)=x-x(-1)-x(-1)+x(-2)=x-2x(-1)+x(-2),59,一阶差分应用实例,数据资料:lzn43.wf1目的:采用简单实用的一阶差分克服序列相关方法:直接采用一阶差分算子估计模型,60,61,DW有明显改善,62,d(xfze)=0.5719d(gdp)即 1=0.5719,63,2、广义差分,(1)存在一阶序列相关的模型(2)存在L阶序列相关的模型(3)广义差分模型在EViews中的实现,64,(1)存在一阶序列相关的模型,设线性回归模型yt=b0+b1xt+ut t=1,2,n随机项ut存在一阶自相关ut=ut-1+vt式中随机项vt满足基本假设。,65,若已知,将线性回归模型yt=b0+b1xt+ut(1)滞后一期并两边乘以,得yt-1=b0+b1xt-1+ut-1(2)(1)-(2),由ut=ut-1+vt得yt-yt-1=(1-)b0+b1(xt-xt-1)+vt(3)令 yt*=yt-yt-1 xt*=xt-xt-1(3)式变成yt*=b0+b1xt*+vt(其中b0=(1-)b0)上式称为广义差分模型,其中vt满足基本假设。,66,某地区商品出口模型(expt.wf1)expt出口A类商品总值gnp国民生产总值,67,在Eviews中利用广义差分法,由DW=0.9505计算的估计值 1-DW/2=0.5248genr sexpt=expt-0.5248*expt(-1)genr sgnp=gnp-0.5248*gnp(-1)ls sexpt c sgnp,68,dU=1.41 4-dU=2.59,sexpt=-1504.828+0.3031sgnp,69,Expt=-3166.73+0.3031gnp,所求回归方程为,70,在TSP和Eviews中,带AR(1)项的LS命令提供了对自相关序列进行校正的回归计算过程,使用的是Cochrane-Orcutt提出的迭代法。在回归分析输出结果中,可以直接读到的迭代收敛值。,71,LS expt c gnp AR(1),72,Expt=-3354.72+0.3092gnp试比较用广义差分法所求方程Expt=-3166.73+0.3031gnp,所求回归方程为,73,(2)存在L阶序列相关的模型,74,滞后变换各滞后方程分别乘以对应相关系数1,2,L,75,广义差分变换原模型减去(1),(2),(L)式得到无序列相关的新模型,76,3、随机误差项相关系数的估计,(1)杜宾两步法(2)Cochrane-Orcutt 法,77,(1)杜宾两步法,78,例:商品出口模型(expt.wf1)expt出口A类商品总值 gnp国民生产总值,得到残差序列:genr rsdresid,79,Dependent Variable:RSD Method:Least Squares Sample(adjusted):1968 1985Variable Coefficient Std.Error t-Statistic Prob.RSD(-1)0.468438 0.259986 1.801784 0.0893R-squared 0.155628 Mean dependent var-12.51639Adjusted R-squared0.155628 S.D.dependent var 171.825S.E.of regression157.8903 Sum squared resid 423798.Log likelihood-116.1407 Durbin-Watson stat 1.393095,0.4684,80,yt=yt-1+0(1-)+1(xt-xt-1)+vt设 sxt=xt-xt-1则 yt=0+yt-1+1sxt+vt估计上述方程,得.,Eviews 命令:genr sgnp=gnp-0.4684gnp(-1)ls expt c expt(-1)sgnp,81,Dependent Variable:EXPTMethod:Least SquaresSample(adjusted):1968 1985Variable CoefficientStd.Errort-StatisticProb.C-1640.146398.4733-4.1160750.0009EXPT(-1)0.4634020.1525473.0377640.0083SGNP 0.3020670.0733204.1198720.0009R-squared0.985903 F-statistic 524.5344Durbin-Watson stat 1.463044 Prob(F-statistic)0.000000,=0.4634,82,yt yt-1=0(1-)+1(xt-xt-1)+vt设 zxt=xt-xt-1 zyt=yt-yt-1则 zyt=0+1zxt+vt估计上述方程,得 0=0(1-)和 1。,Eviews 命令:genr zgnp=gnp-0.4634*gnp(-1)genr zexpt=expt-0.4634*expt(-1)Ls zexpt c zgnp,83,Dependent Variable:ZEXPTMethod:Least SquaresSample(adjusted):1968 1985Variable CoefficientStd.Errort-StatisticProb.C-1641.264248.6142-6.6016500.0000ZGNP 0.2994590.01546819.359300.0000R-squared0.959057 F-statistic374.782Durbin-Watson stat 1.465963 Prob(F-statistic)0.00000,0=-1641.264/(1-0.4634)=-3058.64 1=0.299459,84,所求回归方程为,Expt=-3058.64+0.2995gnp试比较前期所求方程Expt=-3354.72+0.3092gnpExpt=-3166.73+0.3031gnp,85,load expt.wf1ls expt c gnpgenr er=residls er er(-1)er(-2)vector(2)l1l1(1)=c(1)l1(2)=c(2)genr sx=gnp-l1(1)*gnp(-1)-l1(2)*gnp(-2)ls expt c expt(-1)expt(-2)sxvector(2)l2l2(1)=C(2)L2(2)=C(3)genr dy=expt-l2(1)*expt(-1)-l2(2)*expt(-2)genr dx=gnp-l2(1)*gnp(-1)-l2(2)*gnp(-2)ls dy c dxvector(2)mm(1)=c(1)/(1-l2(1)-l2(2)m(2)=c(2)show m,二阶序列相关的情况,86,(2)Cochrane-Orcutt 法,1.考虑线性回归模型 yt=b0+b1xt+ut2.用最小二乘法估计模型,得残差的一阶自回归方程 et=et-1+v的系数的初始估计值1=1-DW/23.利用1对原模型进行广义差分变换作第一次迭代,得广义差分模型 yt(1)=b0+b1xt(1)+vt(1),并以此线性回归模型返回步骤2.4.重复上述过程,反复进行迭代,求得一系列的i(i1,2,),直至i收敛为止。,87,(5)广义差分法在EViews中的实现,科克兰内-奥克特法在EViews中直接采用命令:LS Y C X1 X2 XK AR(1)AR(2)AR(l)直接进行迭代估计一般先不引入AR项,若DW差异显著,首先引入AR(1)直至DW不显著来确定阶数。,88,七、虚假序列相关性的处理,虚假序列相关指的是模型的序列相关性是由于省略了显著的解释变量所致。例如,在生产函数模型中省略了资金,资金的贡献归入随机误差项,而资金在时间上具有连续性,必然导致误差序列自相关。为此,一般先建立一个“大包围”的模型,逐个剔除不显著的解释变量,保留下显著的解释变量,避免虚假序列相关。,