《序列相关性》PPT课件.ppt
第六章 序列相关性,Serial Correlation,一、序列相关性概念二、实际经济问题中的序列相关性 三、序列相关性的后果四、序列相关性的检验五、具有序列相关性模型的估计六、案例,一、序列相关性概念,如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了序列相关性。,对于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n,随机项互不相关的基本假设表现为 Cov(i,j)=0 ij,i,j=1,2,n,或,序列相关的形式,1、一阶自回归形式First-order coefficient of autocorrelation误差项ut只与其滞后一期值ut-1有关Ut=f(ut-1)+vt2、高阶序列相关形式误差项ut不仅与前一期值ut-1有关,还与其前若干期值ut-2 ut-3,都有关系。Ut=f(ut-1 ut-2,)+vt,称为一阶序列相关,或自相关(autocorrelation),其中:被称为自协方差系数(coefficient of autocovariance)或一阶自相关系数(first-order coefficient of autocorrelation)i是满足以下标准的OLS假定的随机干扰项:,如果仅存在 E(i i+1)0 i=1,2,n,自相关往往可写成如下形式:i=i-1+i-11,由于序列相关性经常出现在以时间序列为样本的模型中,因此,本节将用下标t代表i。,计量经济模型中自相关的最常见的形式是一阶线性自回归形式,可见,当随机误差项满足一阶自回归形式的自相关时,随机误差项满足零均值和同方差的假定,但不满足无自相关的假定。,序列的自相关特征分析。给出具有正自相关,负自相关和非自相关三个序列。,a.正相关序列 b.正相关,c.负相关序列 d.负相关,e.非自相关序列 f 非自相关,注意:,1、经济问题中的自相关主要是正自相关2、自相关主要发生于时间序列数据,二、实际经济问题中的序列相关性,大多数经济时间数据都有一个明显的特点:惯性,表现在时间序列不同时间的前后关联上。,由于消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关)。,例如,绝对收入假设下居民总消费函数模型:Ct=0+1Yt+t t=1,2,n,1、经济变量固有的惯性,2、模型设定的偏误,所谓模型设定偏误(Specification error)是指所设定的模型“不正确”。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。,例如,本来应该估计的模型为 Yt=0+1X1t+2X2t+3X3t+t,但在模型设定中做了下述回归:Yt=0+1X1t+1X2t+vt,因此,vt=3X3t+t,如果X3确实影响Y,则出现序列相关。,但建模时设立了如下模型:Yt=0+1Xt+vt 因此,由于vt=2Xt2+t,,包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。,又如:如果真实的边际成本回归模型应为:Yt=0+1Xt+2Xt2+t其中:Y=边际成本,X=产出,,3、数据的“编造”,例如:季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动性,从而使随机干扰项出现序列相关。还有就是两个时间点之间的“内插”技术往往导致随机项的序列相关性。,在实际经济问题中,有些数据是通过已知数据生成的。因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。,4、一些随机干扰因素的影响,例如,自然灾害、金融危机等随机因素的影响,往往要持续多个时期。从而使得随机误差项呈现出自相关性。,计量经济学模型一旦出现序列相关性,如果仍采用OLS法估计模型参数,会产生下列不良后果:,三、序列相关性的后果,1、参数估计量非有效,因为,在有效性证明中利用了 E(NN)=2I 即同方差性和互相独立性条件。,而且,仍然具有线性性和无偏性,在大样本情况下,参数估计量虽然具有一致性,但仍然不具有渐近有效性。,一般OLS估计量的方差将被低估。,以一元线性回归模型为例来说明。,一元线性回归模型:,无自相关时:,存在一阶自回形式自相关时:,(1),(2),2、变量的显著性检验失去意义,在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。,其他检验也是如此。,3、模型的预测失效,区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低。所以,当模型出现序列相关性时,它的预测功能失效。,四、序列相关性的检验,基本思路:1、图示法2、回归检验法3、杜宾-瓦森(Durbin-Watson)检验法4、拉格朗日乘数(Lagrange multiplier)检验,然后,通过分析这些“近似估计量”之间的相关性,以判断随机误差项是否具有序列相关性。,序列相关性检验方法有多种,但基本思路相同:,基本思路:,四、序列相关性的检验,1、图示法,图示法步骤和类型,步骤1、用给定的样本估计回归模型,计算残差et,(t=1,2,T)2、绘制残差图3、分析残差图残差图类型有两个,如果大部分点落在第、象限,表明随机误差项存在着正自相关。,如果大部分点落在第、象限,那么随机误差项 存在着负自相关。,图 6.2 et与et-1的关系,2、回归检验法,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。,回归检验法的优点是:(1)能够确定序列相关的形式,(2)适用于任何类型序列相关性问题的检验。缺点:计算量大,DW检验是杜宾(J.Durbin)和瓦森()于1951年提出的一种检验自相关的方法,该方法的适用条件是:,3、杜宾-瓦森(Durbin-Watson)检验法,也就是说DW检验前提条件:,随机扰动项为一阶自回归形式i=i-1+i解释变量中不应含有滞后因变量如,不应出现下列形式,样本容量足够大解释变量X非随机【残差中包含了X的组合,X随机会使统计量的分布复杂化】回归含有截距项【保证残差均值为0】,DW检验的步骤,(1)提出假设,即不存在一阶自相关,即存在一阶自相关,(2)计算检验统计量DW的值,i=i-1+i,因为对于大样本,所以,由 可得DW 值与 的对应关系如表所示:,由上述讨论可知DW的取值范围为:0DW,(3)检验自相关性,DW检验图示,注:存在不确定区域!在不能确定区域,习惯上倾向于拒绝原假设,DW检验判别准则:,误差项间存在负相关,不能判定是否有自相关,误差项无自相关,不能判定是否有自相关,误差项间存在正相关,DW检验的缺点和局限性,DW检验有两个不能确的区域,一旦DW值落在这两个区域,就无法判断。这时,只有增大样本容量或选取其他方法,此时通常拒绝原假设。DW统计量的上、下界表要求 n15,这是因为样本如果再小,利用残差就很难对自相关的存在性做出比较正确的诊断DW检验不适应随机误差项具有高阶序列相关的检验只适用于有常数项的回归模型并且解释变量中不能含滞后的被解释变量,4、拉格朗日乘数(Lagrange multiplier)检验,拉格朗日乘数检验克服了DW检验的缺陷,适合于高阶序列相关以及模型中存在滞后被解释变量的情形。它是由布劳殊(Breusch)与戈弗雷(Godfrey)于1978年提出的,也被称为BG检验。,对于模型,如果怀疑随机扰动项存在p阶序列相关:,GB检验可用来检验如下受约束回归方程,约束条件为:H0:1=2=p=0,约束条件H0为真时,大样本下,其中,n为样本容量,R2为如下辅助回归的可决系数:,t,p,t,p,t,kt,k,t,t,e,r,X,X,e,e,r,e,b,b,b,+,+,+,+,+,+,+,=,-,-,1,1,1,1,0,L,L,给定,查临界值2(p),与LM值比较,做出判断,实际检验中,可从1阶、2阶、逐次向更高阶检验。,五、序列相关解决方法,如果自相关是由于错误地设定模型的数学形式所致,那么就应当修改模型的数学形式。方法是用残差et 对解释变量的较高次幂进行回归。如果自相关是由于模型中省略了重要解释变量造成的,那么解决办法就是找出略去的解释变量,把它做为重要解释变量列入模型。怎样查明自相关是由于略去重要解释变量引起的?一种方法是用残差et对那些可能影响被解释变量,但又未单列入模型的解释变量回归,并作显著性检验。只有当以上两种引起自相关的原因都排除后,才能认为误差项ut 真正存在自相关。,如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型。,最常用的方法是广义最小二乘法(GLS:Generalized least squares)和广义差分法(Generalized Difference)。,五、序列相关的补救,1、广义最小二乘法,对于模型 Y=X+如果存在序列相关,同时存在异方差,即有,是一对称正定矩阵,存在一可逆矩阵D,使得=DD,变换原模型:D-1Y=D-1X+D-1即 Y*=X*+*(*),(*)式的OLS估计:,这就是原模型的广义最小二乘估计量(GLS estimators),是无偏的、有效的估计量。,该模型具有同方差性和随机误差项互相独立性:,如何得到矩阵?,对的形式进行特殊设定后,才可得到其估计值。,如设定随机扰动项为一阶序列相关形式 i=i-1+i 则,2、广义差分法,广义差分法是将原模型变换为满足OLS法的差分模型,再进行OLS估计。,如果原模型,存在,可以将原模型变换为:,该模型为广义差分模型,不存在序列相关问题。可进行OLS估计。,注意:,广义差分法就是上述广义最小二乘法,但是却损失了部分样本观测值。如:一阶序列相关的情况下,广义差分是估计,这相当于,去掉第一行后左乘原模型Y=X+。即运用了GLS法,但第一次观测值被排除了。,3、随机误差项相关系数的估计,应用广义最小二乘法或广义差分法,必须已知随机误差项的相关系数1,2,L。实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。常用的估计方法有:,1、用DW统计量计算 2、科克伦-奥科特(Cochrane-Orcutt)迭代法。3、杜宾(durbin)两步法,1、用DW统计量计算,2、科克伦-奥科特迭代法。,以一元线性模型为例:首先,采用OLS法估计原模型 Yi=0+1Xi+i得到的的“近似估计值”,并以之作为观测值使用OLS法估计下式 i=1i-1+2i-2+Li-L+i,求出i新的“近拟估计值”,并以之作为样本观测值,再次估计,i=1i-1+2i-2+Li-L+i,类似地,可进行第三次、第四次迭代。,关于迭代的次数,可根据具体的问题来定。一般是事先给出一个精度,当相邻两次1,2,L的估计值之差小于这一精度时,迭代终止。实践中,有时只要迭代两次,就可得到较满意的结果。两次迭代过程也被称为科克伦-奥科特两步法。,3、杜宾(durbin)两步法,该方法仍是先估计1,2,l,再对差分模型进行估计,第一步,变换差分模型为下列形式,进行OLS估计,得各Yj(j=i-1,i-2,i-l)前的系数1,2,l的估计值,应用软件中的广义差分法,在Eview/TSP软件包下,广义差分采用了科克伦-奥科特(Cochrane-Orcutt)迭代法估计。在解释变量中引入AR(1)、AR(2)、,即可得到参数和1、2、的估计值。其中AR(m)表示随机误差项的m阶自回归。在估计过程中自动完成了1、2、的迭代。,如果能够找到一种方法,求得或各序列相关系数j的估计量,使得GLS能够实现,则称为可行的广义最小二乘法(FGLS,Feasible Generalized Least Squares)。FGLS估计量,也称为可行的广义最小二乘估计量(feasible general least squares estimators)可行的广义最小二乘估计量不再是无偏的,但却是一致的,而且在科克伦-奥科特迭代法下,估计量也具有渐近有效性。前面提出的方法,就是FGLS,注意:,4、虚假序列相关问题,由于随机项的序列相关往往是在模型设定中遗漏了重要的解释变量或对模型的函数形式设定有误,这种情形可称为虚假序列相关(false autocorrelation),应在模型设定中排除。避免产生虚假序列相关性的措施是在开始时建立一个“一般”的模型,然后逐渐剔除确实不显著的变量。,六、案例:中国商品进口模型,经济理论指出,商品进口主要由进口国的经济发展水平,以及商品进口价格指数与国内价格指数对比因素决定的。由于无法取得中国商品进口价格指数,我们主要研究中国商品进口与国内生产总值的关系。(下表)。,1.通过OLS法建立如下中国商品进口方程:,(2.32)(20.12),2.进行序列相关性检验。,DW检验,取=5%,由于n=24,k=1(不包含常数项),查表得:dl=1.27,du=1.45由于 DW=0.628 dl,故:存在正自相关。,拉格朗日乘数检验,(0.23)(-0.50)(6.23)(-3.69)R2=0.6614,于是,LM=240.6614=15.87取=5%,2分布的临界值20.05(2)=5.991 LM 20.05(2)故:存在正自相关,2阶滞后:,3阶滞后:,(0.22)(-0.497)(4.541)(-1.842)(0.087)R2=0.6615,于是,LM=240.6615=15.88取=5%,2分布的临界值20.05(3)=7.815 LM 20.05(3)表明:存在正自相关;但t-3的参数不显著,说明不存在3阶序列相关性。,3、运用广义差分法进行自相关的处理,(1)采用杜宾两步法估计 第一步,估计模型,(1.76)(6.64)(-1.76)(5.88)(-5.19)(5.30),第二步,作差分变换:,则M*关于GDP*的OLS估计结果为:,(2.76)(16.46),取=5%,DWdu=1.43(样本容量24-2=22)表明:已不存在自相关,于是原模型为:,与OLS估计结果的差别只在截距项:,(2)采用科克伦-奥科特迭代法估计,在Eviews软包下,2阶广义差分的结果为:,取=5%,DWdu=1.66(样本容量:22)表明:广义差分模型已不存在序列相关性。,(3.81)(18.45)(6.11)(-3.61),可以验证:仅采用1阶广义差分,变换后的模型仍存在1阶自相关性;采用3阶广义差分,变换后的模型不再有自相关性,但AR3的系数的t值不显著。,案例分析2,案例:改革开放以来,天津市城镇居民人均消费性支出(CONSUM),人均可支配收入(INCOME)以及消费价格指数(PRICE)的数据(19782000年)见下表所示。现在研究人均消费和人均可支配收入的关系。,天津市城镇居民人均消费与人均可支配收入数据,接上页表,资料来源:天津统计年鉴(2001),中国统计出版社,先定义不变价格的人均消费性支出和人均可支配收入,以1978年价格为基准。,令,图(1)Y与X的散点图,(1)估计线性回归模型,用OLS方法得到的估计结果如下:,回归方程拟合得比较好,但是DW值比较低。残差图如下页所示:,图(1)残差图,(2)分别用DW、LM统计量检验随机误差项是否存在自相关,再用LM统计量检验自相关。用Eviews软件可以直接得到结果。具体操作步骤是:在回归输出窗口中点击View键,选择Residual Tests/Serial Correlation LM Test,会弹出一个设定滞后期(Lag Specification)对话框。输入1,点击OK,就会得到检验结果。,(3)用广义差分法估计回归系数,对原变量做广义差分变换。令,回归方程拟合效果仍然比较好,且DW=2.31。查表得临界值,因为DW=2.31(4-1.43)=2.57,依据判别规则,误差项已消除自相关。残差图如下页所示。,图(2)残差图,则原模型的广义最小二乘估计结果为,