现代时间序列分析模型.ppt
第六讲 现代时间序列分析模型,1 时间序列平稳性和单位根检验2 协整与误差修正模型,经典时间序列分析模型:MA、AR、ARMA平稳时间序列模型分析时间序列自身的变化规律现代时间序列分析模型:分析时间序列之间的关系单位根检验、协整检验现代宏观计量经济学,1 时间序列平稳性和单位根检验,一、时间序列的平稳性二、单整序列三、单位根检验,一、时间序列的平稳性Stationary Time Series,问题的提出,经典计量经济模型常用到的数据有:时间序列数据(time-series data);截面数据(cross-sectional data)平行/面板数据(panel data/time-series cross-section data)时间序列数据是最常见,也是最常用到的数据。经典回归分析暗含着一个重要假设:数据是平稳的。,数据非平稳,大样本下的统计推断基础“一致性”要求被破怀。数据非平稳,往往导致出现“虚假回归”(Spurious Regression)问题。表现为两个本来没有任何因果关系的变量,却有很高的相关性。例如:如果有两列时间序列数据表现出一致的变化趋势(非平稳的),即使它们没有任何有意义的关系,但进行回归也可表现出较高的可决系数。,2、平稳性的定义,假定某个时间序列是由某一随机过程(stochastic process)生成的,即假定时间序列Xt(t=1,2,)的每一个数值都是从一个概率分布中随机得到,如果满足下列条件:均值E(Xt)=是与时间t 无关的常数;方差Var(Xt)=2是与时间t 无关的常数;协方差Cov(Xt,Xt+k)=k 是只与时期间隔k有关,与时间t 无关的常数;则称该随机时间序列是平稳的(stationary),而该随机过程是一平稳随机过程(stationary stochastic process)。,宽平稳、广义平稳,白噪声(white noise)过程是平稳的:Xt=t,tN(0,2)随机游走(random walk)过程是非平稳的:Xt=Xt-1+t,tN(0,2)Var(Xt)=t2随机游走的一阶差分(first difference)是平稳的:Xt=Xt-Xt-1=t,tN(0,2)如果一个时间序列是非平稳的,它常常可通过取差分的方法而形成平稳序列。,二、单整序列Integrated Series,如果一个时间序列经过一次差分变成平稳的,就称原序列是一阶单整(integrated of 1)序列,记为I(1)。一般地,如果一个时间序列经过d次差分后变成平稳序列,则称原序列是d 阶单整(integrated of d)序列,记为I(d)。I(0)代表一平稳时间序列。,现实经济生活中只有少数经济指标的时间序列表现为平稳的,如利率等;大多数指标的时间序列是非平稳的,例如,以当年价表示的消费额、收入等常是2阶单整的,以不变价格表示的消费额、收入等常表现为1阶单整。大多数非平稳的时间序列一般可通过一次或多次差分的形式变为平稳的。但也有一些时间序列,无论经过多少次差分,都不能变为平稳的。这种序列被称为非单整的(non-integrated)。,三、平稳性的单位根检验(unit root test),1、DF检验(Dicky-Fuller Test),通过上式判断Xt是否有单位根,就是时间序列平稳性的单位根检验。,随机游走,非平稳,对该式回归,如果确实发现=1,则称随机变量Xt有一个单位根。,等价于通过该式判断是否存在=0。,一般检验模型,零假设 H0:=0备择假设 H1:0,可通过OLS法下的t检验完成。,但是,在零假设(序列非平稳)下,即使在大样本下t统计量也是有偏误的(向下偏倚),通常的t 检验无法使用。Dicky和Fuller于1976年提出了这一情形下t统计量服从的分布(这时的t统计量称为统计量),即DF分布。由于t统计量的向下偏倚性,它呈现围绕小于零均值的偏态分布。,如果t临界值,则拒绝零假设H0:=0,认为时间序列不存在单位根,是平稳的。,单尾检验,2、ADF检验(Augment Dickey-Fuller test),为什么将DF检验扩展为ADF检验?DF检验假定时间序列是由具有白噪声随机误差项的一阶自回归过程AR(1)生成的。但在实际检验中,时间序列可能由更高阶的自回归过程生成,或者随机误差项并非是白噪声,用OLS法进行估计均会表现出随机误差项出现自相关,导致DF检验无效。如果时间序列含有明显的随时间变化的某种趋势(如上升或下降),也容易导致DF检验中的自相关随机误差项问题。,ADF检验模型,零假设 H0:=0 备择假设 H1:0,模型1,模型2,模型3,检验过程实际检验时从模型3开始,然后模型2、模型1。何时检验拒绝零假设,即原序列不存在单位根,为平稳序列,何时停止检验。否则,就要继续检验,直到检验完模型1为止。检验原理与DF检验相同,只是对模型1、2、3进行检验时,有各自相应的临界值表。检验模型滞后项阶数的确定:以随机项不存在序列相关为准则。,一个简单的检验过程:同时估计出上述三个模型的适当形式,然后通过ADF临界值表检验零假设H0:=0。只要其中有一个模型的检验结果拒绝了零假设,就可以认为时间序列是平稳的;当三个模型的检验结果都不能拒绝零假设时,则认为时间序列是非平稳的。,3、例:检验19782000年间中国支出法GDP时间序列的平稳性,经过偿试,模型3取2阶滞后:,需进一步检验模型2。,LM(1)=0.92,LM(2)=4.16,系数的t临界值,不能拒绝存在单位根的零假设。,时间T的t统计量小于ADF临界值,因此不能拒绝不存在趋势项的零假设。,小于5%显著性水平下自由度分别为1与2的2分布的临界值,可见不存在自相关性,因此该模型的设定是正确的。,经试验,模型2中滞后项取2阶:,常数项的t统计量小于AFD分布表中的临界值,不能拒绝不存常数项的零假设。,LM检验表明模型残差不存在自相关性,因此该模型的设定是正确的。,GDPt-1参数值的t统计量为正值,大于临界值,不能拒绝存在单位根的零假设。,需进一步检验模型1。,经试验,模型1中滞后项取2阶:,GDPt-1参数值的t统计量为正值,大于临界值,不能拒绝存在单位根的零假设。,LM检验表明模型残差项不存在自相关性,因此模型的设定是正确的。,可以断定中国支出法GDP时间序列是非平稳的。为了判断它的单整阶数,需要对它的差分序列进行检验,ADF检验在Eviews中的实现,ADF检验在Eviews中的实现,ADF检验在Eviews中的实现GDPP,ADF检验在Eviews中的实现GDPP,从GDPP(-1)的参数值看,其t统计量的值大于临界值(单尾),不能拒绝存在单位根的零假设。同时,由于时间项T的t统计量也小于ADF分布表中的临界值(双尾),因此不能拒绝不存在趋势项的零假设。需进一步检验模型2。,ADF检验在Eviews中的实现GDPP,ADF检验在Eviews中的实现GDPP,从GDPP(-1)的参数值看,其t统计量的值大于临界值(单尾),不能拒绝存在单位根的零假设。同时,由于常数项的t统计量也小于ADF分布表中的临界值(双尾),因此不能拒绝不存在趋势项的零假设。需进一步检验模型1。,ADF检验在Eviews中的实现GDPP,ADF检验在Eviews中的实现GDPP,从GDPP(-1)的参数值看,其t统计量的值大于临界值(单尾),不能拒绝存在单位根的零假设。至此,可断定GDPP时间序列是非平稳的。,ADF检验在Eviews中的实现GDPP,ADF检验在Eviews中的实现GDPP,从GDPP(-1)的参数值看,其t统计量的值大于临界值(单尾),不能拒绝存在单位根的零假设。同时,由于时间项项T的t统计量也小于AFD分布表中的临界值(双尾),因此不能拒绝不存在趋势项的零假设。需进一步检验模型2。在1%置信度下。,ADF检验在Eviews中的实现GDPP,如果将置信度从1%降低至10%,将拒绝存在单位根和不存在时间趋势项的假设,得到GDPP是平稳序列的结论,进而得到GDPP是I(1)序列。,ADF检验在Eviews中的实现GDPP,从GDPP(-1)的参数值看,其统计量的值大于临界值(单尾),不能拒绝存在单位根的零假设。同时,由于常数项的t统计量也小于AFD分布表中的临界值(双尾),因此不能拒绝不存在趋势项的零假设。需进一步检验模型1。,ADF检验在Eviews中的实现GDPP,从GDPP(-1)的参数值看,其统计量的值大于临界值(单尾),不能拒绝存在单位根的零假设。至此,可断定GDPP时间序列是非平稳的。,ADF检验在Eviews中的实现2GDPP,ADF检验在Eviews中的实现2GDPP,ADF检验在Eviews中的实现2GDPP,ADF检验在Eviews中的实现2GDPP,从2GDPP(-1)的参数值看,其统计量的值小于临界值(单尾),拒绝存在单位根的零假设。至此,可断定2GDPP时间序列是平稳的。GDPP是I(2)过程。,2 协整与误差修正模型,一、长期均衡与协整分析二、协整检验EG检验三、协整检验JJ检验四、误差修正模型,一、长期均衡与协整分析Equilibrium and Cointegration,1、问题的提出,经典回归模型(classical regression model)是建立在平稳数据变量基础上的,对于非平稳变量,不能使用经典回归模型,否则会出现虚假回归等诸多问题。由于许多经济变量是非平稳的,这就给经典的回归分析方法带来了很大限制。但是,如果变量之间有着长期的稳定关系,即它们之间是协整的(cointegration),则是可以使用经典回归模型方法建立回归模型的。例如,中国居民人均消费水平与人均GDP变量的例子,从经济理论上说,人均GDP决定着居民人均消费水平,它们之间有着长期的稳定关系,即它们之间是协整的。,经济理论指出,某些经济变量间确实存在着长期均衡关系,这种均衡关系意味着经济系统不存在破坏均衡的内在机制,如果变量在某时期受到干扰后偏离其长期均衡点,则均衡机制将会在下一期进行调整以使其重新回到均衡状态。假设X与Y间的长期“均衡关系”由式描述,2、长期均衡,该均衡关系意味着:给定X的一个值,Y相应的均衡值也随之确定为0+1X。,在t-1期末,存在下述三种情形之一:Y等于它的均衡值:Yt-1=0+1Xt;Y小于它的均衡值:Yt-1 0+1Xt;,在时期t,假设X有一个变化量Xt,如果变量X与Y在时期t与t-1末期仍满足它们间的长期均衡关系,即上述第一种情况,则Y的相应变化量为:,vt=t-t-1,如果t-1期末,发生了上述第二种情况,即Y的值小于其均衡值,则t期末Y的变化往往会比第一种情形下Y的变化大一些;反之,如果t-1期末Y的值大于其均衡值,则t期末Y的变化往往会小于第一种情形下的Yt。可见,如果Yt=0+1Xt+t正确地提示了X与Y间的长期稳定的“均衡关系”,则意味着Y对其均衡点的偏离从本质上说是“临时性”的。一个重要的假设就是:随机扰动项t必须是平稳序列。如果t有随机性趋势(上升或下降),则会导致Y对其均衡点的任何偏离都会被长期累积下来而不能被消除。,式Yt=0+1Xt+t中的随机扰动项也被称为非均衡误差(disequilibrium error),它是变量X与Y的一个线性组合:,如果X与Y间的长期均衡关系正确,该式表述的非均衡误差应是一平稳时间序列,并且具有零期望值,即是具有0均值的I(0)序列。,非稳定的时间序列,它们的线性组合也可能成为平稳的。称变量X与Y是协整的(cointegrated)。,3、协整,如果序列X1t,X2t,Xkt都是d阶单整,存在向量=(1,2,k),使得Zt=XT I(d-b),其中,b0,X=(X1t,X2t,Xkt)T,则认为序列X1t,X2t,Xkt是(d,b)阶协整,记为XtCI(d,b),为协整向量(cointegrated vector)。如果两个变量都是单整变量,只有当它们的单整阶数相同时,才可能协整;如果它们的单整阶数不相同,就不可能协整。,3个以上的变量,如果具有不同的单整阶数,有可能经过线性组合构成低阶单整变量。,(d,d)阶协整是一类非常重要的协整关系,它的经济意义在于:两个变量,虽然它们具有各自的长期波动规律,但是如果它们是(d,d)阶协整的,则它们之间存在着一个长期稳定的比例关系。例如,中国CPC和GDPPC,它们各自都是2阶单整,如果它们是(2,2)阶协整,说明它们之间存在着一个长期稳定的比例关系,从计量经济学模型的意义上讲,建立如下居民人均消费函数模型是合理的。,尽管两个时间序列是非平稳的,也可以用经典的回归分析方法建立回归模型。,从这里,我们已经初步认识到:检验变量之间的协整关系,在建立计量经济学模型中是非常重要的。而且,从变量之间是否具有协整关系出发选择模型的变量,其数据基础是牢固的,其统计性质是优良的。,二、协整检验EG检验,1、两变量的Engle-Granger检验,为了检验两变量Yt,Xt是否为协整,Engle和Granger于1987年提出两步检验法,也称为EG检验。第一步,用OLS方法估计方程 Yt=0+1Xt+t并计算非均衡误差,得到:,称为协整回归(cointegrating)或静态回归(static regression)。,非均衡误差的单整性的检验方法仍然是DF检验或者ADF检验。需要注意是,这里的DF或ADF检验是针对协整回归计算出的误差项,而非真正的非均衡误差。而OLS法采用了残差最小平方和原理,因此估计量是向下偏倚的,这样将导致拒绝零假设的机会比实际情形大。于是对et平稳性检验的DF与ADF临界值应该比正常的DF与ADF临界值还要小。,MacKinnon(1991)通过模拟试验给出了协整检验的临界值。,例 检验中国居民人均消费水平CPC与人均国内生产总值GDPPC的协整关系。,已知CPC与GDPPC都是I(2)序列,已知它们的回归式,R2=0.9981,对该式计算的残差序列作ADF检验,适当检验模型为:,(-4.47)(3.93)(3.05)LM(1)=0.00 LM(2)=0.00,t=-4.47-3.75=ADF0.05,拒绝存在单位根的假设,残差项是平稳的。因此中国居民人均消费水平与人均GDP是(2,2)阶协整的,说明了该两变量间存在长期稳定的“均衡”关系。,2、多变量协整关系的检验扩展的E-G检验,多变量协整关系的检验要比双变量复杂一些,主要在于协整变量间可能存在多种稳定的线性组合。假设有4个I(1)变量Z、X、Y、W,它们有如下的长期均衡关系:,非均衡误差项t应是I(0)序列:,然而,如果Z与W,X与Y间分别存在长期均衡关系:,则非均衡误差项v1t、v2t一定是稳定序列I(0)。于是它们的任意线性组合也是稳定的。例如,由于vt象t一样,也是Z、X、Y、W四个变量的线性组合,由此vt 式也成为该四变量的另一稳定线性组合。(1,-0,-1,-2,-3)是对应于t 式的协整向量,(1,-0-0,-1,1,-1)是对应于vt式的协整向量。,一定是I(0)序列。,检验程序:对于多变量的协整检验过程,基本与双变量情形相同,即需检验变量是否具有同阶单整性,以及是否存在稳定的线性组合。在检验是否存在稳定的线性组合时,需通过设置一个变量为被解释变量,其他变量为解释变量,进行OLS估计并检验残差序列是否平稳。如果不平稳,则需更换被解释变量,进行同样的OLS估计及相应的残差项检验。当所有的变量都被作为被解释变量检验之后,仍不能得到平稳的残差项序列,则认为这些变量间不存在(d,d)阶协整。,检验残差项是否平稳的DF与ADF检验临界值要比通常的DF与ADF检验临界值小,而且该临界值还受到所检验的变量个数的影响。,MacKinnon(1991)通过模拟试验得到的不同变量协整检验的临界值。,三、协整检验JJ检验,JJ检验的原理,Johansen于1988年,以及与Juselius一起于1990年提出了一种用向量自回归模型进行检验的方法,通常称为Johansen检验,或JJ检验,是一种进行多重I(1)序列协整检验的较好方法。,没有移动平均项的向量自回归模型表示为:,差分Yt为M个I(1)过程构成的向量,I(0)过程,I(0)过程,只有产生协整,才能保证新生误差是平稳过程,将y的协整问题转变为讨论矩阵的性质问题,于是,将yt中的协整检验变成对矩阵的分析问题。这就是JJ检验的基本原理。,两种检验方法:特征值轨迹检验最大特征值检验,JJ检验的预备工作,第一步:用OLS分别估计下式中的每一个方程,计算残差,得到残差矩阵S0,为一个(MT)阶矩阵。,第一步:用OLS分别估计下式中的每一个方程,计算残差,得到残差矩阵S1,也为一个(MT)阶矩阵。,第三步:构造上述残差矩阵的积矩阵:,第四步:计算有序特征值和特征向量。,第五步:设定似然函数。,JJ检验之一特征值轨迹检验,服从Johansen分布。被称为特征值轨迹统计量。,,一直检验下去,直到出现第一个不显著的(Mr)为止,说明存在r个协整向量。这r个协整向量就是对应于最大的r个特征值的经过正规化的特征向量。,JJ检验之一最大特征值检验,该统计量被称为最大特征值统计量。于是该检验被称为最大特征值检验。,由 Johansen和Juselius于1990年计算得到 Johansen分布临界值表。,JJ检验实例,GDP、CONSR、CONSP、INV取对数后为I(1)序列。即lnGDP、lnCONSR、lnCONSP、lnINV。对它们之间的协整关系进行检验。,两种方法的结论是一致的。,如何处理高阶单整序列?,从理论上讲。JJ 检验只适用于多个1阶单整序列。多个同阶高阶单整序列,差分为1阶后再检验,显然是可行的。但是意义发生变化。没有看到关于高阶多重协整检验的文献,难度太大。能否先检验,然后建立均衡方程,通过对误差项的单位根检验以判断发生何种协整?未见经典。,如何选择截距和时间趋势项?,分别考虑CE和VAR中是否有截距和时间趋势项作为假设显著性检验重新检验对协整关系检验结果无显著影响(检验统计量发生变化,但临界值同时发生变化),如何在多个协整关系中作出选择?,一般选择对应于最大特征值的第1个协整关系从应用的目的出发选择,四、误差修正模型Error Correction Model,ECM,1、一般差分模型的问题,对于非稳定时间序列,可通过差分的方法将其化为稳定序列,然后才可建立经典的回归分析模型。,模型只表达了X与Y间的短期关系,而没有揭示它们间的长期关系。关于变量水平值的重要信息将被忽略。,误差项t不存在序列相关,t是一个一阶移动平均时间序列,因而是序列相关的。,2、误差修正模型,是一种具有特定形式的计量经济学模型,它的主要形式是由Davidson、Hendry、Srba和Yeo于1978年提出的,称为DHSY模型。,由于现实经济中很少处在均衡点上,假设具有(1,1)阶分布滞后形式,Y的变化决定于X的变化以及前一时期的非均衡程度。一阶误差修正模型(first-order error correction model)的形式:,若(t-1)时刻Y大于其长期均衡解0+1X,ecm为正,则(-ecm)为负,使得Yt减少;若(t-1)时刻Y小于其长期均衡解0+1X,ecm为负,则(-ecm)为正,使得Yt增大。体现了长期非均衡误差对短期变化的控制。,复杂的ECM形式,例如:,误差修正模型的优点:如:a)一阶差分项的使用消除了变量可能存在的趋势因素,从而避免了虚假回归问题;b)一阶差分项的使用也消除模型可能存在的多重共线性问题;c)误差修正项的引入保证了变量水平值的信息没有被忽视;d)由于误差修正项本身的平稳性,使得该模型可以用经典的回归方法进行估计,尤其是模型中差分项可以使用通常的t检验与F检验来进行选取;等等。,3、误差修正模型的建立,Granger 表述定理(Granger representaion theorem)Engle 与 Granger 1987年提出 如果变量X与Y是协整的,则它们间的短期非均衡关系总能由一个误差修正模型表述。,模型中没有明确指出Y与X的滞后项数,可以是多阶滞后;由于一阶差分项是I(0)变量,因此模型中允许采用X的非滞后差分项Xt。,建立误差修正模型,需要:首先对变量进行协整分析,以发现变量之间的协整关系,即长期均衡关系,并以这种关系构成误差修正项。然后建立短期模型,将误差修正项看作一个解释变量,连同其它反映短期波动的解释变量一起,建立短期模型,即误差修正模型。,Engle-Granger两步法 第一步,进行协整回归(OLS法),检验变量间的协整关系,估计协整向量(长期均衡关系参数);第二步,若协整性存在,则以第一步求到的残差作为非均衡误差项加入到误差修正模型中,并用OLS法估计相应参数。需要注意的是:在进行变量间的协整检验时,如有必要可在协整回归式中加入趋势项,这时,对残差项的稳定性检验就无须再设趋势项。另外,第二步中变量差分滞后项的多少,可以残差项序列是否存在自相关性来判断,如果存在自相关,则应加入变量差分的滞后项。,经济理论指出,居民消费支出是其实际收入的函数。以中国国民核算中的居民消费支出经过居民消费价格指数缩减得到中国居民实际消费支出时间序列(C);以支出法GDP对居民消费价格指数缩减近似地代表国民收入时间序列(GDP)。时间段为19782000(表9.3.3),例 中国居民消费的误差修正模型,(1)对数据lnC与lnGDP进行单整检验,容易验证lnC与lnGDP是一阶单整的,它们适合的检验模型如下:,(3.81)(-4.01)(2.66)(2.26)(2.54)LM(1)=0.38 LM(2)=0.67 LM(3)=2.34 LM(4)=2.46,首先,建立lnC与lnGDP的回归模型,(2)检验lnC与lnGDP的协整性,并建立长期均衡关系,(0.30)(57.48)R2=0.994 DW=0.744,发现有残关项有较强的一阶自相关性。考虑加入适当的滞后项,得lnC与lnGDP的分布滞后模型,(1.63)(6.62)(4.92)(-2.17)R2=0.994 DW=1.92 LM(1)=0.00 LM(2)=2.31,自相关性消除,因此可初步认为是lnC与lnGDP的长期稳定关系。,残差项的稳定性检验:,(-4.32)R2=0.994 DW=2.01 LM(1)=0.04 LM(2)=1.34,t=-4.32-3.64=ADF0.05 说明lnC与lnGDP是(1,1)阶协整的,下式即为它们长期稳定的均衡关系:,以稳定的时间序列,(3)建立误差修正模型,做为误差修正项,可建立如下,误差修正模型:,(6.96)(2.96)(-1.91)(-3.15)R2=0.994 DW=2.06 LM(1)=0.70 LM(2)=2.04,由式,可得lnC关于lnGDP的长期弹性:(0.698-0.361)/(1-0.622)=0.892;由(*)式可得lnC关于lnGDP的短期弹性:0.686,(*),用打开误差修正项括号的方法直接估计误差修正模型,适当估计式为:,(1.63)(6.62)(-2.99)(2.88)R2=0.791=0.0064 DW=1.93 LM(2)=2.31 LM(3)=2.78,写成误差修正模型的形式如下,由上式知,lnC关于lnGDP的短期弹性为0.698,长期弹性为0.892。可见两种方法的结果非常接近。,(4)预测,由式,给出1998年关于长期均衡点的偏差:,=ln(18230)-0.152-0.698ln(39008)-0.662ln(17072)+0.361ln(36684)=0.0125,由式,预测1999年的短期波动:lnC99=0.686(ln(41400)-ln(39008)+0.784(ln(18230)-ln(17072)-0.484(ln(39008)-ln(36684)-1.1630.0125=0.048,于是,按照式,预测的结果为:lnC99=0.698(ln(41400)-ln(39008)-0.378(ln(18230)-0.405-0.892ln(39008)=0.051,以当年价计的1999年实际居民消费支出为39334亿元,用居民消费价格指数(1990=100)紧缩后约为19697亿元,两个预测结果的相对误差分别为2.9%与2.6%。,于是,