VAR模型和VEC模型.ppt
一、VAR模型二、实例分析 三、VECM模型,西姆斯(Sims)1970年提出了VAR(Vector Autoregressive)模型(向量自回归模型)。在VAR模型中,没有内生变量和外生变量之分,而是所有的变量都被看作内生变量,初始对模型系数不施加任何约束,即每个方程都有相同的解释变量所有被解释变量若干期的滞后值。VAR模型在涉及到多变量并且有相互制约和影响的经济分析中都是一个强有力的分析工具,特别是在联立方程的预测能力受到质疑的时候,这种模型的提出在预测方面和脉冲响应分析方面均显示出较大的优势。,(一)、VAR模型的形式,在一个含有n个方程(即n个被解释变量)的VAR模型中,每个被解释变量都对自身以及其它被解释变量的若干期滞后值回归,若令滞后阶数为k,则VAR模型的一般形式可用下式表示:其中,表示由第t期观测值构成的n维列向量,为系数矩阵,是由随机误差项构成的n维列向量,其中随机误差项(i=1,2,n)为白噪声过程。,即被解释变量分别对自身以及对方的2阶滞后值回归。模型的特点:1、每个变量Yt都是内生变量。2、方程等号右边的解释变量都是滞后变量。3、每个方程的解释变量都相同。4、Yt的动态结构由它的k阶滞后就可以刻划出来,K期之前的变量对Yt无影响。5、随机误差项是白噪声过程。VAR模型是由内生变量的动态结构来描述的,不需要关于变量之间的相互关系的先验理论假设。,为便于直观理解,假定n=2,k=2,则VAR模型可写成:,(二)、VAR模型的识别、估计和预测,1、VAR模型的识别(滞后期的确定)前面提到,建立VAR模型的一个难点就是确定滞后项数。通常理论知识给出滞后项数的一个大致范围,例如货币政策的时滞一般为6-12个月,因此若应用VAR模型对货币政策效应进行分析时,如果是月度数据我们就可以确定滞后阶数应小于12。如果要具体得确定滞后项数,就需要用到其它的一些方法,下面我们将介绍其中的几种方法:,常用方法有似然比方法和信息准则法。下面只介绍信息准则法。Akaike 信息准则:AIC=Schwartz 信息准则:SC=其中,代表由估计残差的方差和协方差组成的矩阵的行列式,T代表样本容量,表示的是所有方程中回归项的个数(包括常数项)。例如,对于一个含有a个方程,滞后项数为b的VAR模型,。,2、VAR模型的识别,检验的方法是主观地定出滞后期上限Q,对滞后长度b=1,2,Q,分别求出AIC和SC,则对应的AIC和SC的同时最小值(不是取绝对值)即为滞后期b(以模型总的AIC和SC为判断标准,不是以单个方程的AIC和SC),可以进一步结合模型统计检验来确定b。此法有一定的主观性。,利用实例(al3.wf1)数据各种滞后期的AIC和SC值。,综合两种检验结果还是滞后期为3合适。为了更准确地判断其滞后期,再看其它的检验方法。,关于其它识别方法:,Eviews5.1版本结出了5个评价标准的结果(见下页解释)。例如利用实例的文件aL3得(在VAR模型估计结果窗口中点view再选取lag structure,lag length Criteria得到),根据金融理论,货币效应时滞在一年左右,所以选择最大4阶,也可以结合模型检验来确定。,在五个评价指标中有4个认为滞后期应为3,见系统自动标出的结果,即*号处。,五个检验指标:LR检验统计量,PRE最终预测误差,AIC信息准则,SC信息准则,HQ信息准则。这五个检验可以归为三类。1、LR检验统计量,似然比(Likelihood Ratio,LR)检验涉及两类模型,无约束模型(没有任何限制的模型)和约束模型(指在零假设约束条件下的模型),似然比统计量是指无约束模型和有约束模型的最大似然值之差的2倍,即:LR=2(Lu-Lr)2(k)。如果无约束模型和约束模型的残差的最大似然之差越大,就越有证据证明约束模型不可靠。2、PRE最终预测误差,它是使把FPE(n)=2n(T+n)/(T-n)的最小值的n作为VAR模型的最佳阶数。2n为滞后n期时残差的方差估计,T为样本个数。它是优点是平衡了选择低阶数造成偏离性的风险和选择高滞后阶数造成方差增长的风险。3、信息准则,包括SC、AIC和HQ。如果滞后期越长,则要估计参数就越多,自由度就越少。因此信息准则就是寻求滞后期与自由度之间的一种均衡。一般根据SC、AIC和HQ的信息量取值最小的准则确定模型的阶数。,3、平稳性检验,VAR模型也可以作序列平稳性检验的,可以用单位根方法进行检验。在VAR模型的输出窗口中,通过ViewLag StructureAR Roots Table 或者AR Roots Graph分别得到VAR模型特征方程的根的倒数值的表和图。例如在案例4中,得到如下图:,如果全部特征根的倒数值都在单位园内,则VAR模型是稳定的,否则不稳定,不稳定不可以作脉冲响应函数分析。这表明本例的VAR模型是稳定的,4、VAR模型的估计,前面我们提到,如果VAR模型中变量是平稳的,并且方程右边包含相同的解释变量,随机误差项满足基本假定,则我们可以分别应用普通最小二乘法对单个方程予以估计,所得到的估计值是一致的、渐进有效的。当上述条件不满足时,我们需要用到估计联立方程模型的其它方法。由于所用到的数学知识已经超出了本书的范围,并且在Eviews软件中可以方便的实现对VAR模型的估计,在此我们不再多做介绍。,5、预测 一个较小的VAR模型产生的预测结果甚至要好于一个大的联立方程模型产生的预测结果,因此VAR模型的一个主要作用就是预测。,(三)、脉冲响应函数,假设系统处于均衡状态,如果由于某种原因,破坏了均衡,系统对该干扰作出反映,偏离均衡然后恢复均衡,这个过程用脉冲响应函数来描述。脉冲响应函数是度量来自于每个方程的随机误差项的一个标准差新信息(见新信息解释)冲击时被解释变量的响应程度和持续时间。例如假定某个方程的随机误差项在第t期发生突变,而后各期重新恢复平静,这时脉冲响应测量表示的是各期(t,t+1,t+2)的被解释变量对该冲击的反应。例如VAR(1):Yt=c+Yt-1+et,则,为了保证这样的不相关性,需要对脉冲响应函数进行调整,利用Choleski分解可以把协方差阵变为对角矩阵,这时的脉冲响应函数称为正交脉冲响应函数。通过测量脉冲响应,我们能够清楚地看到随机误差项的一个标准差新信息在某一时期的冲击对未来各期被解释变量的影响。同时脉冲响应表明了各个变量对该变量冲击的传导作用。(其原理参看潘红宇时间序列分析,对外经贸大学出版社,P204)。,广义脉冲响应函数(Generalized Impulse)是Pesaran和shin在1998年提出的。Pesaran 和Shin 证明:1、广义脉冲响应是唯一的,即消除了变量的顺序会影响脉冲响应结果的问题。并且考虑了观测到的不同形式冲击和它们之间的相关性。2、Pesaran 和Shin 还进一步证明了正交分解的脉冲响应是广义脉冲分解的特殊形式。当协方差矩阵是对角阵时,二者是一致的。3、它还可以应用于非线性多变量模型中,因为它不考虑冲击的范围、符号和历史。因此,利用广义脉冲响应函数得到的结果更具稳定性和说服力。,新信息(Innovation),定义:如果对所有t随机过程vt 满足:E(vt)=0,E(vtvt)=2,有界,E(vt Xt-1)=0,即vt与以前的Xt无关,则称vt是相对于Xt-1 的新信息过程。新信息过程一定是白噪声过程,反之不一定。新信息过程总是相对的,是相对于某个特定信息集,对其它信息集不一定是新信息过程。,(四)方差分解,方差分解(variance decomposition)表示的是当系统的某个变量受到一个标准差冲击以后,以一个变量的预测误差方差百分比的形式反映变量之间的交互作用。即方差分解就是对于内生变量的预测误差的方差进行分解,判断其方差的来源,或者了解某个特定随机新信息所引起的方差占总方差的比重。可以进行看出内生变量的变动主要由哪里变量所导致的。说明其它变量对该变量的变动有没有预测作用。见下面实例。,(五).结构VAR模型和缩减型的VAR模型,结构型VAR模型,即SVAR模型。此模型是在滞后相关关系基础上加入变量之间的同期相关关系形式。用来关注当期外生变量的影响。SVAR在处理随机冲击同期相关时,可以对时间序列的关系予以限制,因此可以得到唯一方差分解及脉冲反应函数。缩减型的VAR模型。估计方式见例题。,(六).实例分析利用VAR模型对我国货币政策的有效性进行检验。,1、数据来源:取我国狭义货币供应量M1,商品零售物价指数CPI(1994年1季度为100),以及代表产出水平的国内生产总值GDP的季度数据,时间为1994年第一季度到2004年第二季度。文件aL3.wf1,2、建模。在选择滞后项时,应用信息准则,根据金融理论,货币效应时滞在一年左右,所以我们选择最大4阶。,根据AIC信息准则,我们应选择滞后项为4,根据SC信息准则,我们应选择滞后项为2或3,考虑到3阶后AIC值下降较缓,以及结合模型的R2和Determinant Residual Covariance的值,最后选择滞后项为3。或者由Eviews5.1可得到(在VAR模型估计结果窗口中点view再选取lag structure,lag length Criteria):,在五个评价指标中有4个认为滞后期应为3(见系统自动标出的结果,即*号处)。,本例选择结果如下:,设置滞后期,必须配对出现,例如,1 2 5 8 则每个方程所包含的变量的滞后期均为:yt-1,yt-2,yt-5,yt-6,yt-7 yt-8,这里是输入外生变量,例如如果需要常数项,则输入c,如果需要加上时间趋势项则输入t(t要预先输入)。如果想构建缩减型的VAR模型及其VECM模型则需在此输入外生变量。,变量下面第1和2括号值分别标准差和T统计量,在同一变量不同的滞后项,有的是显著的,有的是不显著的,有的符号与经济理论不相符,验证了我们所说的VAR模型是缺乏理论依据的。首先,对于物价CPI,上一季度的货币供应量对其的影响是显著的,并且系数为正,与理论相符,说明货币供应量的增加将使物价水平上升,而上第二个季度M1的对CPI的影响是负的,而且更显著,正负交叉影响表现出M1和CPI相互关系的特征。,其次,对于货币供应量来说,上一季度的GDP对其影响不显著,说明货币供应量不受上期的产出但受物价水平的影响显著。但上第2季度的GDP对M1产生显著负影响。再次,对于GDP,上期的货币供应量对其是显著正影响。这从一个侧面验证了前几年我国实施的稳健的货币政策效果是有效的,而上期物价水平则对产出是不显著负影响。,3.缩减型的VAR模型:加上同期外生变量gdp2,同时下面也加上了趋势项t。,结果如下:,4.为了保证序列的平稳性,也可先对所有的数据进行处理再建立VAR模型,如取它们的自然对数。用genr功能。Lgdp=log(gdp),Lcpi=log(cpi),Lm1=log(m1)。然后分别对Lgdp,Lcpi,Lm1三变量建立VAR模型。或者直接用log(gdp),log(cpi),log(m1)建立VAR模型。,5.预测。点make model后得到:,点Solve得到如下对话框,基本选择有5项:,在模拟种类中有2项,第1为确定性,第2为随机性。,在动态方法中有动态求解等项。在静态条件下,滞后期是用实际值,而在动态情况下,滞后期用拟合值,在Solution scenarios&output(输出结果保存的序列名),求解得到的序列名是采用原序列加上后缀的方式命名,例如如果选择baseline,则GDP的预测值放在GDP_0。,在备份序列名,以免在用不同模型进行预测时,冲掉了上一次的预测值。例如如果选择了scenarios 1,则预测值放在GDP_1中。,注意:上述两对话框都不能选择Actual(实际值),否则计算不出预测值。,此时必须勾上下面的选择才有效。,在工作文件窗口中cpi和cpi_0分别为原始数据及拟合值,其它同理。可以用Genr命令求出每个变量的残差。,Baseline为预测值(拟合值),6、脉冲响应脉冲响应函数是度量来自于每个方程的随机误差项的一个标准差新息冲击时被解释变量的响应程度和持续时间。通过测量脉冲响应,我们能够清楚地看到随机误差项的一个标准差新信息在某一时期的冲击对未来各期被解释变量的传导作用。在方程的输出窗口中点viewimpulse Response得到:,在弹出对话框中:显示格式选择:表、每个脉冲响应函数图、合成图(来自于同一变量冲击的脉冲响应函数图合并显示)。左边两个框:从上到下:第一个为输入要冲击的变量。第二输入欲要计算脉冲响应的变量名。第三为是计算的期数。还有是否计算累计反映。右边图:关于计算脉冲响应函数标准差的方法:乔利期基(cholesky)分解和广义脉冲响应等。右边为输入VAR模型出现的变量顺序,变量的顺序会对结果产生影响。,注意:虽然乔利期基(cholesky)分解被广泛应用,但是方程的顺序将会强烈地影响脉冲响应。因为如果新信息是相关的话,它们将包含一个不与某特定变量相联系的共同成分。通常将共同成分的效应归属于VAR系统中第一个出现的变量(依照方程顺序),即Cpi、m1、gdp的方程对应的1t,2t,3t的共同成分都归到1t,,因此方程的顺序(即变量顺序)会影响脉冲响应的结果。因此一般选择广义脉冲响应。,积累反应,一般不选取,脉冲响应函数图的解释,有两种作图方式:单个响应图(Multiple Graphs和多个响应合成图(Combined Graphs)。在脉冲响应单个函数图中,横轴表示冲击作用滞后期数,纵轴分别表示反映变量的增长率(如果勾上Accumulated Responses,则纵轴表示增长率的累计值),实线表示脉冲响应函数,代表该变量受到其它变量的随机误差项一个标准差的冲击后,该变量现在和未来的反应程度和持续时间。虚线表示正负两倍标准差偏离带。,此表反应的是某变量对各个变量(含本身)冲击时响应程度的数值大小,非增长率。括号内为T统计量。,脉冲响应函数的数值表,M1对M1的一个标准差冲击,一开始反应敏感,在第一期达到最高值,随后迅速下降到最低点,然后缓慢上升保持不变在10期内都是正的。,M1(外界对m1的干扰)对gdp的一个标准差冲击的反应比较弱,几乎在所0左右波。说明货币流通量对经济的冲击较弱。,M1对Cpi的一个标准差冲击的反应敏感,在第一期达到最低值,然后趋于平稳,同时表明M1对CPI的传导作用始终为负。,GDP对Cpi、GDP、m1的一个标准差冲击的反应的脉冲响应函数图。分析略。,根据上面的脉冲响应函数图,可以详细分析各个变量对另一些变量冲击的持续效应和持续时间。,Cpi分别对cpi、GDP、m1的一个标准差冲击的反应的脉冲响应函数图。自己作分析。,对于单个脉冲响应图,Eviews给出一个2S.E的置信区间,这是选择顺序为m1,gdp,cpi,其结果和前面的结果有一定的差异,见右图。,广义脉冲响应,广义脉冲响应函数(Generalized Impulse)是Pesaran和shin在1998年提出的。Pesaran 和Shin 证明:1、广义脉冲响应是唯一的,即消除了变量的顺序会影响脉冲响应结果的问题。并且考虑了观测到的不同形式冲击和它们之间的相关性。2、Pesaran 和Shin 还进一步证明了正交分解的脉冲响应是广义脉冲分解的特殊形式。当协方差矩阵是对角阵时,二者是一致的。3、它可应用于非线性多变量模型中,因为它不考虑冲击的范围、符号和历史。因此,利用广义脉冲响应函数得到的结果更具稳定性和说服力。广义脉冲响应的计算如下:,选择此项,则右边就不会存在变量顺序选择问题。,广义脉冲响应,7、方差分解,通过方差分解可以了解到各个变量的冲击能解释某个变量的份额以及各个变量有没有预测作用,因为方差S.E的变动代表着该变量的变动规律。在模型的输出窗口中选取Viewvarance decomposition到方差分解。注意方差也与变量的顺序有关。,这图是显示M1的方差分解,显示cpi的冲击从弱到强,长期来看能解释m1的40%-48%,而gdp能解释约6%左右。CPI对M1的冲击是明显的。同时表明CPI对M1变动的预测作用约41.3%.,这图是显示cpi的方差分解,显示gdp的冲击从长期来看能解释cpi的4%左右,而m1也是能解释4%左右。两者相差不大。,这图是GDP的方差分解,显示cpi的冲击基本上能解释gdp的22%左右。而M1冲击从弱到强,平均能解释25%左右。,三、VECM模型,VECM模型是VAR模型的进一步延伸。如果VAR模型是协整的,则可以构建VAR的误差修正模型VECM模型。步骤:第一、通过VAR模型确定模型的滞后期。第二、确定协整方程,由于VAR模型是多个变量,变量间可能存在多个协整关系,因此用EG两步法来确定协整方程是不完整的,可用Johansen 协整检验来确定。第三、进行稳定性检验。第四、求脉冲响应函数和方差分解。,下面用案列来说明此方法的计算过程,我国房地产相关数据,以季度作为计量单位,房地产销售累计面积(万平方米)Mz,资金来源非自筹(亿元)Cap,本期加权平均利率i(银行间市场加权平均的7天拆借利率),从1999年第1季度到2010年第4季度,数据来自中宏数据库,中国产业分析平台、CCER 数据库,并经过整理得到。数据文件为:房地产相关数据.wf1,,第一步:确定VECM方程中变量的滞后期,一般地,可以用VAR模型回归结果的滞后期,最大滞后期一般选取4。因此最后本例选滞后期为4。结果如下,注意滞后期的确定影响协整结果!,第二步:确定协整方程(采用Johansen 协整检验),EG两步法的缺陷是:在小样本下,参数估计的误差较大,并且当变量超过两个以上时,变量间可能存在多个协整关系,此方法无法找到所有可能的协整向量,其分析结果不容易解释,所以EG两步法主要适用于包括两个变量即存在单一协整关系的系统。针对EG两步法的缺陷,Johansen(1988)提出极大似然估计法(MLE),以检验多变量之间的协整关系,Johansen检验的基本思想是基于VAR模型将一个求极大似然函数的问题转化为一个求特征根和对应的特征向量的问题,以此判断协整关系是否存在以及协整关系的个数,Johansen检验可用于检验多个变量的协整性,同时求出它们之间的若干协整关系。,注意输入的变量顺序(cap I mz)会影响协整方程的变量形式,但不会影响所确定的协整方程个数。,此检验有五个备选项:1)假设序列无均值、无趋势项。并且协整方程中无常数项、无趋势项。2)假设序列无均值、无趋势项。并且协整方程中有常数项、无趋势项。3)假设序列有线性趋势项。并且协整方程中有常数项、无趋势项。4)假设序列有线性趋势项。并且协整方程中有常数项、有线性趋势项。5)假设序列有二次趋势项。并且协整方程中有常数项、有线性趋势项。,外生变量输入,显著性水平输入,一般的选择方法是:选项1和5较少用,只有当所有序列均值都为0时,才适用选1。当所有序列都不含趋势时,适用选项2。当序列含有趋势,并且趋势为随机时,适用选项3。当序列含有趋势,并且某些序列趋势为平稳时,适用选项4。根据本例情况,采用选项3。,结果如右图,在5%显著性水平下,从迹统计量(trace statistic)看,第一:针对没有协整的原假设,结论是:拒绝原假设,有协整关系;(因为32.7433229.7907)第二,针对至多有一个协整关系的原假设,结果是:接受至多存在1个协整关系;第三,针对至多有二个协整关系的原假设,接受至多存在2个协整关系。从最大特征值看不存在协整关系。一般以迹统计量为判断标准。检验下半部分(见下页)给出了一个、二个协整关系的各类协整方程。注意:1、在不同的原假设下,得到不同的结论。2、协整关系是表示若干个变量的协整,并非都是指所有变量之间的协整关系。3、协整方程以某个变量为基准,这里以cap为基准。cap,I,mz的顺序会影响协整方程中的变量结构,但不会影响存在协整方程的个数。,解释:,Johansen 检验的依据:rank(A*B)如果 rank(A*B)=r,表明存在 r 个协整关系.rank 决定于矩阵 A*B 中非零特征根的个数,第一部分为存在一个协整关系的协整方程,给出的是协整向量,写成方程要变负号:Capt=307.866It+0.101095Mzt+1321.24(常数在这里没有显示,可以VAR模型中限定1个协整方程时可显示出来,见下页)。,由于是用MLE法估计,因此似然函数值越大越好。,1个协整关系时的误差项调整系数。即分别对应于CAP,I和MZ的三个方程的误差项滞后1期的系数。,存在2个协整关系时的协整方程和误差项调整系数。最后模型需确定选取1个协整关系还是多个协整关系,从似然函数值看选取1个协整关系要比2个协整关系好一些。然而再计算出结果。还要注意不同的变量顺序其协整方程不同。,如果选择1个协整关系。在VAR估计窗口中选择VEC模型,选择过程如右边几个窗口。,选择1个协整关系,此处是选择协整模型中变量的限制,不是短期调整模型中的变量限制,一般不选。,结果如图,后半部分未列出。Error Correction栏中的CointEq1为ut-1的系数。调整系数的解释:0.368465表示当自筹资金cap比协整均衡水平高时,则下一期的自筹资金往高的方向调整。同时-8.94E-05表示当加权平均利率i比均衡水平高时,下一期加权平均利率往低的方向调整,但调整系数非常微小;当房地产销售累计面积MZ高于均衡水平时,下一期MZ往高方向调整。,园括号和中括号分别为标准差和t统计量。,如果选择2个协整关系,结果如右图。Error Correction栏中的CointEq1 CointEq1分别为协整方程(CAP)和I的ut-1的系数。调整系数的解释:0.142表示当自筹资金cap比协整方程CAP的均衡水平高时,则下一期的自筹资金往高的方向调整。同时-762.8149表示当自筹资金cap比协整方程I的均衡水平高时,下一期CAP往低的方向调整。其它解释同理。,第三、进行稳定性检验,选取1个协整关系和2个协整关系的平稳性检验如右图。基本上没有什么区别,而且都显示出不稳定。从似然函数值看1个协整关系要好一些。,1个协整关系,2个协整关系,第四、求脉冲响应函数和方差分解。,这里是选择1个协整关系的脉冲响应函数图(选择广义脉冲响应),方差分解结果其中一部分。,另外还可以在VECM模型中的短期调整方程中分别加入时间趋势项t。做法如下:在外生变量Exogenous variables栏中加入时间变量t,t要预先输入。可以进行加入前后的拟合效果对比。除了第一个方程外,其它方程的T统计量还是比较显著的。,本章介绍了VAR和VECM模型,还有许多VAR的拓展模型。面板数据的VAR模型(以后有时间用stata讲)。,本章小结,