Eviews基本回归模型.ppt
1,第三章 基本回归模型,经济计量研究始于经济学中的理论假设,根据经济理论设定变量间的一组关系,如消费理论、生产理论和各种宏观经济理论,对理论设定的关系进行定量刻画,如消费函数中的边际消费倾向、生产函数中的各种弹性等进行实证研究。单方程回归是最丰富多彩和广泛使用的统计技术之一。本章介绍EViews中基本回归技术的使用,说明并估计一个回归模型,进行简单的特征分析并在深入的分析中使用估计结果。随后的章节讨论了检验和预测,以及更高级,专业的技术,如加权最小二乘法、二阶段最小二乘法(TSLS)、非线性最小二乘法、ARIMA/ARIMAX模型、GMM(广义矩估计)、GARCH模型和定性的有限因变量模型。这些技术和模型都建立在本章介绍的基本思想的基础之上。,2,对于本章及随后章节所讨论的技术,可以使用下列的经济计量学教科书作为参考。下面列出了标准教科书(逐渐变难):(1)Pindyck,Rubinfeld(1991),Econometric Models and Economic Forecasts,经济计量模型和经济预测,第三版。(2)Johnston 和 DiNardo(1997),Economtric Methods,经济计量方法,第四版。(3)Greene(1997),Economtric Analysis,经济计量分析,第三版。(4)Davidson 和MacKinon(1993),Estimation and Inference in Econometrics,经济计量学中的估计和推断。,3,3.1 创建方程对象,EViews中的单方程回归估计是用方程对象来完成的。为了创建一个方程对象:从主菜单选择Object/New Object/Equation 或 Quick/Estimation Equation,或者在命令窗口中输入关键词equation。在随后出现的方程说明对话框中说明要建立的方程,并选择估计方法。,4,3.2 在EViews中对方程进行说明,当创建一个方程对象时,会出现如下对话框:,在这个对话框中需要说明三件事:方程说明,估计方法,估计使用的样本。在最上面的编辑框中,可以说明方程:因变量(左边)和自变量(右边)以及函数形式。有两种说明方程的基本方法:列表法和公式法。列表法简单但是只能用于不严格的线性说明;公式法更为一般,可用于说明非线性模型或带有参数约束的模型。,5,3.2.1 列表法 说明线性方程的最简单的方法是列出方程中要使用的变量列表。首先是因变量或表达式名,然后是自变量列表。例如,要说明一个线性消费函数,用一个常数 c 和收入 inc 对消费 csp 作回归,在方程说明对话框上部输入:csp c inc 注意回归变量列表中的序列 c。这是EViews用来说明回归中的常数而建立的序列。EViews在回归中不会自动包括一个常数,因此必须明确列出作为回归变量的常数。内部序列 c 不出现在工作文档中,除了说明方程外不能使用它。在上例中,常数存储于c(1),inc的系数存储于c(2),即回归方程形式为:csp=c(1)+c(2)*inc。,6,在统计操作中会用到滞后序列,可以使用与滞后序列相同的名字来产生一个新序列,把滞后值放在序列名后的括号中。csp c csp(-1)inc 相当的回归方程形式为:csp=c(1)+c(2)csp(-1)+c(3)inc。通过在滞后中使用关键词 to 可以包括一个连续范围的滞后序列。例如:csp c csp(-1 to-4)inc这里csp关于常数,csp(-1),csp(-2),csp(-3),csp(-4),和inc的回归。,在变量列表中也可以包括自动序列。例如:log(csp)c log(csp(-1)log(inc+inc(-1)/2)相当的回归方程形式为:log(csp)=c(1)+c(2)log(csp(-1)+c(3)log(inc+inc(-1)/2),7,3.2.2 公式法说明方程 当列表方法满足不了要求时,可以用公式来说明方程。许多估计方法(但不是所有的方法)允许使用公式来说明方程。EViews中的公式是一个包括回归变量和系数的数学表达式。要用公式说明一个方程,只需在对话框中变量列表处输入表达式即可。EViews会在方程中添加一个随机附加扰动项并用最小二乘法估计模型中的参数。,8,用公式说明方程的好处是可以使用不同的系数向量。要创建新的系数向量,选择Object/New Object 并从主菜单中选择Matrix-Vector-Coef,为系数向量输入一个名字。然后,选择OK。在New Matrix对话框中,选择Coefficient Vector 并说明向量中应有多少行。带有系数向量图标 的对象会列在工作文档目录中,在方程说明中就可以使用这个系数向量。例如,假设创造了系数向量 a 和beta,各有一行。则可以用新的系数向量代替 c:log(csp)=a(1)+beta(1)*log(csp(-1),9,3.3 在EViews中估计方程,估计方法 说明方程后,现在需要选择估计方法。单击Method:进入对话框,会看到下拉菜单中的估计方法列表:,标准的单方程回归用最小二乘估计。其他的方法在以后的章节中介绍。采用OLS,TSLS,GMM,和ARCH方法估计的方程可以用一个公式说明。非线性方程不允许使用binary,ordered,censored,count模型,或带有ARMA项的方程。,10,3.3.2 估计样本 可以说明估计中要使用的样本。EViews会用当前工作文档样本来填充对话框。,如果估计中使用的任何一个序列的数据丢失了,EViews会临时调整观测值的估计样本以排除掉这些观测值。EViews通过在样本结果中报告实际样本来通知样本已经被调整了。在方程结果的顶部,EViews报告样本已经得到了调整。从1978年2002年期间的25个观测值中,EViews使用了24个观测值。,11,3.3.3 估计选项(Options)EViews提供很多估计选项。这些选项允许进行以下操作:对估计方程加权,计算异方差性,控制估计算法的各种特征。,12,3.4 方程输出,在方程说明对话框中单击OK钮后,EViews显示估计结果:,根据矩阵的概念,标准的回归可以写为:其中:y 是因变量观测值的 T 维向量,X 是解释变量观测值的 T k 维矩阵,T 是观测值个数,k 是解释变量个数,是 k 维系数向量,u 是 T 维扰动项向量。,13,3.4.1 系数结果 1.回归系数(Coefficient)系数框描述了系数 的估计值。最小二乘估计的系数 b 是由以下的公式计算得到的,如果使用列表法说明方程,系数会列在变量栏中相应的自变量名下;如果是使用公式法来说明方程,EViews会列出实际系数 c(1),c(2),c(3)等等。对于所考虑的简单线性模型,系数是在其他变量保持不变的情况下自变量对因变量的边际收益。系数 c 是回归中的常数或者截距-它是当其他所有自变量都为零时预测的基本水平。其他系数可以理解为假设所有其它变量都不变,相应的自变量和因变量之间的斜率关系。,14,例3.1:本例是用中国1978年2006年的数据建立的居民消费方程:cst=c0+c1inct+ut其中:cs 是居民消费;inc 是可支配收入。方程中c0代表自发消费,表示收入等于零时的消费水平;而c1代表了边际消费倾向,0c11,即收入每增加1元,消费将增加 c1 元。从系数中可以看出边际消费倾向是0.73。也即1978年2006年中国居民可支配收入的73%用来消费。,15,2.标准差(Std.Error)标准差项报告了系数估计的标准差。标准差衡量了系数估计的统计可信性-标准差越大,估计中的统计干扰越大。估计系数的协方差矩阵是由以下公式计算得到的:,这里 是残差。而且系数估计值的标准差是这个矩阵对角线元素的平方根。可以通过选择View/Covariance Matrix项来察看整个协方差矩阵。,其中,16,3.t-统计量 t统计量是由系数估计值和标准差之间的比率来计算的,它是用来检验系数为零的假设的。4.概率(P值)结果的最后一项是在误差项为正态分布或系数估计值为渐近正态分布的假设下,指出 t 统计量与实际观测值一致的概率。这个概率称为边际显著性水平或 P 值。给定一个 P 值,可以一眼就看出是拒绝还是接受实际系数为零的双边假设。例如,如果显著水平为5%,P 值小于0.05就可以拒绝系数为零的原假设。对于例1的结果,系数 inc 的零假设在1%的显著水平下被拒绝。,17,3.4.2 方程统计量,1.R2 统计量 R2 统计量衡量在样本内预测因变量值的回归是否成功。R2 是自变量所解释的因变量的方差。如果回归完全符合,统计值会等于1。如果结果不比因变量的均值好,统计值会等于0。R2 可能会由于一些原因成为负值。例如,回归没有截距或常数,或回归包含系数约束,或估计方法采用二阶段最小二乘法或ARCH方法。EViews计算R2 的公式为:,,其中,是残差,是因变量的均值。,18,2.R2 调整 使用R2 作为衡量工具存在的一个问题,即在增加新的自变量时R2 不会减少。在极端的情况下,如果把样本观测值都作为自变量,总能得到R2 为1。R2 调整后的记为,消除R2 中对模型没有解释力的新增变量。计算方法如下:,从不会大于R2,随着增加变量会减小,而且对于很不适合的模型还可能是负值。,19,3.回归标准差(S.E.of regression)回归标准差是在残差的方差的估计值基础之上的一个总结。计算方法如下:,4.残差平方和 残差平方和可以用于很多统计计算中,为了方便,现在将它单独列出:,20,5.对数似然函数值 EViews可以作出根据系数的估计值得到的对数似然函数值(假设误差为正态分布)。似然比检验可通过观察方程严格形式和不严格形式的对数似然值之间的差异来进行。对数似然计算如下:,21,6.Durbin-Watson 统计量 D-W 统计量衡量残差的一阶序列相关性,计算方法如下:,作为一个规则,如果DW值小于2,证明存在正序列相关。在例1的结果中,DW值很小,表明残差中存在序列相关。关于Durbin-Watson统计量和残差序列相关更详细的内容参见“序列相关理论”。对于序列相关还有更好的检验方法。在“序列相关的检验”中,我们讨论Q统计量和 LM检验,这些都是比DW统计量更为一般的序列相关检验方法。,22,7.因变量均值和标准差(S.D)y 的均值和标准差由下面标准公式算出:,8.AIC准则(Akaike Information Criterion)计算公式如下:,其中l 是对数似然值,我们进行模型选择时,AIC值越小越好。例如,可以通过选择最小AIC值来确定一个滞后分布的长度。,23,9.Schwarz准则 Schwarz准则是AIC准则的替代方法:,10.F统计量和边际显著性水平 F统计量检验回归中所有的系数是否为零(除了常数或截距)。对于普通最小二乘模型,F统计量由下式计算:,在原假设为误差正态分布下,统计量服从 F(k 1,T k)分布。,24,F统计量下的P值,即Prob(F-statistic),是F检验的边际显著性水平。如果P值小于所检验的边际显著水平,比如说0.05,则拒绝所有系数都为零的原假设。对于例1,P值为零,因此,我们拒绝回归系数为零的原假设。注意F检验是一个联合检验,即使所有的t统计量都是不显著的,F统计量也可能是高度显著的。,25,3.5 方程操作,3.5.1 方程视图 以三种形式显示方程:EViews命令形式,带系数符号的代数方程,和有系数估计值的方程。,可以将这些结果剪切和粘贴到支持Windows剪贴板的应用文档中。,26,Estimation Output显示方程结果。Actual,Fitted,Residual以图表和数字的形式显示因变量的实际值和拟合值及残差。Actual,Fitted,Residual Table 以表的形式来显示这些值。,27,Gradients and Derivatives.描述目标函数的梯度和回归函数的导数计算的信息。详细内容参见附录E,“梯度和导数”。Covariance Matrix以表的形式显示系数估计值的协方差矩阵。要以矩阵对象保存协方差矩阵,可以使用cov函数。Coefficient Tests,Residual Tests,and Stability Tests 这些是“定义和诊断检验”中要详细介绍的内容。,28,3.5.2 方程过程,Specify/Estimate.编辑方程说明、改变估计方法、估计样本。Forecast.用估计方程的预测。Make Model 创建一个与被估计方程有关的未命名模型。Update Coefs from Equation 把方程系数的估计值放在系数向量中。Make Regressor Group 创建包含方程中使用的所有变量的未命名组(常数除外)。Made Residual Series.以序列形式保存回归中的残差。Make Derivative Group 创建包含回归函数关于其系数的导数的组。Made Gradient Group 创建包含目标函数关于模型的系数的斜率的组。,29,1.回归方程的函数形式,下面讨论几种形式的回归模型:(1)双对数线性模型(不变弹性模型)(2)半对数模型(3)双曲函数模型(4)多项式回归模型 所有这些模型的一个重要特征是:它们都是参数线性模型,但是变量却不一定是线性的。,(1)双对数线性方程 双对数线性模型估计得到的参数本身就是该变量的弹性。如设Qt 为产值,Pt 为价格,在 log(Qt)=+log(Pt)+ut的估计式中,P 增加1%时,Q 大约增加%,所以相当于Qt的价格弹性。,3.6 线性回归方程的应用实例,30,推导 当 t+1期的P 比上一期增加1%时,有 log(Qt+1)=+log(Pt1.01)=+log(Pt)+log(1.01)=log(Qt)+log(1.01)移项得,log(Qt+1)log(Qt)=log(1.01),即,还原得 因此,P 变化1%时,Q 大约变化%。,例3.3:下面建立我国居民消费的收入弹性方程:log(cspt)=0.25+0.908log(inct)t=(1.66)(55.05)R2=0.99 D.W.=0.45其中cspt 是城镇居民消费,inct 是居民消费可支配收入。,31,方程中消费的收入弹性为0.93,说明我国居民可支配收入每增加1%,将使得居民消费增加0.93%。,32,(2)半对数模型 线性模型与对数线性模型的混合就是半对数模型或 半对数模型包含两种形式,分别为:()()半对数模型也是线性模型,因为参数是以线性形式出现在模型中的。而且,虽然原来的变量 x 和 y 之间是非线性关系,但变量 x(或 y)经过对数变换后,变量ln(x)和 y 之间(或变量 x 和ln(y)之间)是线性关系,因此可以称其为半对数线性模型。类似双对数模型,半对数模型也可以使用OLS估计。,33,半对数模型()和()中的回归系数具有直观的意义:,()即:1表示 x 变化1%导致 y 绝对量的变化量;1表示 x 的变化1单位导致 y 变化的百分比。特别地,如果在半对数模型式()中 x 取为 t(年份),变量 t 按时间顺序依次取值为1,2,T,则 t 的系数度量了 y 的年均增长速度,因此,半对数模型()又称为增长模型。对于增长模型,如果1为正,则 y 有随时间向上增长的趋势;如果1 为负,则 y 有随时间向下变动的趋势,因此 t 可称为趋势变量。宏观经济模型表达式中常有时间趋势,在研究经济长期增长或确定性趋势成分时,常常将产出取对数,然后用时间 t 作解释变量建立回归方程。,34,例3.4:我们建立半对数线性方程,估计我国实际GDP(支出法,样本区间:19782002年)的长期平均增长率,模型形式为其中:GDPPt 表示剔出价格因素的实际GDPt。方程中时间趋势变量的系数估计值是0.094,说明19782002年我国实际GDP 的年平均增长率为9.4%。F值或R2表明模型拟合效果很好,D.W.显示模型存在(正的)自相关。,35,(3)双曲函数模型 形如下式的模型称为双曲函数模型 这是一个变量之间是非线性的模型,因为Xt 是以倒数的形式进入模型的,但这个模型却是参数线性模型,因为模型中参数之间是线性的。这个模型的显著特征是随着Xt 的无限增大,(1/Xt)接近于零。,36,例3.5 美国菲利普斯曲线 利用美国19551984年的数据(附录E.2),根据菲利普斯曲线,即通货膨胀率 t 和失业率 Ut 的反向关系,建立双曲函数:,估计结果表明,菲利普斯曲线所描述的 t 和Ut 的反向关系并不存在。之所以出现这样的背离,主要是因为20世纪70年代出现石油危机,从而引发了“滞胀”,通货膨胀伴随着高失业率。如果考虑到通货膨胀预期的影响,则可以在模型中引入代表通货膨胀预期的变量,比如用通货膨胀前期值来代表。,37,含有通货膨胀预期的菲利普斯曲线估计结果为,可以看出,加入通货膨胀预期因素后,模型的拟合效果很好,而且这时的模型体现出了失业率和通货膨胀率之间的显著的反向变动关系。,38,2.虚拟变量的应用 例3.6:工资差别 为了解工作妇女是否受到了歧视,可以用美国统计局的“当前人口调查”中的截面数据研究男女工资有没有差别。这项多元回归分析研究所用到的变量有:W 雇员的工资(美元/小时)1;若雇员为妇女 SEX=0;男性 ED 受教育的年数 AGE 雇员的年龄 1;若雇员不是西班牙裔也不是白人 NONWH=0;其他 1;若雇员是西班牙裔 HISP=0;其他,39,对206名雇员的样本所进行的研究得到的回归结果为(括号内是t统计量的值):(22.10)(-3.86)R2=0.068 D.W.=1.79 反映雇员性别的虚拟变量SEX在显著性水平 1%下显著。因为工资的总平均是9.60美元,该虚拟变量告诉我们,妇女的平均工资为8.12美元,或比总平均低1.48美元。,40,在回归模型中加入年龄AGE和受教育年数ED以及种族或民族,性别虚拟变量仍然是显著的:(-3.38)(-4.61)(8.54)(4.63)(-1.07)(0.22)R2=0.367 D.W.=1.78,41,最后考虑年龄AGE与工资W之间非线性关系的可能性时,男女差别还是显著存在的。这一点可以由下列回归结果看出:(-4.59)(-4.50)(7.98)(-1.22)(0.28)(3.87)(-3.18)R2=0.398 D.W.=1.75,这个回归模型的年龄AGE项说明,在其他条件不变的情况下,雇员的工资率随着他的年龄的增长而增长(系数为0.62),但是增加的速度越来越慢(-0.0063)。进一步的研究表明,工资在雇员的年龄为49.2岁时达到最大,之后逐年下降。,42,例3.7 季节虚拟变量 当使用含有季节因素的经济数据进行回归分析时,可以对数据进行季节调整消除原数据带有的季节性影响,也可以使用虚拟变量描述季节因素,进而可以同时计算出各个不同季度对经济变量的不同影响。如果用虚拟变量,这时包含了4个季度的4种分类,需要建立3个虚拟变量。用Qi表示第i个季度取值为1,其他季度取值为0的季节虚拟变量,显然Q1+Q2+Q3+Q4=1,如果模型中包含常数项,则只能加入Q1,Q2,Q3,否则模型将因为解释变量的线性相关而无法估计,即导致虚拟变量陷阱问题。当使用月度数据时,方法与上述类似,但需要有11个虚拟变量。,43,图3.1-1 社会消费品零售总额RS 图3.1-2 GDP,通过图3.1,可以看出1995年1季度2003年1季度的季度GDP和社会消费品零售额RS存在明显的季节因素(数据见附录E表E.4),GDP通常逐季增加,也有一些年份中第二季度高于第三季度。RS在第一季度增加,第二季度减小,第三季度略有上升,第四季度达到高峰。,44,下面利用季度数据对我国的国民生产总值GDP和社会消费品零售额RS进行回归分析,分别考虑不包含和包含虚拟变量的情形。不包含虚拟变量的回归结果为()t=(2.53)(14.9)R2=0.88 D.W.=2.13 使用虚拟变量的回归方程结果为 t=(-4.82)(17.93)(7.58)(6.14)(52.83)()R2=0.99 D.W.=1.99,45,可以看出包含虚拟变量的方程明显地改进了拟合能力。这种季节调整方法是以季节变动要素不变并且服从于加法模型为前提,否则应该首先运用X-12或其他方法对数据进行季节调整。,图3.2 SL的实际曲线(实线)和拟合曲线(虚线)(左、右图分别由式(3.3.9),(3.3.10)得到),46,3.7 估计中存在的问题,如果自变量具有高度共线性,EViews 在计算回归估计时会遇到困难。在这种情况下,EViews会产生一个显示错误信息对话框“奇异矩阵”。出现这个错误信息后,应该检查回归变量是否是共线的。如果一个回归变量可以写作其他回归变量的线性组合,则回归变量是完全共线的。在完全共线的情况下,回归变量矩阵X不是列满秩的,不能计算OLS估计值。,47,3.8 定义和诊断检验,经验研究经常是一种相互影响的过程。这一过程从估计关系的定义开始。选择定义常含有几个选择:变量,连接这些变量的函数,以及当数据是时间序列时表示变量间关系的动态结构。不可避免地,在初始定义的恰当性方面存在不确定性。一旦估计了方程,EViews提供了评价方程定义质量的工具。随着改进,检验结果将影响所选择的定义,这一过程将重复下去,直到方程定义恰当为止。本节描述了在方程对象的View中关于定义检验统计量的多个菜单。我们试图提供足够的统计方法来进行这些检验,但是实际考虑的许多描述是不完全的,建议查阅标准统计和经济计量学参考资料。,48,下面描述的每一检验过程包括假设检验的原假设定义。检验指令输出包括一个或多个检验统计量样本值和它们的联合概率值(P值)。P值说明在原假设为真的情况下,样本统计量绝对值的检验统计量大于或等于临界值的概率。P值度量的是犯第一类错误的概率,即拒绝正确的原假设的概率,P值越大,错误地拒绝原假设的可能性就越大;P值越小,拒绝原假设时就越放心。例如,如果P值在0.01和0.05之间,原假设在5%显著性水平被拒绝而不是在1%水平。切记:对每一检验都有不同假设和分布结果。例如,有些检验统计量有确切的有限的样本分布(常为 t 或 F分布)。其它是服从近似分布的大样本检验统计量。每一检验的内容都不同,将分别描述。,49,其它检验在其它章节讨论。它们包括单位根检验、Granger因果检验和Johansen协整检验。,方程对象菜单的View中给出三种检验类型选择来检验方程定义。包括系数检验、残差检验和稳定性检验:,50,3.8.1 系数检验,系数检验对估计系数的约束进行评价,包括对遗漏变量和冗余变量特殊情况的检验。,一、Wald检验系数约束条件检验,1.Wald检验原理 Wald检验没有把原假设定义的系数限制加入回归,通过估计这一无限制回归来计算检验统计量。Wald统计量计算无约束估计量如何满足原假设下的约束。如果约束为真,无约束估计量应接近于满足约束条件。下面给出计算Wald 检验统计量的一般公式。,51,对于一个线性回归模型,一个线性约束:,式中R是一个已知的 q k 阶矩阵,r 是 q 维向量。Wald统计量简写为,b 为没有加入约束得到的参数估计值:,W 在H0下服从渐近2(q)分布。进一步假设误差独立同时服从正态分布,我们就有一确定的、有限的样本F-统计量,是约束回归的残差向量。F统计量比较有约束和没有约束计算出的残差平方和。如果约束有效,这两个残差平方和差异很小,F统计量值也应很小。EViews显示2 和F统计量以及相应的P值。,52,2.如何进行Wald系数检验,为介绍如何进行Wald系数检验,我们考虑一个例子。生产函数的数学形式为,在最初提出的C-D生产函数中,假定参数满足+=1,也就是假定研究对象满足规模报酬不变。,Q 为产出,K 为资本投入,L 为劳动力投入。很容易推出参数,分别是资本和劳动的产出弹性。那么由产出弹性的经济意义,应该有,即当资本与劳动的数量同时增长倍时,产出量也增长 倍。1937年,提出了C-D生产函数的改进型,即取消了+=1 的假定,允许要素的产出弹性之和大于1或小于1,即承认研究对象可以是规模报酬递增的,也可以是规模报酬递减的,取决于参数的估计结果。,53,例3.8 Cobb-Douglas生产函数估计形式如下:,利用美国主要金属工业企业的数据(27个企业的数据),C-D生产函数估计结果如下:,(1),54,从结果看LogL和logK的系数和小于1,但为确定这种差异是统计相关的,我们常进行有约束的Wald系数检验。选择View/Coefficient Tests/Wald-Coefficient Restrictions,在编辑对话框中输入约束条件。约束条件应表示为含有估计参数和常数(不可以含有序列名)的方程,系数应表示为c(1),c(2)等等,除非在估计中已使用过一个不同的系数向量。为检验+=1 的规模报酬不变的假设,在对话框中输入下列约束:c(2)+c(3)=1单击OK,EViews显示Wald检验如下结果(原假设:约束条件有效):,EViews显示F统计量和 2 统计量及相应的P值。2 统计量等于F 统计量乘以检验约束条件数。本例中,仅有一个约束条件,所以这两个检验统计量等价。它们的P值表明我们可以确定地接受规模报酬不变的原假设。,55,下面考虑检验多个约束条件的情况。例如,改变前面的C-D生产函数为非线性形式,我们估计一个如下形式的生产函数,检验约束条件:。这个非线性模型的估计结果如下:,56,检验多个约束条件,应用逗号隔开约束条件。在方程对话框中选择View/Coefficient tests/Wald Coefficient Restrictions。在Wald检验对话框中输入如下约束条件:c(4)=0,c(5)=0,c(6)=0,结果如下:,检验结果是不能拒绝原假设,表明(1)式的Cobb-Douglas生产函数是这一问题较适当的方程定义形式。,57,二、遗漏变量(Omitted Variables)检验,1.遗漏变量检验原理 这一检验能给现有方程添加变量,而且询问添加的变量对解释因变量变动是否有显著作用。原假设H0是添加变量不显著。检验的输出是 F 统计量和似然比(LR)统计量及各自P值,以及在备选假设下无约束模型估计结果。F统计量基于约束和无约束回归残差平方和之差。LR统计量由下式计算:,Lr和Lu是约束和无约束回归对数似然函数的最大值。在H0下,LR统计量服从渐近2 分布,自由度等于约束条件数,即加入变量数。,58,注意:(1)遗漏变量检验要求在原始方程中和检验方程中观测值数相等。如果要加入变量的任一序列与原方程样本相比,含有缺失观测值(当加入滞后变量时这种情况常见),检验统计量将无法建立。(2)遗漏变量检验可应用于线性LS,TSLS,ARCH,Binary,Ordered,Censored,Count模型估计方程。只有通过列表法列出回归因子定义方程而不能通过公式,检验才可以进行。2.如何进行遗漏变量检验 选择View/Coefficient Tests/Omitted VariablesLikelihood Ration,在打开的对话框中,列出检验统计量名,用至少一个空格相互隔开。,59,例如:原始回归为:log(q)c log(L)log(k)。输入:K L EViews将显示含有这两个附加解释变量的无约束回归结果,而且显示原假设:新添变量系数为0 的检验统计量。输出的结果如下:,对数似数比统计量就是LR检验统计量且渐进服从于2 分布,自由度等于添加回归因子数。本例中,检验结果不能拒绝原假设,即添加变量不显著。,60,三、冗余(Redundant Variables)变量,1.冗余变量检验原理 冗余变量检验可以检验方程中一部分变量的统计显著性。更正式,可以确定方程中一部分变量系数是否为0,从而可以从方程中剔出去。原假设:被检验变量系数为0。冗余变量检验可以应用于线性LS,TSLS,ARCH(仅均值方程),Binary,Ordered,Censored,Count模型估计方程。只有以列表法列出回归因子形式,而不是公式定义方程,检验才可以进行。2.如何进行冗余变量检验 选择View/Coefficient Tests/Redundant Variablelikelihood Ratio,在对话框中,输入每一检验的变量名,相互间至少用一空格隔开。,61,例如:原始回归为 log(Q)c log(L)log(K)K L 如果输入增加的变量K和L,EViews显示去掉这两个回归因子的约束回归结果,以及检验原假设:被检验变量系数为0 的统计量。结果如下:,检验统计量是F统计量和对数似然比。如果误差是独立正态分布随机变量,F统计量有确定有限样本F分布,分子自由度为原假设下系数约束条件数,分母自由度为总回归自由度。LR检验是渐近检验,服从2 分布。,62,3.8.2 残差检验,EViews提供了对估计方程残差的序列相关,正态性,异方差性和自回归条件异方差性检验。,63,(1)相关图和Q统计量(2)平方残差相关图(3)残差直方图和正态检验 显示残差直方图和残差的描述统计量,包括检验残差正态性的Jarque-Bera统计量。如果残差服从正态分布,直方图应呈钟型,J-B统计量应不显著。也适用于LS,TSLS,非线性LS等模型残差。选择View/Residual Tests/Histogram Normality显示直方图和J-B统计量。在原假设:残差正态分布下,J-B统计量应服从2 分布,自由度为2。(4)序列相关LM检验(5)ARCH LM检验(6)White异方差性检验,64,3.8.3 定义和稳定性检验,一个推荐的经验方法是把观测值区间T分为T1和T2两部分。T1个观测值用于估计,T2个观测值用于检验和评价。把所有样本数据用于估计,有利于形成最好的拟合,但没有考虑到模型检验,也无法检验参数不变性,估计关系的稳定性。检验预测效果要用估计时未用到的数据,建模时常用T1区间估计模型,用T2区间检验和评价效果。对于子区间T1和T2的相对大小,没有太明确的规则。有时可能会出现明显的结构变化的转折点,例如战争,石油危机等。当看不出有转折点时,常用的经验方法是用85%-90%的数据作估计,剩余的数据作检验。,EViews提供了一些检验统计量选项,它们检查模型参数在数据的不同子区间是否平稳。,65,1.Chow分割点检验,Chow分割点检验的思想是对每一个子样本区间估计方程,看估计方程中是否存在显著差异。显著差异说明关系中存在结构变化。例如,可以使用这个检验来检查石油危机前后的能源需求函数是否一样。为进行检验,把数据分为两个或多个子样本区间,每一子区间包含的观测值数应大于方程参数,这样才使得方程能被估计。Chow分割点检验基于比较利用整个样本估计方程获得的残差平方和及利用每一子区间样本估计方程获得的残差平方和之间的差别。对Chow分割点检验,EViews提供了两个检验统计量。F统计量和对数似然比(LR)统计量,F统计量基于对约束和非约束残差平方和的比较。在最简单情况下(一个分割点),计算如下:,66,Chow分割点检验的原假设:不存在结构变化。Chow分割点检验的主要缺陷是,如果每一个子区间要求至少和被估计参数一样多的样本数,那么这里就存在一个问题,比如说,要检验战争和和平时期的结构变化,但是战争时期的样本数较少。下面要讨论的Chow预测检验可以解决这个问题。,其中:是整个样本期间估计的残差平方和;是第 i 个子区间的残差平方和;T 是观测值数;k 是方程参数个数,这一公式可以扩展为多于一个分割点。,67,为了进行Chow分割点检验,选择View/Stability Tests/Chow Breakpoint Test出现对话框以后,填入间断点的日期。比如,如果方程的数据是从1978到2002年,填入1994,则被定义成两个子区间:一个是1978到1993,另一个是1994到2002。例3.9 我们利用Chow检验来判断例3.1所建立的消费函数的稳定性。20世纪90年代前的中国仍然处于卖方市场,虽然居民收入水平增幅较大,但商品供给有限,而且当时的利息率较高,因而居民收入更加倾向于储蓄增值而不是立即消费。1994年我国开始了全面的体制改革和制度创新,随着国有企业体制改革的推进和大量非国有企业的兴起并日益壮大,国内商品市场日益繁荣,商品品种更加丰富,使得居民收入用于消费的部分增加。不妨以1994年为假想的间断点,用Chow检验判断1994之前和之后的两段时期消费函数是否产生了显著的差异。该结果是拒绝原假设(不存在结构变化):即1994前后存在结构变化。,68,Chow预测检验先估计了包括T1区间子样本的所有样本观测值的模型,然后用同样的模型去估计T1区间样本的因变量的值。如果两个估计值差异很大,就说明模型可能不稳定。检验适用于最小二乘法和二阶段最小二乘法。EViews给出F统计量计算如下:这里 用所有样本观测值估计方程的残差平方和,是用T1子样本进行估计方程的残差平方和,k 是被估计参数的个数。当误差是独立同正态分布时,F统计量服从精确的有限样本的F分布。,2.Chow预测检验,69,选择View/Stability Test/Chow Forecast Test进行Chow预测检验。对预测样本开始时期或观测值数进行定义。数据应在当前观测值区间内。仍以例3.1所建立的消费函数为例,定义1994作为预测区间第一个分割点。检验重新估计19781994的方程,并且使用这个结果来计算剩余时期的预测误差。结果如下:,对数似然比(LR)统计量拒绝原假设,中国的消费函数在1994年前后有结构变化,但F统计量不能拒绝原假设。注意:本例说明两种Chow检验产生相同的结果。但有时也会产生相反的结果。,70,3.9 EViews中的方程预测,为说明一个被估计方程的预测过程,我们仍然考虑例3.1中的模型,如果要对此模型的预测功能进行评价,可以用19781999年的22年数据进行参数估计,用20002002年的数据作为检验性数据,考察实际值和预测值的差别。,71,用19782004年的22年数据进行参数估计的结果:,72,3.9.1 如何进行预测,为预测该方程的实际消费csp,在方程的工具栏中按Forecast按钮,或选择Procss/Forecast。这时会出现对话框:,73,我们应提供如下信息:1.序列名 预测后的序列名 将所要预测的因变量名填入编辑框中。EViews默认了一个名字,但可以将它变为任意别的有效序列名。这个名字应不同于因变量名,因为预测过程会覆盖已给定的序列值。S.E.(Optional)如果需要,可以为该序列的预测标准差提供一个名字。如果省略该项,预测标准误差将不被保存。GARCH(Optional)对用ARCH估计的模型,还可以保存条件方差的预测值(GARCH项)。见6章对GARCH估计的讨论。,74,2.预测方法 动态(Dynamic)从预测样本的第一期开始计算多步预测。静态(Static)利用滞后因变量的实际值计算一步向前(one-step-ahead)预测的结果。结构(Structural)预测时EViews将忽略方程中的任何ARMA项。若不选此项,在方程中有ARMA项时,动态与静态方法都会对残差进行预测。但如果选择了Structural,所有预测都会忽略残差项而只对模型的结构部分进行预测。样本区间(Sample range)必须指定用来做预测的样本。如果缺选,EViews将该样本置为工作文件样本。如果指定的样本超出估计方程所使用的样本区间(估计样本),那么会使EViews产生样本外预测。注意:需要提供样本外预测期间的解释变量值。对静态预测,还必须提供滞后因变量的数值。,75,3.输出 可以选择以图表或数值,或者二者同时的形式来观察预测值。注意:预测值被保存在