《基本回归模型》PPT课件.ppt
《《基本回归模型》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《基本回归模型》PPT课件.ppt(89页珍藏版)》请在三一办公上搜索。
1、1,第三章 基本回归模型,经济计量研究始于经济学中的理论假设,根据经济理论设定变量间的一组关系,如消费理论、生产理论和各种宏观经济理论,对理论设定的关系进行定量刻画,如消费函数中的边际消费倾向、生产函数中的各种弹性等进行实证研究。单方程回归是最丰富多彩和广泛使用的统计技术之一。本章介绍EViews中基本回归技术的使用,说明并估计一个回归模型,进行简单的特征分析并在深入的分析中使用估计结果。随后的章节讨论了检验和预测,以及更高级,专业的技术,如加权最小二乘法、二阶段最小二乘法(TSLS)、非线性最小二乘法、ARIMA/ARIMAX模型、GMM(广义矩估计)、GARCH模型和定性的有限因变量模型。
2、这些技术和模型都建立在本章介绍的基本思想的基础之上。,2,对于本章及随后章节所讨论的技术,可以使用下列的经济计量学教科书作为参考。下面列出了标准教科书(逐渐变难):(1)Pindyck,Rubinfeld(1991),Econometric Models and Economic Forecasts,经济计量模型和经济预测,第三版。(2)Johnston 和 DiNardo(1997),Economtric Methods,经济计量方法,第四版。(3)Greene(1997),Economtric Analysis,经济计量分析,第三版。(4)Davidson 和MacKinon(1993),
3、Estimation and Inference in Econometrics,经济计量学中的估计和推断。,3,3.1 创建方程对象,EViews中的单方程回归估计是用方程对象来完成的。为了创建一个方程对象:从主菜单选择Object/New Object/Equation 或 Quick/Estimation Equation,或者在命令窗口中输入关键词equation。在随后出现的方程说明对话框中说明要建立的方程,并选择估计方法。,4,3.2 在EViews中对方程进行说明,当创建一个方程对象时,会出现如下对话框:,在这个对话框中需要说明三件事:方程说明,估计方法,估计使用的样本。在最上面
4、的编辑框中,可以说明方程:因变量(左边)和自变量(右边)以及函数形式。有两种说明方程的基本方法:列表法和公式法。列表法简单但是只能用于不严格的线性说明;公式法更为一般,可用于说明非线性模型或带有参数约束的模型。,5,3.2.1 列表法 说明线性方程的最简单的方法是列出方程中要使用的变量列表。首先是因变量或表达式名,然后是自变量列表。例如,要说明一个线性消费函数,用一个常数 c 和收入 inc 对消费 csp 作回归,在方程说明对话框上部输入:csp c inc 注意回归变量列表中的序列 c。这是EViews用来说明回归中的常数而建立的序列。EViews在回归中不会自动包括一个常数,因此必须明确
5、列出作为回归变量的常数。内部序列 c 不出现在工作文档中,除了说明方程外不能使用它。在上例中,常数存储于c(1),inc的系数存储于c(2),即回归方程形式为:csp=c(1)+c(2)*inc。,6,在统计操作中会用到滞后序列,可以使用与滞后序列相同的名字来产生一个新序列,把滞后值放在序列名后的括号中。csp c csp(-1)inc 相当的回归方程形式为:csp=c(1)+c(2)csp(-1)+c(3)inc。通过在滞后中使用关键词 to 可以包括一个连续范围的滞后序列。例如:csp c csp(-1 to-4)inc这里csp关于常数,csp(-1),csp(-2),csp(-3),c
6、sp(-4),和inc的回归。,在变量列表中也可以包括自动序列。例如:log(csp)c log(csp(-1)log(inc+inc(-1)/2)相当的回归方程形式为:log(csp)=c(1)+c(2)log(csp(-1)+c(3)log(inc+inc(-1)/2),7,3.2.2 公式法说明方程 当列表方法满足不了要求时,可以用公式来说明方程。许多估计方法(但不是所有的方法)允许使用公式来说明方程。EViews中的公式是一个包括回归变量和系数的数学表达式。要用公式说明一个方程,只需在对话框中变量列表处输入表达式即可。EViews会在方程中添加一个随机附加扰动项并用最小二乘法估计模型中
7、的参数。,8,用公式说明方程的好处是可以使用不同的系数向量。要创建新的系数向量,选择Object/New Object 并从主菜单中选择Matrix-Vector-Coef,为系数向量输入一个名字。然后,选择OK。在New Matrix对话框中,选择Coefficient Vector 并说明向量中应有多少行。带有系数向量图标 的对象会列在工作文档目录中,在方程说明中就可以使用这个系数向量。例如,假设创造了系数向量 a 和beta,各有一行。则可以用新的系数向量代替 c:log(csp)=a(1)+beta(1)*log(csp(-1),9,3.3 在EViews中估计方程,估计方法 说明方程
8、后,现在需要选择估计方法。单击Method:进入对话框,会看到下拉菜单中的估计方法列表:,标准的单方程回归用最小二乘估计。其他的方法在以后的章节中介绍。采用OLS,TSLS,GMM,和ARCH方法估计的方程可以用一个公式说明。非线性方程不允许使用binary,ordered,censored,count模型,或带有ARMA项的方程。,10,3.3.2 估计样本 可以说明估计中要使用的样本。EViews会用当前工作文档样本来填充对话框。,如果估计中使用的任何一个序列的数据丢失了,EViews会临时调整观测值的估计样本以排除掉这些观测值。EViews通过在样本结果中报告实际样本来通知样本已经被调整
9、了。在方程结果的顶部,EViews报告样本已经得到了调整。从1978年2002年期间的25个观测值中,EViews使用了24个观测值。,11,3.3.3 估计选项(Options)EViews提供很多估计选项。这些选项允许进行以下操作:对估计方程加权,计算异方差性,控制估计算法的各种特征。,12,3.4 方程输出,在方程说明对话框中单击OK钮后,EViews显示估计结果:,根据矩阵的概念,标准的回归可以写为:其中:y 是因变量观测值的 T 维向量,X 是解释变量观测值的 T k 维矩阵,T 是观测值个数,k 是解释变量个数,是 k 维系数向量,u 是 T 维扰动项向量。,13,3.4.1 系数
10、结果 1.回归系数(Coefficient)系数框描述了系数 的估计值。最小二乘估计的系数 b 是由以下的公式计算得到的,如果使用列表法说明方程,系数会列在变量栏中相应的自变量名下;如果是使用公式法来说明方程,EViews会列出实际系数 c(1),c(2),c(3)等等。对于所考虑的简单线性模型,系数是在其他变量保持不变的情况下自变量对因变量的边际收益。系数 c 是回归中的常数或者截距-它是当其他所有自变量都为零时预测的基本水平。其他系数可以理解为假设所有其它变量都不变,相应的自变量和因变量之间的斜率关系。,14,例3.1:本例是用中国1978年2006年的数据建立的居民消费方程:cst=c0
11、+c1inct+ut其中:cs 是居民消费;inc 是可支配收入。方程中c0代表自发消费,表示收入等于零时的消费水平;而c1代表了边际消费倾向,0c11,即收入每增加1元,消费将增加 c1 元。从系数中可以看出边际消费倾向是0.73。也即1978年2006年中国居民可支配收入的73%用来消费。,15,2.标准差(Std.Error)标准差项报告了系数估计的标准差。标准差衡量了系数估计的统计可信性-标准差越大,估计中的统计干扰越大。估计系数的协方差矩阵是由以下公式计算得到的:,这里 是残差。而且系数估计值的标准差是这个矩阵对角线元素的平方根。可以通过选择View/Covariance Matri
12、x项来察看整个协方差矩阵。,其中,16,3.t-统计量 t统计量是由系数估计值和标准差之间的比率来计算的,它是用来检验系数为零的假设的。4.概率(P值)结果的最后一项是在误差项为正态分布或系数估计值为渐近正态分布的假设下,指出 t 统计量与实际观测值一致的概率。这个概率称为边际显著性水平或 P 值。给定一个 P 值,可以一眼就看出是拒绝还是接受实际系数为零的双边假设。例如,如果显著水平为5%,P 值小于0.05就可以拒绝系数为零的原假设。对于例1的结果,系数 inc 的零假设在1%的显著水平下被拒绝。,17,3.4.2 方程统计量,1.R2 统计量 R2 统计量衡量在样本内预测因变量值的回归是
13、否成功。R2 是自变量所解释的因变量的方差。如果回归完全符合,统计值会等于1。如果结果不比因变量的均值好,统计值会等于0。R2 可能会由于一些原因成为负值。例如,回归没有截距或常数,或回归包含系数约束,或估计方法采用二阶段最小二乘法或ARCH方法。EViews计算R2 的公式为:,,其中,是残差,是因变量的均值。,18,2.R2 调整 使用R2 作为衡量工具存在的一个问题,即在增加新的自变量时R2 不会减少。在极端的情况下,如果把样本观测值都作为自变量,总能得到R2 为1。R2 调整后的记为,消除R2 中对模型没有解释力的新增变量。计算方法如下:,从不会大于R2,随着增加变量会减小,而且对于很
14、不适合的模型还可能是负值。,19,3.回归标准差(S.E.of regression)回归标准差是在残差的方差的估计值基础之上的一个总结。计算方法如下:,4.残差平方和 残差平方和可以用于很多统计计算中,为了方便,现在将它单独列出:,20,5.对数似然函数值 EViews可以作出根据系数的估计值得到的对数似然函数值(假设误差为正态分布)。似然比检验可通过观察方程严格形式和不严格形式的对数似然值之间的差异来进行。对数似然计算如下:,21,6.Durbin-Watson 统计量 D-W 统计量衡量残差的一阶序列相关性,计算方法如下:,作为一个规则,如果DW值小于2,证明存在正序列相关。在例1的结果
15、中,DW值很小,表明残差中存在序列相关。关于Durbin-Watson统计量和残差序列相关更详细的内容参见“序列相关理论”。对于序列相关还有更好的检验方法。在“序列相关的检验”中,我们讨论Q统计量和 LM检验,这些都是比DW统计量更为一般的序列相关检验方法。,22,7.因变量均值和标准差(S.D)y 的均值和标准差由下面标准公式算出:,8.AIC准则(Akaike Information Criterion)计算公式如下:,其中l 是对数似然值,我们进行模型选择时,AIC值越小越好。例如,可以通过选择最小AIC值来确定一个滞后分布的长度。,23,9.Schwarz准则 Schwarz准则是AI
16、C准则的替代方法:,10.F统计量和边际显著性水平 F统计量检验回归中所有的系数是否为零(除了常数或截距)。对于普通最小二乘模型,F统计量由下式计算:,在原假设为误差正态分布下,统计量服从 F(k 1,T k)分布。,24,F统计量下的P值,即Prob(F-statistic),是F检验的边际显著性水平。如果P值小于所检验的边际显著水平,比如说0.05,则拒绝所有系数都为零的原假设。对于例1,P值为零,因此,我们拒绝回归系数为零的原假设。注意F检验是一个联合检验,即使所有的t统计量都是不显著的,F统计量也可能是高度显著的。,25,3.5 方程操作,3.5.1 方程视图 以三种形式显示方程:EV
17、iews命令形式,带系数符号的代数方程,和有系数估计值的方程。,可以将这些结果剪切和粘贴到支持Windows剪贴板的应用文档中。,26,Estimation Output显示方程结果。Actual,Fitted,Residual以图表和数字的形式显示因变量的实际值和拟合值及残差。Actual,Fitted,Residual Table 以表的形式来显示这些值。,27,Gradients and Derivatives.描述目标函数的梯度和回归函数的导数计算的信息。详细内容参见附录E,“梯度和导数”。Covariance Matrix以表的形式显示系数估计值的协方差矩阵。要以矩阵对象保存协方差矩
18、阵,可以使用cov函数。Coefficient Tests,Residual Tests,and Stability Tests 这些是“定义和诊断检验”中要详细介绍的内容。,28,3.5.2 方程过程,Specify/Estimate.编辑方程说明、改变估计方法、估计样本。Forecast.用估计方程的预测。Make Model 创建一个与被估计方程有关的未命名模型。Update Coefs from Equation 把方程系数的估计值放在系数向量中。Make Regressor Group 创建包含方程中使用的所有变量的未命名组(常数除外)。Made Residual Series.以序
19、列形式保存回归中的残差。Make Derivative Group 创建包含回归函数关于其系数的导数的组。Made Gradient Group 创建包含目标函数关于模型的系数的斜率的组。,29,1.回归方程的函数形式,下面讨论几种形式的回归模型:(1)双对数线性模型(不变弹性模型)(2)半对数模型(3)双曲函数模型(4)多项式回归模型 所有这些模型的一个重要特征是:它们都是参数线性模型,但是变量却不一定是线性的。,(1)双对数线性方程 双对数线性模型估计得到的参数本身就是该变量的弹性。如设Qt 为产值,Pt 为价格,在 log(Qt)=+log(Pt)+ut的估计式中,P 增加1%时,Q 大
20、约增加%,所以相当于Qt的价格弹性。,3.6 线性回归方程的应用实例,30,推导 当 t+1期的P 比上一期增加1%时,有 log(Qt+1)=+log(Pt1.01)=+log(Pt)+log(1.01)=log(Qt)+log(1.01)移项得,log(Qt+1)log(Qt)=log(1.01),即,还原得 因此,P 变化1%时,Q 大约变化%。,例3.3:下面建立我国居民消费的收入弹性方程:log(cspt)=0.25+0.908log(inct)t=(1.66)(55.05)R2=0.99 D.W.=0.45其中cspt 是城镇居民消费,inct 是居民消费可支配收入。,31,方程中
21、消费的收入弹性为0.93,说明我国居民可支配收入每增加1%,将使得居民消费增加0.93%。,32,(2)半对数模型 线性模型与对数线性模型的混合就是半对数模型或 半对数模型包含两种形式,分别为:()()半对数模型也是线性模型,因为参数是以线性形式出现在模型中的。而且,虽然原来的变量 x 和 y 之间是非线性关系,但变量 x(或 y)经过对数变换后,变量ln(x)和 y 之间(或变量 x 和ln(y)之间)是线性关系,因此可以称其为半对数线性模型。类似双对数模型,半对数模型也可以使用OLS估计。,33,半对数模型()和()中的回归系数具有直观的意义:,()即:1表示 x 变化1%导致 y 绝对量
22、的变化量;1表示 x 的变化1单位导致 y 变化的百分比。特别地,如果在半对数模型式()中 x 取为 t(年份),变量 t 按时间顺序依次取值为1,2,T,则 t 的系数度量了 y 的年均增长速度,因此,半对数模型()又称为增长模型。对于增长模型,如果1为正,则 y 有随时间向上增长的趋势;如果1 为负,则 y 有随时间向下变动的趋势,因此 t 可称为趋势变量。宏观经济模型表达式中常有时间趋势,在研究经济长期增长或确定性趋势成分时,常常将产出取对数,然后用时间 t 作解释变量建立回归方程。,34,例3.4:我们建立半对数线性方程,估计我国实际GDP(支出法,样本区间:19782002年)的长期
23、平均增长率,模型形式为其中:GDPPt 表示剔出价格因素的实际GDPt。方程中时间趋势变量的系数估计值是0.094,说明19782002年我国实际GDP 的年平均增长率为9.4%。F值或R2表明模型拟合效果很好,D.W.显示模型存在(正的)自相关。,35,(3)双曲函数模型 形如下式的模型称为双曲函数模型 这是一个变量之间是非线性的模型,因为Xt 是以倒数的形式进入模型的,但这个模型却是参数线性模型,因为模型中参数之间是线性的。这个模型的显著特征是随着Xt 的无限增大,(1/Xt)接近于零。,36,例3.5 美国菲利普斯曲线 利用美国19551984年的数据(附录E.2),根据菲利普斯曲线,即
24、通货膨胀率 t 和失业率 Ut 的反向关系,建立双曲函数:,估计结果表明,菲利普斯曲线所描述的 t 和Ut 的反向关系并不存在。之所以出现这样的背离,主要是因为20世纪70年代出现石油危机,从而引发了“滞胀”,通货膨胀伴随着高失业率。如果考虑到通货膨胀预期的影响,则可以在模型中引入代表通货膨胀预期的变量,比如用通货膨胀前期值来代表。,37,含有通货膨胀预期的菲利普斯曲线估计结果为,可以看出,加入通货膨胀预期因素后,模型的拟合效果很好,而且这时的模型体现出了失业率和通货膨胀率之间的显著的反向变动关系。,38,2.虚拟变量的应用 例3.6:工资差别 为了解工作妇女是否受到了歧视,可以用美国统计局的
25、“当前人口调查”中的截面数据研究男女工资有没有差别。这项多元回归分析研究所用到的变量有:W 雇员的工资(美元/小时)1;若雇员为妇女 SEX=0;男性 ED 受教育的年数 AGE 雇员的年龄 1;若雇员不是西班牙裔也不是白人 NONWH=0;其他 1;若雇员是西班牙裔 HISP=0;其他,39,对206名雇员的样本所进行的研究得到的回归结果为(括号内是t统计量的值):(22.10)(-3.86)R2=0.068 D.W.=1.79 反映雇员性别的虚拟变量SEX在显著性水平 1%下显著。因为工资的总平均是9.60美元,该虚拟变量告诉我们,妇女的平均工资为8.12美元,或比总平均低1.48美元。,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基本回归模型 基本 回归 模型 PPT 课件
链接地址:https://www.31ppt.com/p-5487029.html