第6章内生解释变量课件.ppt
《第6章内生解释变量课件.ppt》由会员分享,可在线阅读,更多相关《第6章内生解释变量课件.ppt(52页珍藏版)》请在三一办公上搜索。
1、第六章 内生解释变量,第一节 解释变量内生性的成因与检验第二节 解释变量内生性检测第三节 内生性问题的解决办法,第一节 解释变量内生性的成因与检验,解释变量与随机误差项之间往往存在某种程度的相关性,即:,此时,就称模型存在内生性问题,与随机误差项相关的解释变量称为内生解释变量。,一、解释变量内生性及其影响,这称为解释量的外生性假定。,解释变量与随机误差项是线性无关的(甚至是均值独立的),即要求,内生性会对OLSE的统计性质产生不良影响,1、影响无偏性,如果假定SLR.3(不相关假定)不成立,则一定违背古典假定SLR.3的均值独立假定,即 一定不成立。而假定SLR.3(均值独立)是OLSE无偏性
2、成立的关键假定。由(2.22)知:,=,2、影响一致性,OLSE不再具有一致性。,3、其它影响,其它不良影响还包括,随机误差项的方差估计量是有偏的,由此导致回归系数的方差估计量是有偏的,进而与方差相关的假设检验、区间估计容易导出错误的结论。这些影响需要结合内生性产生的具体的原因进行分析。,二、内生性产生的原因,横截面回归中解释变量内生性产生的原因主要有遗漏变量、错误的函数形式、测量误差和联立性。,1、遗漏变量,在建立计量经济模型时,由于人们认识上的偏差,理论分析的缺陷,或者是有关统计数据的影响,导致有意或无意地忽略了某些重要变量,未能将其作为解释变量引入模型,这种变量就称为遗漏变量(Omitt
3、ed Variable)。被遗漏的变量虽未引入模型,但其对因变量的影响还是存在的,其影响由随机误差项体现出来。如果被遗漏变量和模型中现有的解释变量存在相关,则会造成解释变量与随机误差项的相关,即产生内生性问题。,考虑成年劳动者的工资方程中存在未观测到的能力的问题,(6.1),其中y代表工资的对数,x1代表受教育年限,x2代表个人能力,u是随机误差项。,(6.2),若x2无法准确测量,将其归入随机误差项中,得到如下回归模型:,其中v中包含了x2。显然,若是x2与x1相关,则会导致 , 从而产生内生性问题。,将正确模型(6.1)式代入(6.3)式得,对(6.2)式进行回归, x1的系数估计量为:,
4、(6.3),(6.3),(1)若遗漏的 x2与x1 相关,则(6.4)、(6.5)式中的第二项在小样本的期望与大样本下的概率极限都不会为零,使得普通最小二乘估计量OLSE是有偏的,在大样本下也是不一致的。,(6.5),(2)若 x2与x1不相关,则由(6.4)、(6.5)易知 的估计量满足无偏性与一致性,但这时 的估计却是有偏的。,(3) 随机误差项的方差估计 也是有偏的。,(4) 的方差是真实估计量 的方差的有偏估计。,在搜集数据时,如果遇到所搜集的数据不能确实地反映变量间经济行为的情况,就称模型中包含了测量误差(Measurement Errors)。具体来说,测量误差是指在收集数据过程中
5、的登记误差、在数据加工整理过程中的整理误差以及其他统计误差。测量误差出现的原因是多方面的。首先,调查登记本身就可能产生误差;其次,数据的加工处理过程中也可能导致一定的误差;此外,数据的不当使用也会出现误差,测量误差可能是被解释变量的测量误差,也可能是解释变量的测量误差。,2、测量误差,(1)因变量存在测量误差 ,且与自变量不相关, ,则OLS估计量具有良好的性质,是无偏和一致的。,(2)因变量存在测量误差 ,且与自变量相关, ,则产生内生性问题,OLSE是有偏且不一致的。,测量误差造成的内生性也会影响回归分析的结果。,(3)自变量存在测量误差 ,且与自变量测量值不相关、与随机误差不相关,则估计
6、值是一致的,但方差会变大。,(4)自变量存在测量误差,且与自变量测量值相关,则产生内生性问题,OLSE是不一致的。OLSE常常会低估真实的回归参数。,注意:回归变量的测量误差是数据问题,目前计量经济学家们还提不出有效的解决方法。一般的做法往往是忽略测量误差问题,主观上希望测量误差足够小,从而不破坏回归分析假定的合理性。,例如,如果“真实”的回归函数为,但却将模型设定为,错误的函数形式(Wrong Functional Form)是指在设定模型时,选取了不正确的函数形式。最常见的就是当“真实”的函数形式为非线性时,却选取了线性的函数形式。,3、错误的函数形式,由错误的函数形式造成了内生性,即使其
7、他假设均成立,且样本很大,普通最小二乘估计量也是不一致的。,由于经济现象的错综复杂,大多数经济问题中各变量之间存在反馈效应。要描述经济现象的这种复杂关系,必须从整体和系统的角度进行,建立由多个相互联系的单一方程组成的联立方程模型才能完整表达。正如单方程模型会遇到内生性问题,联立方程模型更容易遇到内生性问题。因为在联立方程模型中,结构式中已包含有其它的内生变量,所以在从结构式到简约式的转化中,自然也把误差项带入了其它的结构式中,产生联立性(Simultaneity),进而不可避免地造成内生性。由于内生性的存在,会使得OLS估计量是有偏的和不一致的。,4、联立性,检验的基本思想:如果不知道遗漏了哪
8、个变量,可寻找一个替代变量来进行遗漏变量检验,替代变量通常选用所设定模型被解释变量的拟合值 的若干次幂的线性组合。若模型估计所得的残差包含着遗漏的相关变量,那么这个残差可用被解释变量拟合值若干次幂的线性组合近似表示;若这个线性组合是显著的,则认为原模型设定有误(遗漏变量)。由于可引入若干个替代变量去判断是否有多个变量被遗漏,所以该方法被称为一般性设定误差检验。,拉姆齐(Ramsey,1969)提出了一种“回归设定误差检验”(Regression Specification Error Test),简称RESET检验。,第二节 解释变量内生性检测,一、RESET检验,第一步:用OLS法对模型(6
9、.7)进行回归估计,RESET检验的基本步骤为:,(6.7),第二步:用被解释变量的拟合值 的若干次幂 的线性组合,测度残差中是否包含着遗漏的相关变量。,具体做法为,在第一步的模型(6.7)中增加一个包含拟合值 的函数。这个函数通常选择为拟合值 的平方、立方和四次方的线性组合。例如:,其中, RSSU为对模型(6.8)(相当于无约束模型)进行回归得到的残差平方和, RSSR 为模型(6.7)(有约束模型)进行回归得到的残差平方和,dfU 和 dfR分别为 前二者的自由度。针对模型(6.8),(6.9)式可以写为:,其中n为样本个数,k为解释变量个数。,第三步:提出原假设: 。构造F统计量:,(
10、6.9),(6.10),第四步:给定显著性水平 ,若F统计值大于等于临界值 ,则拒绝原假设,表明存在设定误差(遗漏变量),否则,说明不存在设定误差(遗漏变量)。类似的,也可以利用F统计值对应的概率值来判断:如果概率值小于等于 ,则拒绝原假设,表明存在设定误差(遗漏变量),否则,说明不存在设定误差(遗漏变量)。,表6-1 城镇居民人均可支配收入和人均消费性支出抽样调查数据(元),例61关于城镇居民的消费行为,某些研究者认为由于有较高的社会福利保障,以绝对收入假说消费函数模型为理论模型,能够得到理想的拟合结果,因而得出城镇居民的消费行为应该服从绝对收入消费理论假说,收入是唯一显著的变量。用表6-1
11、的样本数据验证这一结论是否正确。,模型的参数均通过了0.01水平下的显著性检验,R2=0.998表明拟合效果很好。但是由于我们仅用当期收入来解释消费支出的变化,因此,可能遗漏了相关变量。下面进行RESET检验。,利用EViews做回归,得样本回归方程:,(6.11),由式(6.11)估计出消费性支出 ,在原回归模型中加入新的解释变量 、 后重新估计,发现 的系数不显著,因此,加入变量 进行估计,得到估计结果:,(6.12),F统计量的值大于0.05显著性水平下自由度为(1,16)的F分布的临界值4.49,因此拒绝原假设,表明原模型确实存在设定误差,遗漏了相关变量,所以我们认为消费与收入之间的关
12、系可能并不像一元线性模型那么简单。,RESET检验也可以利用EViews直接来完成。操作方法如下:作y关于x的回归,然后在输出结果窗口选择View / Stability Test / Ramsey RESET Test,在弹出的“Number of Fitted”对话框中,设定代理变量个数为1。点击“OK”,检验结果如下:,计算F统计量:,=106.4448,由于F统计量对应的概率为0,显然小于 0.05,故拒绝原假设,认为遗漏了相关变量。由此可见,我国城镇居民的消费行为,不能认为服从绝对收入消费理论假说,线性模型设定有误。,表6-4 EViews输出结果,豪斯曼内生性检验的具体步骤为:,1
13、.对所研究的回归模型,无论是否存在测量误差,先采用OLS法得到参数估计量。,关于测量误差存在与否的内生性检验是豪斯曼(J. A. Hausman,1978)提出的,其基本思路是,把可能存在测量误差的解释变量与其工具变量做回归,将得到的残差序列作为解释变量加入初始的模型,如果残差序列是显著的,则说明存在测量误差,否则说明不存在测量误差。,二、豪斯曼检验,2.对可能存在测量误差的解释变量,选择与其相关的工具变量(参见本章第3节),将可能存在测量误差的解释变量对选择的工具变量进行回归,并获得回归残差 (作为自变量测量误差的代表)。,3.将回归残差 作为解释变量加入第1步中的回归模型,再次进行OLS估
14、计,得 的参数估计值 及显著性检验结果。,4.若 显著,则认为解释变量的确存在观测误差,反之,认为解释变量不存在测量误差。,其中,ex为某贫困地区地方政府的支出,aid为中央政府的拨款量,inc为贫困地区地方政府的财政收入,pop为该地区的总人口数。现怀疑中央政府的拨款量aid存在测量误差。我们选择贫困人口数ps为工具变量,其原因为扶贫支出是该地区地方政府支出中比重最大的支出,其经费来源主要是依赖中央政府的拨款,而中央政府的拨款与该地区贫困人口数ps有直接关系,因此ps与aid有较高相关性。将aid对ps进行回归,得:,例62 假设利用观测到的样本数据作回归,已得到以下结果:,(6.13),t
15、 = (-0.56) (13.64) (8.12) (-5.17)R2=0.993 F=2190,从上式看出,因为 系数的t值是1.73,小于t的临界值1.96,在0.05的显著性水平下,双侧t检验接受原假设(不存在测量误差),但在0.1的显著性水平上,双侧t检验则拒绝原假设而接受备择假设(存在测量误差)。注意,引进对测量误差可能性的修正,使aid变量的系数变小,这从另一个侧面说明,测量误差夸大了aid对ex的影响。,得到如下的残差变量 :,将 项加入(6.13),再回归得到以下结果:,t = (-1.41) (1.94) (7.55) (-1.29) (1.73),工具变量的选择应满足以下条
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 章内生 解释 变量 课件
链接地址:https://www.31ppt.com/p-1824599.html