内生性产生的原因及解决方案.ppt
《内生性产生的原因及解决方案.ppt》由会员分享,可在线阅读,更多相关《内生性产生的原因及解决方案.ppt(114页珍藏版)》请在三一办公上搜索。
1、第五讲 内生性,OLS经典假设 所有的解释变量Xi与随机误差项彼此之间不相关。,若解释变量Xi和ui相关,则OLS估计量是非一致的,也就是即使当样本容量很大时,OLS估计量也不会接近回归系数的真值。当解释变量和随机误差项相关时,模型存在着内生性问题。,在计量经济学中,把所有与扰动项相关的解释变量都称为“内生变量”。这与一般经济学理论中的定义有所不同。1。与误差项相关的变量称为内生变量(endogenous variable)。2。与误差项不相关的变量称为外生变量(exogenous variable)。,造成误差项与回归变量相关(内生性)的原因很多,但我们主要考虑如下几个方面:遗漏变量偏差变量
2、有测量误差双向因果关系。,遗漏变量偏差,变量有测量误差测量数据正确时:假设方程为:,当存在测量误差时:方程为:,所以我们有:,可知,误差项中包含,所以可以得到:如果,则回归结果有偏,非一致,我们假设,则有,结论:1。由于,2。回归的性质决定于w的标准差,双向因果关系之前我们假定因果关系是从回归变量到因变量的(X导致了Y)。但如果因果关系同时也是从因变量到一个或多个回归变量(Y导致了X)的呢?如果是这样的话,因果关系是向前的也是“向后”的,即存在双向因果关系,如果存在双向因果关系,则OLS回归中同时包含了这两个效应,因此OLS估计量是有偏的、非一致的。,可以推导出:,检验方法:豪斯曼检验检验,豪
3、斯曼检验(Hausman specification test)H0:所有解释变量均为外生变量。H1:至少有一个解释变量为内生变量。quietly reg lw80 s80 expr80 tenure80 iq est store ols quietly ivregress 2sls lw80 expr80 tenure80(s80 iq=med kww mrt age)est store iv hausman iv ols,若 Hausman 检验失效(检验统计量为负值),则使用dmexogxt,否则仍Hausman检验为主。,使用Davidson-MacKinnon检验,xtivreg 后
4、 使用 dmexogxt*Davidson-MacKinnon(1993)检验*H0:OLS 和 xtivreg 都是一致的,即内生性问题对OLS的估计结果影响不大 xtivreg tl size ndts tang(npr=tobin L1.npr),fe dmexogxtDavidson-MacKinnon检验得到F统计量的P值小于0.05,代表有内生性,遗漏变量偏差可采用在多元回归中加入遗漏变量的方法加以解决,但前提是只有当你有遗漏变量数据时上述方法才可行。双向因果关系偏差是指如果有时因果关系是从X到Y又从Y到X时,此时仅用多元回归无法消除这一偏差。同样,变量有测量误差也无法用我们前面学
5、过的方法解决。因此我们就必须寻找一种新的方法。,二、内生性的解决方案,事实上,仅仅为了解决内生性问题,并不需要我们对内生性问题的缘起有很深入的理解。对于应用型的实证研究而言,我们只需要掌握解决内生性问题的具体方案即可。内生性问题的解决方案一共四种,理论上来讲,这四种方案应对内生性问题都很有效。但于我个人而言,我对四种方法的评价是有高低的,由高到低分别介绍如下。,1.自然实验法,所谓自然实验,就是发生了某些外部突发事件,使得研究对象仿佛被随机分成了实验组或控制组。这是我最喜欢的方法,只是自然实验需要寻找一个事件,并且这个事件只影响解释变量而不影响被解释变量。遇着这种事件是一种缘分,还要能识别出来
6、,这对学者的眼光也是一种挑战。有很多文章声称使用了自然实验,但严格来讲,并没有做到对研究对象进行了随机分组。虽然如此,我对此类文章仍然很是喜欢。,自然实验包括的要素有:一个政策措施(treatment),一个观察到的结果(outeome),一个对照组(contorlgoruP)。在评估“政策措施”对“结果”是否发挥作用时,对照组充当一个参照系。而一个“准自然实验”和自然实验的区别在于处理组和对照组的选取是否随机。这里的“结果”是以受政策影响的县和没有受政策影响的县之间在增长速度上的差异来衡量。简单连接改革措施和被直管县绩效的做法并不恰当。这样的做法无法排除其他政策或是整体经济的影响,因而是无法
7、衡量改革真实效果的。,17,2.双重差分法,Difference-in-Difference(DID)一般称为双重差分法,或倍差法。倘若出现了一次外部冲击,这次冲击影响了一部分样本,对另一部分样本则无影响,而我们想看一下这次外部冲击到底有何影响,双重差分法就是用来研究这次冲击的净效应的。其基本思想是,将受冲击的样本视作实验组,再按照一定标准在未受冲击的样本中寻求与实验组匹配的对照组,而后做差,做差剩下来的便是这次冲击的净效应。双重差分法实际上是固定效应的一个变种,差分的过程实际上是排除固定效应的过程。ZERA在计量论文写作和发表的黑客教程有一个非常简明风趣的举例,我转述于此,以飨读者。,19,
8、Difference in difference models,Maybe the most popular identification strategy in applied work todayAttempts to mimic random assignment with treatment and“comparison”sampleApplication of two-way fixed effects model,20,Problem set up,Cross-sectional and time series dataOne group is treated with inter
9、ventionHave pre-post data for group receiving interventionCan examine time-series changes but,unsure how much of the change is due to secular changes,21,Difference in difference models,Basic two-way fixed effects modelCross section and time fixed effectsUse time series of untreated group to establis
10、h what would have occurred in the absence of the interventionKey concept:can control for the fact that the intervention is more likely in some types of states,22,Three different presentations,TabularGraphicalRegression equation,23,Difference in Difference,24,time,Y,t1,t2,Yt1,Yt2,treatment,control,Yc
11、1,Yc2,Treatment effect=(Yt2-Yt1)(Yc2-Yc1),25,Key Assumption,Control group identifies the time path of outcomes that would have happened in the absence of the treatmentIn this example,Y falls by Yc2-Yc1 even without the interventionNote that underlying levels of outcomes are not important(return to t
12、his in the regression equation),26,Basic Econometric Model,Data varies by state(i)time(t)Outcome is YitOnly two periodsIntervention will occur in a group of observations(e.g.states,firms,etc.),27,Three key variablesTit=1 if obs i belongs in the state that will eventually be treatedAit=1 in the perio
13、ds when treatment occursTitAit-interaction term,treatment states after the interventionYit=0+1Tit+2Ait+3TitAit+it,28,Yit=0+1Tit+2Ait+3TitAit+it,29,More general model,Data varies by state(i)time(t)Outcome is YitMany periodsIntervention will occur in a group of states but at a variety of times,30,ui i
14、s a state effectvt is a complete set of year(time)effectsAnalysis of covariance modelYit=0+3 TitAit+ui+t+it,31,Group effects Capture differences across groups that are constant over timeYear effectsCapture differences over time that are common to all groups,32,其中,d 就是双重差分估计量,Y 为研究的结局变量,右侧脚标中 treatme
15、nt 和 control 分布代表干预组和对照组,t0 和 t1 分别代表干预前和干预后。构造了差分估计量之后,就要根据不同的数据类型和不同的结局变量 Y,分别选用相应的参数检验方法来进行建模。,(1)适 用 于 独 立 混 合 横 截 面 数 据,33,独立混合横截面数据是在不同时点从同一个的大总体内部分别进行随机抽样,将所得的数据混合起来的一种数据集。该类数据的特点为每一条数据都是独立的观测值。通过将不同时点的多个观测值结合起来,从而可以加大样本量以获得更精密的估计量和更具功效的检验统计量;也可加入新的变量时间(即干预前后),以便判断干预前后的差别。对于总体一致、范围较大、涉及不同时间点的
16、调查研究,多收集此类数据,34,35,36,(2)适用于综列数据面板数据的 DID 模型,37,面板数据要求在不同时点调查相同的研究对象。它与独立混合横截面数据最大的不同在于,不同时点的观测值并不是独立分布的。这类数据的特点在于:由于研究的个体相同,一些不随时间改变的不可观测的因素(如个人特质等)对不同时点的观测值会产生影响,可以通过控制这些影响从而得到较为真实的结果;,38,39,40,由于一般大规模的人群调查存在较大的变异性问题,仅在模型中纳入虚拟变量“分 组(A)”、“时 间(T)”是远远不够的。为了提高解释系数 R2,需要加入其他可能影响被解释变量的因素,即控制除分组、时间变量以外的其
17、他变量。,ssc install diffhelp diffdiff y,t(treated)p(t)robust如果有控制变量,可以利用cov()添加,41,工具变量(instrumental variable,IV)回归是当回归变量X与误差项u相关时获得总体回归方程未知系数一致估计量的一般方法。我们经常称其为IV估计。其基本思想是:假设方程是:,我们假设ui与Xi相关,则OLS估计量一定是有偏的和非一致的。工具变量估计是利用另一个“工具”变量Z将Xi分离成与ui相关和不相关的两部分。,3.工具变量法,我们的工作就是要寻找相应的工具变量将解释变量分解成内生变量和外生变量,然后利用两阶段最小二
18、乘法(TSLS)进行估计。,工具变量的选取,一个有效的工具变量必须满足称为工具变量相关性和工具变量外生性两个条件:即,(1)工具变量相关性:工具变量与所替代的随机解释变量高度相关;(2)工具变量外生性:工具变量与随机误差项不相关;,一个合适的工具变量应该同时满足两个条件:第一要能很好地解释内生变量,也就是说工具变量和内生变量之间要足够相关;第二,工具变量要来自系统之外,即工具变量具备外生性。如果内生性表现为联立性问题,第二个标准尤其必要。虽然统计证据可以告诉我们工具变量和内生变量是否相关,但是其背后的因果链条和工具变量是否具备外生性的证明一样,必须依赖令人置信的逻辑推导。工具变量的外生性在回归
19、中表现为和方程的残差项正交,即工具变量不会对方程被解释变量产生影响,如果产生影响则只能通过内生变量起作用。,两阶段最小二乘估计量,若工具变量Z满足工具变量相关性和外生性的条件,则可用称为两阶段最小二乘(TSLS)的IV估计量估计系数1。两阶段最小二乘估计量分两阶段计算:第一阶段把X分解成两部分:即与回归误差项相关的一部分以及与误差项无关的一部分。第二阶段是利用与误差项无关的那部分进行估计。,一般IV回归模型,因变量 Yi。外生解释变量 W1i、W2i、Wri。内生解释变量 X1i、X2i、Xki。我们引入工具变量Z1i、Z2i、Zmi。,第一阶段回归:利用OLS建立每个内生变量(X1i、X2i
20、、Xki)关于工具变量(Z1i、Z2i、Zmi)和外生变量(W1i、W2i、Wri)的回归,并得到所有回归结果的拟合值Xi_hat。第二阶段回归:用Xi_hat取代原有的Xi,与原有的外生变量Wi一起进行第二次回归,得到TSLS统计量TSLS。注意:工具变量出现在第一阶段回归,但不出现在第二阶段回归。,引入工具变量的个数,假设我们有n个内生解释变量,引入了m个工具变量,n和m的关系是什么?n=m 恰好识别 nm 不可识别 只有恰好识别和过度识别才能用IV方法估计。,两阶段最小二乘法的stata命令:ivregress 2sls depvar varlist1(varlist2=instlist
21、),r,first其中,“depvar”为被解释变量,varlist1为外生解释变量,varlist2为所有的内生解释变量集合,instlist为工具变量集合。选择项r表示使用异方差稳健的标准误,选择项“first”表示显示第一阶段的回归。,工具变量有效性的检验,工具变量相关性工具变量相关性越强,也就是工具变量能解释越多的X变动,则IV回归中能用的信息就越多,因此利用相关性更强的工具变量得到的估计量也更精确。弱工具变量:如果虽然 但是弱工具变量几乎不能解释X的变动。,弱工具变量检验准则,1.偏R2(Sheas partial R2)含义:在第一阶段回归中,在控制外生变量 影响的前提下,看其它变
22、量对某内生变量的解释力,或者说,在第一阶段回归中,剔除掉外生变量的影响。2.最小特征值统计量F:经验上F应该大于10。Stata 命令:estat firststage,all forcenonrobust,3.Cragg-Donald Wald F 统计量 4.Kleibergen-Paap Wald rk F 统计量”(当假定残差项不满足独立同分布时,就看这个来判断是否弱工具,原假设是弱工具,所以拒绝原假设就可以)F检验临界值表 CHIDIST F(12(自变量数据m),600(自由度df=n(样本数)-m-1))=87.06Stata命令:ivreg2,如果存在弱工具变量该怎么办?,1.
23、如果有很多工具变量,有部分强工具变量和部分弱工具变量,可以舍弃较弱的工具变量而选用相关性较强的工具变量子集。在stata中,可以使用ivreg2命令进行“冗余检验”,以决定选择舍弃哪个工具变量。(直观上,冗余工具变量是那些第一阶段回归中不显著的变量。)2.如果系数是恰好识别的,则你不能略去弱工具变量。在这种情况下,有两个选择:第一个选择是寻找其他较强的工具变量。(难度较大),第二个选择是利用弱工具变量继续进行实证分析,但采用的方法不再是TSLS。而是对弱工具变量不太敏感的有限信息极大似然法(LIML)。在大样本下,LIML 与2SLS是渐近等价的,但在存在弱工具变量的情况下,LIML 的小样本
24、性质可能优于2SLS。LIML 的 Stata 命令为ivregress liml depvar varlist1(varlist2=instlist),工具变量外生性的检验,刚才我们提到:只有恰好识别和过度识别才能用IV方法估计。一个很重要的命题是:只有过度识别情况下才能检验工具变量的外生性,而恰好识别情况下无法检验。,过度识别约束检验,基本思想:假设有一个内生回归变量,两个工具变量且没有包含的外生变量。则你可以计算两个不同的TSLS估计量:其中一个利用第一个工具变量,而另一个利用第二个工具变量。由于抽样变异性,这两个估计量不会相同,但如果两个工具变量都是外生的,则这两个估计量往往比较接近。
25、如果由这两个工具变量得到估计非常不同,则你可以得出其中一个或两个工具变量都有内生性问题的结论。,识别标准:Sargan 统计量:ivregress 2sls过程中,实际的工具变量(组)是x*与z*。Sagan检验即检验这些工具变量是否外生(是否与扰动项相关),原假设是这些变量都与扰动项不相关。利用残差对这些工具变量回归。sargen检验的P值应该越大越好,一般超过0.1既可以说明不能拒绝工具变量有效的零假设,不宜接近于1,一般大于0.4就是危险信号,工具变量过多,导致检验结果不可信。Sargan统计量服从自由度为L-k的卡方分布,查表。在excel中输入CHIDIST(x,iv-v),其中x是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生性 产生 原因 解决方案

链接地址:https://www.31ppt.com/p-5239672.html