存在测量误差的回归估计-王璐璐.ppt
Company Logo,不完备数据的回归估计 存在测量误差的回归估计,主讲人:王璐璐,不完备数据的回归估计,在样本数据有某些不完备情况下的回归估计问题:存在测量误差的回归估计分组数据的回归估计缺失数据的回归估计,存在测量误差的回归估计,模型及基本假定工具变量估计方程误差模型组平均法变量误差模型 加权回归总结,模型及基本假定,经典正态线性回归的测量误差问题回归方程:基本假设:(1)(2)(3)对于任何非随机的解释变量来说 是个不为零的有限数,模型及基本假定,现在假设观测值x和y含有测量误差(用 代替,且测量误差被假定是随机的而且具有特定的概率)假设测量误差具有下列行为特性:(1)(2),模型及基本假定,(3)以上三式可以表明:测量误差是相互独立的,是独立于回归方程的扰动的,并且对于非随机的x,是独立于x和y的真值的。,模型及基本假定,从数据 和 估计回归方程的系数在上面的回归模型中,相关变量和解释变量是可观测的,解释变量 是同期与扰动 相关的,即:,Company Logo,模型及基本假定,意味着 的最小二乘估计式不是一致的,同理 的最小二乘估计式也如此。,(1)式称为变量误差和方程误差模型,工具变量估计,由于当x,y存在测量误差时,回归方程的系数的最小二乘估计式不是一致的。在此情况下我们得到一致估计量的方法:工具变量工具变量的含义 工具变量是在模型估计过程中被作为工具使用,以替代与随机干扰项相关的随机解释变量。,工具变量估计,工具变量的选取被选择作为工具变量必须满足以下条件:1、与所替代的随机解释变量高度相关;2、与随机干扰项不相关;3,与模型中其他解释变量不相关,避免出现多重共线性。工具变量的应用 工具变量法是克服解释变量与随机干扰项相关影响的一种参数估计方法。,工具变量估计,以一元回归模型为例说明如下:,用OLS估计模型,相当于用 去乘模型两边、对i求和、再略去 项后得到正规方程:,解得:,工具变量估计,由于,意味着大样本下:,表明大样本下:,成立,即OLS估计量具有一致性。,然而,如果 与 相关,即使在大样本下,也不存在,则,在大样本下也不成立,OLS估计量不具有一致性。,工具变量估计,这种求模型参数估计量的方法称为工具变量法,相应的估计量称为工具变量法估计量。,如果按照工具变量的选择条件选择z作为x的工具变量,那么在上述过程中不用x而用z乘以模型的两边,并对i求和。利用工具变量与随机干扰项不相关的性质,在大样本下可以略去 与,得到如下的正规方程组:,工具变量估计,工具变量法估计量是有偏估计量 用工具变量法所求的参数估计量 与总体参数真值 之间的关系,因为z和x都是随机变量,所以在一般情况下 故,上式说明工具变量法估计量一般不具有无偏性。,工具变量估计,工具变量法估计量是一致估计量,一元回归中,工具变量法估计量为:,两边取概率极限得:,工具变量估计,因此,这说明工具变量法估计量具一致性。,如果工具变量Z选取恰当,即有,工具变量估计,工具变量的渐近方差可由下列公式导出:由于 是未知的,所以必须进行估计。的一致估计式由下式给出:,工具变量估计,这样我们就可得到 的渐近方差估计虽然它们是渐近方差,但是作为近似,已被用于有限样本中。当“真”解释变量 是随机且独立于 时,以上那些估计式都是可以用的。,工具变量估计,注意:(1)工具变量并没有替代模型中的解释变量,只是在估计过程中作为“工具”被使用。上述工具变量法估计过程可等价地分解成下面的两步OLS回归:第一步,用OLS法进行X关于工具变量Z的回归:,因此,工具变量法仍是Y对X的回归,而不是对Z的回归。,工具变量估计,(2)如果一个随机解释变量可以找到多个相互独立的工具变量,人们希望充分利用这些工具变量的信息,这就形成了广义矩方法(GMM)。在GMM中,如何求解成为它的核心问题。GMM是近20年计量经济学理论方法发展的重要方向之一。工具变量法是GMM的一个特例。OLS法也可看成是工具变量法的特例。(3)考虑到随机解释变量与随机干扰项相关的主要来源是由于同期测量误差引起的,就可以用滞后一期的随机解释变量作为原解释变量的工具变量,即用Xt-1作为原解释变量Xt的工具变量。,方程误差模型,方程(1)称为“变量误差和方程误差模型”,若考虑其测量误差仅仅发生于相关变量y上,即对所有的i,由于 和 被假设是正态的和独立的,则我们有,方程(2)即称为“方程误差模型”。,方程(2)形式上等于经典正态线性回归方程,回归系数的最小二乘估计式具有符合要求的性质。,方程误差模型,注意,(1)、的方差不仅反映了解释变量的系统影响外,还影响到相关变量。通常,这个方差不能为观测者所改变。另一方面,通过改进测量方法可以使得测量误差的方差减小,进而 的方差也减小。(2)、由于对经济变量测量方法的不断改进,的方差减小,从而 的方差也减小。,方程误差模型,方程误差模型还有另一种模式,相对应的考虑解释变量x具有测量误差,而相关变量y无测量误差,即对所有i,。于是,此时回归方程变为 其中这里 与 是同时期相关的。事实上,所以(3)式中的 和 的最小二乘估计式不是一致的,应用前面的工具变量法可以得到一致的估计式。,组平均法,组平均法要求根据 的大小来排列观测值的数据,使得,然后将这些数对划分为容量大约相等的3个组。回归系数的组平均估计式为,组平均法,注意到组平均法可以看成工具变量法的特殊情况,如果3个组具有相等的容量,并取工具变量与利用工具变量法进行回归估计比较,两种方法估计的关系式是近似的。,变量误差模型,这一模型假设相关变量与解释变量之间的关系式确定的,而我们对x和y的测量是不精确的,即模型本身应假设为对任何i,。于是x和y的关系应为:其中 可以是随机的或非随机的。,如果 是随机的,假定它独立于。由于我们的观测值不是 和,而是 所以必须做代换,由于 和 明显相关,所以 和 的估计式不一致。还需要工具变量法得到一致估计量。,加权回归,加权回归:如果可以作出关于误差方差比率的先验假设,即使得测量x和测量y的误差方差存在一个比例关系,而采用的方法。令,例如要求测量x和测量y的误差方差相同,即使得。对于给定的 建立 一致估计式,通常称它们为”加权回归估计式”。,加权回归,因为 的最小二乘估计式为而且 所以可以把 写成 的概率极限是由(4)式可以看出,不一致的原因是由于分母中存在 这一项所致。,加权回归,这就暗示我们 的一致估计式应该是其中 是 的一致估计式。这样,问题就可以简化为寻找用 表示 的一致估计式。再将这个估计式带入(5)式中,我们就可以求解出,从而得到了 的一致估计式。如果 是已知的,我们就有 按照上述思路可以求解 的一致估计式.(书p207),加权回归,注:的值根据下式所确定 其中 即根据所拟合回归直线的离差平方和来确定的。相应的一致估计式是可以证明 代表各自参数的极大似然估计,因而它们是渐近有效的。,Company Logo,加权回归,若假设解释变量x的测量是没有误差的,最小二乘估计是基于使观测到的y与回归直线的离差平方和极小这一思想上的,这个程序称为“y方向上的极小”。此时,将其代入(6)式中得到。另一个极端,若假设测量y时没有误差,则成为“x方向上的极小”也就是极小化了观测点与回归直线的水平距离的平方和。此时,得到,加权回归,说明 的大小是怎样决定着极小化方向的,当 位于0到 之间时,它充当了一个置换x与y之间的极小化方向的“权重”因素。,注:以上的模型建立在变量误差模型的基础上,存在测量误差的回归估计,总结:(1)测量误差可能存在于大多数经济中,处理不仅有随机扰动,同时还有误差的估计问题。(2)一般只关注“方程误差模型”而忽略测量误差,并不是认为观测数据是完美的,而只是认为与变量关系中的随机扰动相比,测量误差是次要的。,Company Logo,谢谢,!,存在测量误差的回归估计,