经典计量经济学模型(放宽基本假定的问题)ppt课件.ppt
经典计量经济学模型,放宽基本假定的问题,2022/11/18,1,第一节 异方差,一、异方差的概念二、异方差的来源与后果三、异方差性的检验四、异方差的修正五、案例,2022/11/18,2,对于模型,如果出现,即对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则认为出现了异方差性(Heteroskedasticity)。,一、 异方差的概念,2022/11/18,3,一般情况下:,对于模型 Y=X+u,存在,即存在异方差性。,2022/11/18,4,。,同方差性假定:i2 = 常数 f(Xi) 异方差时: i2 = f(Xi),异方差一般可归结为三种类型: (1)单调递增型: i2随X的增大而增大 (2)单调递减型: i2随X的增大而减小 (3)复 杂 型: i2与X的变化呈复杂形式,2022/11/18,5,2022/11/18,6,二、 异方差的来源与后果,例1:截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+iYi:第i个家庭的储蓄额 Xi:第i个家庭的可支配收入,高收入家庭:储蓄的差异较大 低收入家庭:储蓄则更有规律性,差异较小i的方差呈现单调递增型变化,2022/11/18,7,2022/11/18,8,2022/11/18,9,例2,以绝对收入假设为理论假设、以截面数据为样本建立居民消费函数: Ci=0+1Yi+I,将居民按照收入等距离分成n组,取组平均数为样本观测值。 一般情况下,居民收入服从正态分布:中等收入组人数多,两端收入组人数少。而人数多的组平均数的误差小,人数少的组平均数的误差大。 所以样本观测值的观测误差随着解释变量观测值的不同而不同,往往引起异方差性。,2022/11/18,10,例3 以某一行业的企业为样本建立企业生产函数模型 Yi=Ai1 Ki2 Li3ei,被解释变量:产出量Y 解释变量:资本K、劳动L、技术A, 那么:每个企业所处的外部环境对产出量的影响被包含在随机误差项中。 每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。 这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。,2022/11/18,11,异方差的后果,计量经济学模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:,1、参数估计量非有效,OLS估计量仍然具有无偏性,但不具有有效性,因为在有效性证明中利用了 E()=2I,而且,在大样本情况下,尽管参数估计量具有一致性,但仍然不具有渐近有效性。,2022/11/18,12,2022/11/18,13,2、无偏性,这里利用了假设: E(X)=0,3、有效性(最小方差性),2022/11/18,14,其中利用了,和,2、变量的显著性检验失去意义,变量的显著性检验中,构造了t统计量,其他检验也是如此。,2022/11/18,15,3、模型的预测失效,一方面,由于上述后果,使得模型不具有良好的统计性质;,所以,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。,2022/11/18,16,三、异方差检验,检验思路:,由于异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么: 检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。,2022/11/18,17,问题在于用什么来表示随机误差项的方差一般的处理方法是:,首先采用OLS方法估计模型,得到随机误差项的估计值(注意:该估计量是不严格的),于是有:即用残差项的平方代表随机误差项的方差.,几种异方差的检验方法:,1、图示法,(1)用X-Y的散点图进行判断 看是否存在明显的散点扩大、缩小或复杂型趋势(即不在一个固定的带型域中),2022/11/18,19,使用Xe的散点图看是否形成一斜率为零的直线,2022/11/18,20,2、戈德菲尔德-匡特(Goldfeld-Quandt)检验,G-Q检验以F检验为基础,适用于样本容量较大、异方差递增或递减的情况。,G-Q检验的思想: 先将样本一分为二,对子样和子样分别作回归,然后利用两个子样的残差平方和之比构造统计量进行异方差检验。 由于该统计量服从F分布,因此假如存在递增的异方差,则F远大于1;反之就会等于1(同方差)、或小于1(递减方差)。,2022/11/18,21,2022/11/18,22,G-Q检验的步骤:,将n对样本观察值(Xi,Yi)按观察值Xi的大小排队将序列中间的c=n/4个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为(n-c)/2对每个子样分别进行OLS回归,并计算各自的残差平方和,2022/11/18,23,在同方差性假定下,构造如下满足F分布的统计量,给定显著性水平,确定临界值F(v1,v2), 若F F(v1,v2), 则拒绝同方差性假设,表明存在异方差。 当然,还可根据两个残差平方和对应的子样的顺序判断是递增型异方差还是递减异型方差。,2022/11/18,24,3、怀特(White)检验,怀特检验不需要排序,且适合任何形式的异方差 怀特检验的基本思想与步骤(以二元为例):,先对模型作OLS回归,得到残差项,然后做如下辅助回归,可以证明,在同方差假设下:,(*),R2为(*)的可决系数,h为(*)式解释变量的个数,,表示渐近服从某分布。,2022/11/18,25,注意:,辅助回归仍是检验与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。 如果存在异方差性,则表明确与解释变量的某种组合有显著的相关性,这时往往显示出有较高的可决系数以及某一参数的t检验值较大。 当然,在多元回归中,由于辅助回归方程中可能有太多解释变量,从而使自由度减少,有时可去掉交叉项。,2022/11/18,26,四、 异方差的修正,1、 模型检验出存在异方差性,可用加权最小二乘法(Weighted Least Squares, WLS)进行估计。,加权最小二乘法的基本思想: 加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用OLS估计其参数。,在采用OLS方法时: 对较小的残差平方ei2赋予较大的权数, 对较大的残差平方ei2赋予较小的权数。,2022/11/18,27,例如,如果对一多元模型,经检验知:,新模型中,存在,即满足同方差性,可用OLS法估计。,2022/11/18,28,一般情况下:,对于模型 Y=X+u,存在,即存在异方差性。,2022/11/18,29,W是一对称正定矩阵,存在一可逆矩阵D使得 W=DD,用D-1左乘 Y=X+u两边,得到一个新的模型:,该模型具有同方差性。因为,2022/11/18,30,这就是原模型 Y=X+u的加权最小二乘估计量,是无偏、有效的估计量。,这里权矩阵为D-1,它来自于原模型残差项u的方差-协方差矩阵2W 。,2022/11/18,31,如何得到2W ?,从前面的推导过程看,它来自于原模型残差项的方差-协方差矩阵。因此 仍对原模型进行OLS估计,得到随机误差项的近似估计量i,以此构成权矩阵的估计量,即,这时可直接以,作为权矩阵。,2022/11/18,32,注意:,在实际操作中人们通常采用如下的经验方法: 不对原模型进行异方差性检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样本时。 如果确实存在异方差,则被有效地消除了; 如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法,2022/11/18,33,2. 仍采用OLS法估计系数, 但采用OLS估计量标准误差的异方差性一致估计值代替其OLS估计值 怀特(H. White)提出的产生OLS估计量的异方差性一致标准误差的方法,为解决异方差性问题提供了另一种途径。 怀特的贡献是解决了异方差性造成系数的置信区间和假设检验结果不可信赖的问题,该后果是由于方差的OLS估计量不再是无偏估计量而造成的。,.,White得出在存在未知形式的异方差时,对系数协方差进行正确估计的异方差一致协方差估计量。White 协方差矩阵公式为:其中N是观测值数,k是回归变量数,i 是最小二乘残差。 EViews在标准OLS公式中提供White协方差估计选项。打开方程对话框,说明方程,然后按Options钮。接着,单击异方差一致协方差(Heteroskedasticity Consistent Covariance),选择White 钮,接受选项估计方程。,.,前面描述的White协方差矩阵假设被估计方程的残差是序列不相关的。Newey和West (1987) 提出了一个更一般的估计量,在有未知形式的异方差和自相关存在时仍保持一致。Newey-West估计量为:其中,这类估计量的性质不是“最好”,但它们对于某些假设条件(在这里是同方差性)的违背不敏感,这类的估计量称为稳健估计量(robust estimators)。 与我们前面介绍的FGLS法相比,本段介绍的解决异方差性的方法的优越之处在于,不需要知道异方差性的具体形式。因此,在异方差性的基本结构未知的情况下,建议仍采用OLS法估计系数,而采用其方差的稳健估计量,如怀特的异方差性一致估计量。,五、 案例分析,例.某地个人储蓄Y,个人可支配收入X。 根据经济理论建立计量经济模型,2022/11/18,38,2022/11/18,39,图形检验,2022/11/18,40,2022/11/18,41,进一步的统计检验,(1)G-Q检验,将原始数据按排成升序,去掉中间的9个数据,得两个容量为11的子样本。 对两个子样本分别作OLS回归,求各自的残差平方和RSS1和RSS2:,子样本1:,子样本2:,Y = 0.08825777732*X- 744.6350676e2=150867.9,Y = 0.05302080804*X + 412.9793256e2=958109.4,2022/11/18,42,计算F统计量: F= RSS2/RSS1=958109.4/150867.9=6.35,查表 给定=5%,查得临界值 F0.05(9,9)=3.18判断 F F0.05(9,9) 否定两组子样方差相同的假设,从而该总体随机项存在递增异方差性。,2022/11/18,43,(2)怀特检验,2022/11/18,44,2022/11/18,45,应用加权最小二乘法,在本例中,使用w=1/x 或 w=1/e为权。为什么?,2022/11/18,46,2022/11/18,47,怀特的异方差性一致估计量,第二节 自相关,Serial Correlation,一、自相关概念 二、自相关的后果三、自相关的检验四、具有自相关模型的估计五、案例,.,一、 非自相关假定,如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了序列相关性。,对于模型 Yi=0+1X1i+2X2i+kXki+ui i=1,2, ,n,随机项互不相关的基本假设表现为 Cov(ui , uj)=0 ij, i,j=1,2, ,n,或,称为一阶列相关,或自相关(autocorrelation),其中:被称为自协方差系数(coefficient of autocovariance)或一阶自相关系数(first-order coefficient of autocorrelation) i是满足以下标准的OLS假定的随机干扰项:,如果仅存在 E(ui ui+1)0 i=1,2, ,n,自相关往往可写成如下形式: ui=ui-1+i -11,由于序列相关性经常出现在以时间序列为样本的模型中,因此,本节将用下标t代表i。,二、自相关的来源与后果,大多数经济时间数据都有一个明显的特点:惯性,表现在时间序列不同时间的前后关联上。,由于消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关 )。,例如,绝对收入假设下居民总消费函数模型: Ct=0+1Yt+ut t=1,2,n,1、经济变量固有的惯性,2、模型设定的偏误,所谓模型设定偏误(Specification error)是指所设定的模型“不正确”。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。,例如,本来应该估计的模型为 Yt=0+1X1t+ 2X2t + 3X3t + ut,但在模型设定中做了下述回归: Yt=0+1X1t+ 1X2t + vt,因此, vt=3X3t + ut,如果X3确实影响Y,则出现序列相关。,但建模时设立了如下模型: Yt= 0+1Xt+vt 因此,由于vt= 2Xt2+ut, ,包含了产出的平方对随机项的系统性影响,随机项也呈现序列相关性。,又如:如果真实的边际成本回归模型应为: Yt= 0+1Xt+2Xt2+ut其中:Y=边际成本,X=产出,,3、数据的“编造”,例如:季度数据来自月度数据的简单平均,这种平均的计算减弱了每月数据的波动性,从而使随机干扰项出现序列相关。 还有就是两个时间点之间的“内插”技术往往导致随机项的序列相关性。,在实际经济问题中,有些数据是通过已知数据生成的。 因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。,计量经济学模型一旦出现序列相关性,如果仍采用OLS法估计模型参数,会产生下列不良后果:,2、自相关的后果,1、参数估计量非有效,因为,在有效性证明中利用了 E()=2I 即同方差性和互相独立性条件。 而且,在大样本情况下,参数估计量虽然具有一致性,但仍然不具有渐近有效性。,2、变量的显著性检验失去意义,在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。,其他检验也是如此。,3、模型的预测失效,区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低。 所以,当模型出现序列相关性时,它的预测功能失效。,三、 自相关检验,然后,通过分析这些“近似估计量”之间的相关性,以判断随机误差项是否具有序列相关性。,自相关检验方法有多种,但基本思路相同:,基本思路:,.,首先采用OLS方法估计模型,得到随机误差项的估计值(注意:该估计量是不严格的),于是有:,1、图示法,2、杜宾-瓦森(Durbin-Watson)检验法,D-W检验是杜宾(J.Durbin)和瓦森(G.S. Watson)提出的一种检验序列自相关的方法,该方法的假定条件是:,(1)解释变量X非随机;(2)随机误差项ui为一阶自回归形式: ui=ui-1+i(3)回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式: Yi=0+1X1i+kXki+Yi-1+ui(4)回归含有截距项,该统计量的分布与出现在给定样本中的X值有复杂的关系,因此其精确的分布很难得到。 但是,他们成功地导出了临界值的下限dL和上限dU ,且这些上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。,杜宾和瓦森针对原假设:H0: =0, 即不存在一阶自回归,构如下造统计量:,D.W. 统计量:,D.W检验步骤:,(1)计算DW值(2)给定,由n和k的大小查DW分布表,得临界值dL和dU(3)比较、判断,若 0D.W.dL 存在正自相关 dLD.W.dU 不能确定 dU D.W.4dU 无自相关 4dU D.W.4 dL 不能确定 4dL D.W.4 存在负自相关,0 dL dU 2 4-dU 4-dL,正相关,不能确定,无自相关,不能确定,负相关,当D.W.值在2左右时,模型不存在一阶自相关。,证明: 展开D.W.统计量:,(*),如果存在完全一阶正相关,即=1,则 D.W. 0 完全一阶负相关,即= -1, 则 D.W. 4 完全不相关, 即=0,则 D.W.2,这里,,为一阶自回归模型 ui=ui-1+i 的参数估计。,3、拉格朗日乘数(Lagrange multiplier)检验,拉格朗日乘数检验克服了DW检验的缺陷,适合于高阶序列相关以及模型中存在滞后被解释变量的情形。 它是由布劳殊(Breusch)与戈弗雷(Godfrey)提出的,也被称为GB检验。,对于模型,如果怀疑随机扰动项存在p阶序列相关:,GB检验可用来检验如下受约束回归方程,约束条件为: H0: 1=2=p =0,约束条件H0为真时,大样本下,其中,n为样本容量,R2为如下辅助回归的可决系数:,给定,查临界值2(p),与LM值比较,做出判断,实际检验中,可从1阶、2阶、逐次向更高阶检验。,如果模型被检验证明存在序列相关性,则需要发展新的方法估计模型。,最常用的方法是广义最小二乘法(GLS: Generalized least squares)和广义差分法(Generalized Difference)。,四、自相关的补救,1、广义最小二乘法,对于模型 Y=XB+U如果存在序列相关(也存在异方差),即:E(U)=0,:,用 左乘公式两边,得到,、,具有随机扰动项相互独立和同方差性,因为:,可以采取普通最小二乘法估计,参数估计了量为即可求得原模型的广义最小二乘估计量,是无偏的,有效的 。,2.一阶差分法,一阶差分法是将原模型变换为,如果模型存在完全一阶正相关,即其中 不存在序列相关则差分方程模型满足最小二乘法的基本假设,、,实际的计量经济学问题中,完全一阶自相关的情况并不多,但还是经常直接使用差分方程,因为即使对非完全一阶自相关的情况,只要存在一定程度的一阶自相关,差分模型就可以有效的加以克服。,3、广义差分法,广义差分法是将原模型变换为满足OLS法的差分模型,再进行OLS估计。,如果原模型,存在,可以将原模型变换为:,该模型为广义差分模型,不存在序列相关问题。可进行OLS估计。,注意:,广义差分法就是上述广义最小二乘法,但是却损失了部分样本观测值。 如:一阶序列相关的情况下,广义差分是估计,这相当于,去掉第一行后左乘原模型Y=X+ 。即运用了GLS法,但第一次观测值被排除了。,六、随机误差项相关系数的估计,应用广义最小二乘法或广义差分法,必须已知随机误差项的相关系数1, 2, , L 。 实际上,人们并不知道它们的具体数值,所以必须首先对它们进行估计。 常用的估计方法有:,科克伦-奥科特(Cochrane-Orcutt)迭代法。 杜宾(durbin)两步法,1.用DW统计量的值计算,由DW的证明,有:利用残差求出DW检验值,然后利用上式计算自相关系数的估计值,2.科克伦-奥科特迭代法。,以一元线性模型为例: 首先,采用OLS法估计原模型 Yi=0+1Xi+ui得到的u的“近似估计值”,并以之作为观测值使用OLS法估计下式,求出ui新的“近拟估计值”, 并以之作为样本观测值,再次估计,类似地,可进行第三次、第四次迭代。,关于迭代的次数,可根据具体的问题来定。 一般是事先给出一个精度,当相邻两次1,2, ,L的估计值之差小于这一精度时,迭代终止。 实践中,有时只要迭代两次,就可得到较满意的结果。两次迭代过程也被称为科克伦-奥科特两步法。,3.杜宾(durbin)两步法,该方法仍是先估计1,2,l,再对差分模型进行估计,第一步,变换差分模型为下列形式,进行OLS估计,得各Yj(j=i-1, i-2, ,i-l)前的系数1,2, , l的估计值,应用软件中的广义差分法,在Eview/TSP软件包下,广义差分采用了科克伦-奥科特(Cochrane-Orcutt)迭代法估计。 在解释变量中引入AR(1)、AR(2)、,即可得到参数和1、2、的估计值。 其中AR(m)表示随机误差项的m阶自回归。在估计过程中自动完成了1、2、的迭代。,如果能够找到一种方法,求得或各序列相关系数j的估计量,使得GLS能够实现,则称为可行的广义最小二乘法(FGLS, Feasible Generalized Least Squares)。FGLS估计量,也称为可行的广义最小二乘估计量(feasible general least squares estimators)可行的广义最小二乘估计量不再是无偏的,但却是一致的,而且在科克伦-奥科特迭代法下,估计量也具有渐近有效性。前面提出的方法,就是FGLS,注意:,案例:人均消费与人均可支配收入,.,第三节 多重共线性,Multi-Collinearity,一、多重共线性的概念二、多重共线性的来源与后果三、多重共线性的检验四、克服多重共线性的方法五、案例,内 容,一、 多重共线性的概念,对于模型 Yi=0+1X1i+2X2i+kXki+ui i=1,2,n其基本假设之一是解释变量是互相独立的。,如果某两个或多个解释变量之间出现了相关性,则称为多重共线性(Multicollinearity)。,如果存在 c1X1i+c2X2i+ckXki=0 i=1,2,n 其中: ci不全为0,则称为解释变量间存在完全共线性(perfect multicollinearity)。,如果存在 c1X1i+c2X2i+ckXki+vi=0 i=1,2,n 其中ci不全为0,vi为随机误差项,则称为 近似共线性(approximate multicollinearity)或交互相关(intercorrelated)。,在矩阵表示的线性回归模型 Y=X+U中,完全共线性指:秩(X)k+1,即,中,至少有一列向量可由其他列向量(不包括第一列)线性表出。,如:X2= X1,则X2对Y的作用可由X1代替。,注意: 完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。,实际经济问题中的多重共线性,一般地,产生多重共线性的主要原因有以下三个方面: (1)经济变量相关的共同趋势 时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。 横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。,(2)滞后变量的引入,在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。 例如,消费=f(当期收入, 前期收入) 显然,两期收入间有较强的线性相关性。,(3)样本资料的限制,由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。 一般经验: 时间序列数据样本:简单线性模型,往往存在多重共线性。 截面数据样本:问题不那么严重,但多重共线性仍然是存在的。,二、 多重共线性的后果,1、完全共线性下参数估计量不存在,如果存在完全共线性,则(XX)-1不存在,无法得到参数的估计量。,的OLS估计量为:,2022/11/18,119,2022/11/18,119,2、近似共线性下OLS估计量非有效,近似共线性下,可以得到OLS参数估计量, 但参数估计量方差的表达式为,由于|XX|0,引起(XX) -1主对角线元素较大,使参数估计值的方差增大,OLS参数估计量非有效。,仍以二元线性模型 y=1x1+2x2+u为例:,恰为X1与X2的线性相关系数的平方r2,由于 r2 1,故 1/(1- r2 )1,多重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子(Variance Inflation Factor, VIF),当完全不共线时, r2 =0,当近似共线时, 0 r2 1,当完全共线时, r2=1,,3、参数估计量经济含义不合理,如果模型中两个解释变量具有线性相关性,例如 X2= X1 , 这时,X1和X2前的参数1、2并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。 1、2已经失去了应有的经济含义,于是经常表现出似乎反常的现象:例如1本来应该是正的,结果恰是负的。,4、变量的显著性检验失去意义,存在多重共线性时,参数估计值的方差与标准差变大,容易使通过样本计算的t值小于临界值, 误导作出参数为0的推断,可能将重要的解释变量排除在模型之外,5、模型的预测功能失效,变大的方差容易使区间预测的“区间”变大,使预测失去意义。,注意:,除非是完全共线性,多重共线性并不意味着任何基本假设的违背; 因此,即使出现较高程度的多重共线性,OLS估计量仍具有线性性等良好的统计性质。 问题在于,即使OLS法仍是最好的估计方法,它却不是“完美的”,尤其是在统计推断上无法给出真正有用的信息。,多重共线性检验的任务是: (1)检验多重共线性是否存在; (2)估计多重共线性的范围,即判断哪些变量之间存在共线性。,多重共线性表现为解释变量之间具有相关关系,所以用于多重共线性的检验方法主要是统计方法:如判定系数检验法、逐步回归检验法等。,三、多重共线性的检验,1、检验多重共线性是否存在,(1)对两个解释变量的模型,采用简单相关系数法 求出X1与X2的简单相关系数r,若|r|接近1,则说明两变量存在较强的多重共线性。,(2)对多个解释变量的模型,采用综合统计检验法,若 在OLS法下:R2与F值较大,但t检验值较小,说明各解释变量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨,故t检验不显著。,2、判明存在多重共线性的范围,如果存在多重共线性,需进一步确定究竟由哪些变量引起。 (1) 判定系数检验法 使模型中每一个解释变量分别以其余解释变量为解释变量进行回归,并计算相应的拟合优度。 如果某一种回归 Xji=1X1i+2X2i+LXLi的判定系数较大,说明Xj与其他X间存在共线性。,具体可进一步对上述回归方程作F检验:,式中:Rj2为第j个解释变量对其他解释变量的回归方程的决定系数, 若存在较强的共线性,则Rj2较大且接近于1,这时(1- Rj2 )较小,从而Fj的值较大。 因此,给定显著性水平,计算F值,并与相应的临界值比较,来判定是否存在相关性。,构造如下F统计量,在模型中排除某一个解释变量Xj,估计模型; 如果拟合优度与包含Xj时十分接近,则说明Xj与其它解释变量之间存在共线性。,另一等价的检验是:,(2)逐步回归法,以Y为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。 根据拟合优度的变化决定新引入的变量是否独立。 如果拟合优度变化显著,则说明新引入的变量是一个独立解释变量; 如果拟合优度变化很不显著,则说明新引入的变量与其它变量之间存在共线性关系。,找出引起多重共线性的解释变量,将它排除出去。 以逐步回归法得到最广泛的应用。 注意: 这时,剩余解释变量参数的经济含义和数值都发生了变化。,如果模型被检验证明存在多重共线性,则需要发展新的方法估计模型,最常用的方法有三类。,四、 克服多重共线性的方法,1、第一类方法:排除引起共线性的变量,2、第二类方法:变换模型的形式,例如:取对数、差分等 时间序列数据、线性模型:将原模型变换为差分模型: Yi=1 X1i+2 X2i+k Xki+ i可以有效地消除原模型中的多重共线性。,一般讲,增量之间的线性关系远比总量之间的线性关系弱得多。,案例 :服装消费,Y :服装消费量X1:可支配收入X2:流动资产X3:服装价格指数X4:一般商品价格指数,例题:服装消费,估计结果,.,.,.,第四节 随机解释变量问题,一、随机解释变量问题二、实际经济问题中的随机解释变量问题 三、随机解释变量的后果四、工具变量法五、案例,基本假设:解释变量X1,X2,Xk是确定性变量。 如果存在一个或多个随机变量作为解释变量,则称原模型出现随机解释变量问题。 假设X2为随机解释变量。对于随机解释变量问题,分三种不同情况:,一、随机解释变量问题,对于模型,1. 随机解释变量与随机误差项独立(Independence),2. 随机解释变量与随机误差项同期无关(contemporaneously uncorrelated),但异期相关。,3. 随机解释变量与随机误差项同期相关(contemporaneously correlated)。,二、实际经济问题中的随机解释变量问题,在实际经济问题中,经济变量往往都具有随机性。 但是在单方程计量经济学模型中,凡是外生变量都被认为是确定性的。 于是随机解释变量问题主要表现于:用滞后被解释变量作为模型的解释变量的情况。,例如:,(1)耐用品存量调整模型: 耐用品的存量Qt由前一个时期的存量Qt-1和当期收入It共同决定: Qt=0+1It+2Qt-1+ut t=1,T,这是一个滞后被解释变量作为解释变量的模型。 但是,如果模型不存在随机误差项的序列相关性,那么随机解释变量Qt-1只与ut-1相关,与ut不相关,属于上述的第2种情况。,(2)合理预期的消费函数模型,合理预期理论认为消费Ct是由对收入的预期Yte所决定的:,预期收入Yte与实际收入Y间存如下关系的假设,容易推出,Ct-1是一随机解释变量,且与 (t-t-1)高度相关(Why?)。属于上述第3种情况。,计量经济学模型一旦出现随机解释变量,且与随机扰动项相关的话,如果仍采用OLS法估计模型参数,不同性质的随机解释变量会产生不同的后果。 下面以一元线性回归模型为例进行说明,三、随机解释变量的后果,随机解释变量与随机误差项相关图,(a)正相关,(b)负相关,拟合的样本回归线可能低估截距项,而高估斜率项。,拟合的样本回归线高估截距项,而低估斜率项。,对一元线性回归模型:,OLS估计量为,1、如果X与相互独立,得到的参数估计量仍然是无偏、一致估计量。,已经得到证明,随机解释变量X与随机项的关系不同,参数OLS估计量的统计性质也会不同。,2、如果X与同期不相关,异期相关,得到的参数估计量有偏、但却是一致的。,kt的分母中包含不同期的X;由异期相关性知:kt与t相关,因此,,但是,3、如果X与同期相关,得到的参数估计量有偏、且非一致。,注意: 如果模型中带有滞后被解释变量作为解释变量,则当该滞后被解释变量与随机误差项同期相关时,OLS估计量是有偏的、且是非一致的。 即使同期无关,其OLS估计量也是有偏的,因为此时肯定出现异期相关。,2的证明中已得到,模型中出现随机解释变量且与随机误差项相关时,OLS估计量是有偏的。 如果随机解释变量与随机误差项异期相关,则可以通过增大样本容量的办法来得到一致的估计量; 但如果是同期相关,即使增大样本容量也无济于事。这时,最常用的估计方法是工具变量法(Instrument variables)。,四、工具变量法,1、工具变量的选取,工具变量:在模型估计过程中被作为工具使用,以替代模型中与随机误差项相关的随机解释变量。 选择为工具变量的变量必须满足以下条件:,(1)与所替代的随机解释变量高度相关; (2)与随机误差项不相关; (3)与模型中其它解释变量不相关,以避免出现多重共线性。,工具变量法的应用,移项、加和。 两边取期望,如果选择Z为X的工具变量,那么在上述估计过程可改为:,这种求模型参数估计量的方法称为工具变量法(instrumental variable method),相应的估计量称为工具变量法估计量(instrumental variable (IV) estimator)。,对于矩阵形式: Y=X+ ,采用工具变量法(假设X2与随机项相关,用工具变量Z替代)得到的正规方程组为:,参数估计量为:,其中,称为工具变量矩阵,3、工具变量法估计量是一致估计量,一元回归中,工具变量法估计量为,如果工具变量Z选取恰当,即有,两边取概率极限得:,因此:,1、在小样本下,工具变量法估计量仍是有偏的。,注意:,2、工具变量并没有替代模型中的解释变量,只是在估计过程中作为“工具”被使用。,上述工具变量法估计过程可等价地分解成下面的两步OLS回归: 第一步,用OLS法进行X关于工具变量Z的回归:,容易验证仍有:,因此,工具变量法仍是Y对X的回归,而不是对Z的回归。,3、如果模型中有两个以上的随机解释变量与随机误差项相关,就必须找到两个以上的工具变量。但是,一旦工具变量选定,它们在估计过程被使用的次序不影响估计结果(Why?)。,4、OLS可以看作工具变量法的一种特殊情况。,5、如果1个随机解释变量可以找到多个互相独立的工具变量,人们希望充分利用这些工具变量的信息,就形成了广义矩方法(Generalized Method of Moments, GMM)。 在GMM中,矩条件大于待估参数的数量,于是如何求解成为它的核心问题。 工具变量法是GMM的一个特例。,6、要找到与随机扰动项不相关而又与随机解释变量相关的工具变量并不是一件很容易的事 可以用Xt-1作为原解释变量Xt的工具变量。,五、案例消费函数,例 居民消费函数的估计中,采用OLS估计了下面的模型:,由于:居民消费支出(C1),国内生产总值(Y)与随机扰动项(u)相互影响,因此, 容易判断Y与u同期相关(往往是正相关),OLS估计量有偏并且是非一致的(低估截距项而高估计斜率项 )。 资本形成K可能与Y高度相关,而与u不相关。,2022/11/18,165,.,加入工具变量的估计。,2022/11/18,168,GMM是近20年计量经济学理论方法发展的重要方向之一。IV是GMM的一个特例。,如果1个随机解释变量可以找到多个互相独立的工具变量,人们希望充分利用这些工具变量的信息,就形成了广义矩方法(GMM)。在GMM中,矩条件大于待估参数的数量,于是如何求解成为它的核心问题。,