《《受约束回归问题》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《受约束回归问题》PPT课件.ppt(79页珍藏版)》请在三一办公上搜索。
1、第三章 受约束回归问题,一、模型参数的线性约束 二、对回归模型增加或减少解释变量 三、参数的稳定性检验 四、非线性约束,受约束回归,在建立回归模型时,有时根据经济理论需要对模型中的参数施加一定的约束条件。例如:需求函数的0阶齐次性条件:当所有商品和消费者货币支出总额按同一比例变动时,需求量保持不变。生产函数的1阶齐次性条件:+=1模型施加约束条件后进行回归,称为受约束回归(restricted regression);未加任何约束的回归称为无约束回归(unrestricted regression)。,一、模型参数的线性约束,多元回归模型:,施加约束:,得:,或:,(1),(2),如果对(2)
2、式回归得出:,则由约束条件可得:,然而,对所研究的具体问题能否施加约束?需进一步进行相应的检验。常用的检验有:F检验、x2检验与t检验。,F检验,在同一样本下,记无约束样本回归模型为:,受约束样本回归模型为:,于是:,受约束样本回归模型的残差平方和:RSSR,于是,ee为无约束样本回归模型的残差平方和:RSSU,(3),受约束与无约束模型都有相同的总离差平方和TSS(因为受约束与无约束模型都有相同的被解释变量和样本),这意味着,通常情况下,对模型施加约束条件会降低模型的解释能力。(模型的拟合优度=回归平方和/总平方和)但是,如果约束条件为真,则受约束回归模型与无约束回归模型具有相同或者近似的解
3、释能力,RSSR 与 RSSU的差异变小。,由(3)式 RSSR RSSU从而 ESSR ESSU(ESS为回归平方和),可用二者的差:RSSR-RSSU的大小来检验约束的真实性,根据数理统计学的知识:,其中kU为无约束模型解释变量个数,kR为受约束模型解释变量个数,于是:,结论,如果约束条件无效,RSSR 与 RSSU的差异较大,计算的F值也较大。于是,可用计算的F统计量的值与所给定的显著性水平下的临界值作比较,对约束条件的真实性进行检验。注意,kU-kR恰为参数关系约束条件的个数。,模型参数约束回归案例,例3.1 建立中国城镇居民食品消费需求函数模型。,根据需求理论,城镇居民对食品的消费需
4、求函数大致为:,Q:城镇居民的食品支出总额,X:城镇居民的消费支出总额,P1:食品价格指数,P0:居民消费价格指数。,(4),零阶齐次性,当所有商品和消费者货币支出总额按同一比例变动时,需求量保持不变。,(5),为了进行比较,将同时估计(4)式与(5)式。,根据恩格尔定律,居民对食品的消费支出与居民的总支出间呈幂函数的变化关系:,首先,确定具体的函数形式,对上式进行对数变换,得到:,(6),考虑到零阶齐次性时,(7)式相当于是对(6)式施加如下约束而得:,因此,对(7)式进行回归,就意味着原需求函数满足零阶齐次性条件。,(7),X:人均消费X1:人均食品消费GP:居民消费价格指数FP:居民食品
5、消费价格指数XC:人均消费(90年价)Q:人均食品消费(90年价)P0:居民消费价格缩减指数(1990=100)P1:居民食品消费价格缩减指数(1990=100,中国城镇居民人均食品消费,特征:消费行为在19811995 年间表现出较强的一致性;1995年之后呈现出另外一种变动特征。因此:我们只建立19811994年中国城镇居民对食品的消费需求模型。,各变量的弹性之和,比较接近于零,但不为零。,建立19811994年中国城镇居民对食品的消费需求模型:,(9.03)(25.35)(-2.28)(-7.34),按零阶齐次性表达式回归:,(75.86)(52.66)(-3.62),与,接近。,意味着
6、:所建立的食品需求函数满足零阶齐次性特征。,为了比较,改写该式为:,零阶齐次性检验,例1.1 中国城镇居民对食品的人均消费需求实例中,对零阶齐次性检验:,无约束回归:RSSU=0.00324,kU=3 受约束回归:RSSR=0.00332,KR=2 样本容量n=14,约束条件个数 kU-kR=3-2=1,取=5%,查得临界值F0.05(1,10)=4.96结论:不能拒绝中国城镇居民对食品的人均消费需求函数具有零阶齐次特性这一假设。,说明:这里的F检验适合所有关于参数线性约束的检验,例1.2 生产函数的一阶齐次性检验,生产函数的数学形式为,在最初提出的C-D生产函数中,假定参数满足+=1,也就是
7、假定研究对象满足规模报酬不变条件。,Q 为产出,K 为资本投入,L 为劳动力投入。很容易推出参数,分别是资本和劳动的产出弹性。那么由产出弹性的经济意义,应该有,即当资本与劳动的数量同时增长倍时,产出量也增长 倍。1937年,提出了C-D生产函数的改进型,即取消了+=1 的假定,允许要素的产出弹性之和大于1或小于1。,例1.2 Cobb-Douglas生产函数估计形式如下:,利用美国主要金属工业企业的数据(27个企业的数据),C-D生产函数估计结果如下(Eviews输出结果):,从结果看LogL和logK的系数和小于1,但为确定这种差异是统计显著的,常进行有约束的Wald系数检验、F检验。选择V
8、iew/Coefficient Tests/Wald-Coefficient Restrictions,在编辑对话框中输入约束条件。为检验+=1 的规模报酬不变的假设,输入下列约束:c(2)+c(3)=1EViews显示Wald检验如下结果(原假设:约束条件有效):,EViews显示F统计量和 2 统计量及相应的P值。2 统计量等于F 统计量乘以检验约束条件数。本例中,仅有一个约束条件,所以这两个检验统计量等价。它们的P值表明可以接受规模报酬不变的原假设。,二、对回归模型增加或减少解释变量,考虑如下两个回归模型,(8),(9),(8)式可看成是(9)式的受约束回归:,H0:,相应的统计量为:,
9、将上式分子和分母同时除以TSS,得到统计量的另一个等价式:,如果约束条件为真,即额外的变量Xk+1,Xk+q对没有解释能力,则统计量较小;否则,约束条件为假,意味着额外的变量对有较强的解释能力,则统计量较大。因此,可通过F统计量的计算值与临界值的比较,来判断额外变量是否应包括在模型中。,结论:,检验若干线性约束条件是否成立的F 检验,例11.1:建立中国国债发行额模型,选择3个解释变量,国内生产总值,财政赤字额,年还本付息额,根据散点图建立中国国债发行额模型如下:DEBTt=0+1 GDPt+2 DEFt+3 REPAYt+ut其中DEBTt表示国债发行总额(单位:亿元),GDPt表示年国内生
10、产总值(单位:百亿元),DEFt表示年财政赤字额(单位:亿元),REPAYt表示年还本付息额(单位:亿元)。,例11.1:建立中国国债发行额模型,EViews可以有三种途径完成上述F检验。(1)在输出结果窗口中点击View,选Coefficient Tests,Wald Coefficient Restrictions功能(Wald参数约束检验),在随后弹出的对话框中填入c(3)=c(4)=0。可得如下结果。其中F=537.5。,例11.1:建立中国国债发行额模型,(第3版256页),例11.1:建立中国国债发行额模型,三、参数的稳定性检验,1、参数稳定性检验(Chow Test,邹检验),建
11、立模型时往往希望模型的参数是稳定的,即所谓的结构不变,这将提高模型的预测与分析功能。如何检验?,假设需要建立的模型为,在两个连续的时间序列(1,2,,n1)与(n1+1,,n1+n2)中,相应的模型分别为:,合并两个时间序列为(1,2,,n1,n1+1,,n1+n2),则可写出如下无约束回归模型,如果=,表示没有发生结构变化,因此可针对如下假设进行检验:H0:=(10)式施加上述约束后变换为受约束回归模型,(10),(11),因此,检验的F统计量为:,记RSS1与RSS2为在两时间段上分别回归后所得的残差平方和。容易证明:,于是,K+1,参数稳定性的检验步骤,(1)分别以两连续时间序列作为两个
12、样本进行回归,得到相应的残差平方:RSS1与RSS2(2)将两序列并为一个大样本后进行回归,得到大样本下的残差平方和RSSR(施加相等约束)(3)计算F统计量的值,与临界值比较:若F值大于临界值,则拒绝原假设,认为发生了结构变化,参数是非稳定的。该检验也被称为邹氏参数稳定性检验,简称邹检验(Chow test for parameter stability)。,例1.3 中国城镇居民食品人均消费需求的邹检验。,X:人均消费X1:人均食品消费GP:居民消费价格指数FP:居民食品消费价格指数XC:人均消费(90年价)Q:人均食品消费(90年价)P0:居民消费价格缩减指数(1990=100)P1:居
13、民食品消费价格缩减指数(1990=100,1.参数稳定性检验,19811994:,RSS1=0.003240,19952001:,(9.96)(7.14)(-5.13)(1.81),19812001:,(14.83)(27.26)(-3.24)(-11.17),给定=5%,查表得临界值F0.05(4,13)=3.18,结论:F值临界值,拒绝参数稳定的原假设,表明中国城镇居民食品人均消费需求在1994年前后发生了显著变化。,2、预测检验,上述参数稳定性检验要求n2k。(k为自变量个数)如果出现n2k,则往往进行如下的邹氏预测检验(Chow test for predictive failure)
14、。,邹氏预测检验的基本思想:先用前一时间段n1个样本估计原模型,再用估计出的参数进行后一时间段n2个样本的预测。,如果预测误差较大,则说明参数发生了变化,否则说明参数是稳定的。,分别以、表示第一与第二时间段的参数,则:,其中,,(12),如果=0,则=,表明参数在估计期与预测期相同,(12)的矩阵式:,可见,用前n1个样本估计可得前k个参数的估计,而是用后n2个样本测算的预测误差X2(-),(13),如果参数没有发生变化,则=0,矩阵式简化为,(14),(14)式与(13)式,这里:KU-KR=n2;RSSU=RSS1,分别可看成受约束与无约束回归模型,于是有如下F检验:,(1)在两时间段的合
15、成大样本下做OLS回归,得受约束模型的残差平方和RSSR;(2)对前一时间段的n1个子样做OLS回归,得残差平方和RSS1;(3)计算检验的F统计量,做出判断:,邹氏预测检验步骤,给定显著性水平,查F分布表,得临界值F(n2,n1-k-1),如果 FF(n2,n1-k-1),则拒绝原假设,认为预测期发生了结构变化。,2、邹氏预测检验,给定=5%,查表得临界值F0.05(7,10)=3.18 结论:F值临界值,拒绝参数稳定的原假设,例1.3 中国城镇居民食品人均消费需求的邹检验。,参数稳定性检验数据表,参数稳定性检验全部样本估计,参数稳定性检验选择Chow检验,参数稳定性检验选择突变点,参数稳定
16、性检验检验,在5%的显著性水平下,自由度为(4,13)的F分布的临界值为3.18,可见计算的F值远大于临界值,拒绝参数稳定的原假设,表明中国城镇居民对食品的人均消费需求行为在1995年前后发生了显著变化。,例1.4:中国1978年2006年的数据建立的居民消费方程:const=449.07+0.734*inct+t(8.64)(126.1)R2=0.998 D.W.=0.53其中:cons 是居民消费;inc 是可支配收入。方程中c0=449.07代表自发消费,表示收入等于零时的消费水平;而c1=0.734代表了边际消费倾向,0c11,即收入每增加1元,消费将增加 c1 元。从系数中可以看出边
17、际消费倾向是0.73。也即1978年2006年中国居民可支配收入的73%用来消费。,参数稳定性检验选择预测检验,选择View/Stability Test/Chow Forecast Test进行Chow预测检验。对预测样本开始时期或观测值数进行定义。数据应在当前观测值区间内。仍以例1.4所建立的消费函数为例,定义1994作为预测区间第一个分割点。检验重新估计19781993的方程,并且使用这个结果来计算剩余时期的预测误差。结果如下:,对数似然比(LR)统计量和F统计量拒绝原假设(5%水平),说明中国的消费函数在1994年前后有结构变化。,四、非线性约束,也可对模型参数施加非线性约束,如对模型
18、,施加非线性约束12=1,得到受约束回归模型:,该模型必须采用非线性最小二乘法(nonlinear least squares)进行估计。如果施加于模型的约束是非线性的,模型存在参数非线性,或者扰动项的分布不是正态的,在这些情况下,F检验就不再适用,通常需要采用最大似然比检验Likelihood Ratio,LR)、沃尔德检验(Wald)与拉格朗日乘数检验(Lagrange Multiplier,LM)这三个检验方法中的一个来检验约束条件是否成立。这些检验是建立在最大似然原理基础上的。,1、似然比检验(likelihood ratio test,LR),基本思路是如果约束条件成立,则相应的约束
19、模型与无约束模型的对数似然函数极大值应该是近似相等的。似然函数 表示由无约束模型得到的对数似然函数极大值。表示由受约束模型得到的对数似然函数极大值,1、似然比检验(likelihood ratio test,LR),估计:无约束回归模型与受约束回归模型,方法:极大似然法,检验:两个似然函数的值的差异是否“足够”大。,记L(,2)为一似然函数:无约束回归:Max:,受约束回归:Max:,约束:g()=0,受约束的似然函数值不会超过无约束的函数值,但如果约束条件为真,则两个似然函数值就非常“接近”。,由此,定义似然比(likelihood ratio):,判断规则:如果比值很小,说明两似然函数值差
20、距较大,则应拒绝约束条件为真的假设;如果比值接近于,说明两似然函数值很接近,应接受约束条件为真的假设。,具体检验时,由于大样本下:,h是约束条件的个数。因此:通过LR统计量的2分布特性来进行判断。LR检验要检验的是 是否显著异于0。,似然比(LR)检验,似然比(LR)检验,在中国城镇居民人均食品消费需求例中,对零阶齐次性的检验:,LR=-2(38.57-38.73)=0.32,给出=5%、查得临界值20.05(1)3.84,LR 20.05(1),不拒绝原约束的假设,结论:中国城镇居民对食品的人均消费需求函数满足零阶齐次性条件。,2、沃尔德(Wald)检验,在实践中似然比检验的缺点是需要估计约
21、束和无约束参数向量,既要进行约束回归,又要进行无约束回归。如果模型结构比较复杂,其估计值可能很难计算。两个可供选择的方法沃尔德检验(Wald Test)和拉格朗日乘数检验,可以解决这个问题。这两个检验只需要估计约束和无约束参数向量之一。,、沃尔德检验(Wald test,W),沃尔德检验是由沃尔德1943年提出来的,F检验和似然比LR检验都需要估计约束模型和无约束模型两个模型。沃尔德检验只需要估计一个无约束模型。沃尔德检验既适用于线性参数约束,又适用于非线性参数约束。,设 是在无约束情况下得到的参数估计值向量,要检验的原假设为:若约束条件成立,则至少 应该近似地满足约束条件。如果原假设是错的,
22、则 应该显著地不等于0。W检验就是遵循这个思路构建的。W统计量:成立和大样本的情况下,W服从自由度为约束条件个数的 分布。其中,需注意的是,W统计量仅需要无约束模型的计算,但仍需要计算协方差矩阵,其估计值由下式给出:其中 表示估计。是一个 矩阵,J是约束条件的个数,K是待估计参数的个数,它的第j行是第j个约束关于 的第k个元素的导数。,、沃尔德检验(Wald test)例,沃尔德检验中,只须估计无约束模型。如对,在所有经典假设都成立的条件下,容易证明,因此,在1+2=1的约束条件下:,记,可建立沃尔德统计量:,沃尔德(Wald)检验,(第3版261页),沃尔德(Wald)检验,(第3版262页
23、),3、拉格朗日乘数(LM)检验,拉格朗日乘数(LM)检验基于受约束模型,只需估计受约束模型,无需估计无约束模型。,(第3版第265页),拉格朗日乘子(LM)检验,(第3版265页),11.6 拉格朗日乘子(LM)检验,(第3版266页),11.6 拉格朗日乘子(LM)检验,(第3版267页),11.6 拉格朗日乘子(LM)检验,4、实际应用中三种检验法的选择,实际应用中在LR、W和LM的选择上,计算成本往往起着关键作用。计算LR统计量,的约束和无约束估计值都要计算,如果二者都不难计算,则LR检验是三种检验中最具吸引力的。,计算W统计量仅需要无约束估计值。如果约束估计值的计算比较困难,而无约束估计值计算不困难,如约束条件是非线性的情况,则W统计量应成为首选。计算LM 统计量仅需受约束估计值。如果受约束估计值的计算比较容易,而无约束估计值的计算困难,例如施加约束后使非线性模型转换成线性模型的情况,则LM统计量应成为首选。在计算方面的考虑不是问题的情况下,应选择LR检验。,练习,OLS法的估计结果如下:,子样本1:1991年-2010年,子样本2:2001年-2015年,请计算参数稳定性检验和chow预测检验的F值,
链接地址:https://www.31ppt.com/p-5478169.html