方程模型的统计检验.ppt
2.4 多元线性回归模型的统计检验Statistical Test of Multiple Linear Regression Model,说 明,计量经济学模型是应用数理统计方法建立的一类经济数学模型,所以在模型参数估计出来后,必须检验其是否满足数学理论与方法上的要求。计量经济学模型的统计检验主要包括:拟合优度检验方程的显著性检验变量的显著性检验,一、拟合优度检验Testing the Simulation Level,1、概念,拟合优度检验:就是检验模型对样本观测值的拟合程度。拟合优度检验的方法:通过构造一个可以表征拟合程度的统计量来实现。,2、总体平方和、残差平方和和回归平方和,定义,TSS为总体平方和(Total Sum of Squares),反映样本观测值总体离差的大小;,ESS为回归平方和(Explained Sum of Squares),反映由模型中解释变量所解释的那部分离差的大小;,RSS为残差平方和(Residual Sum of Squares),反映样本观测值与估计值偏离的大小,也是模型中解释变量未解释的那部分离差的大小。,既然ESS反映由模型中解释变量所解释的那部分离差的大小,可否直接用它作为拟合优度检验的统计量?不行。因为作为检验统计量,必须是相对量,而不能是绝对量。怎样构造相对数形式的拟合优度检验统计量?依据TSS、ESS、RSS之间存在的如下关系:TSS=ESS+RSS,关于TSS=ESS+RSS的证明过程,证明:,将TSS,即总体平方和进行分解:,其中,根据正规方程组,有:,所以,TSS=RSS+ESS,注意:对于一个拟合得好的模型,回归平方和与总体平方和应该比较接近。,所以,可以选择回归平方和与总体平方和的接近程度作为评判模型拟合优度的标准。,于是可以用,检验模型的拟合优度。,在应用过程中人们发现,如果在模型中增加一个解释变量,那么模型的回归平方和随之增大,从而R2也随之增大。,这就给人一个错觉:要使得模型拟合得好,就必须增加解释变量。,所以,用以检验拟合优度的统计量必须能够防止这种倾向。,显然,如果模型与样本观测值完全拟合,即,(,i=1,2,n,),此时,R,2,=1,。,当然,模型与样本观测值完全拟,合的情况是不可能发生的。,但毫无疑问的是,,,该统计量越接,近于1,模型的拟合优度越高。,。,式中,(n-k-1)为残差平方和RSS的自由度,(n-1)为总体平方和TSS的自由度。,可决系数R2 的简捷计算公式:,二、方程显著性检验Testing the Overall Significance,方程的显著性检验:对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。,直观上看,拟合优度高,则解释变量对被解释变量的解释程度就高,可以推测模型总体线性关系成立;反之,就不成立。但这只是一个模糊的推测,不能给出一个在统计上严格的结论。这就要求进行方程的显著性检验。,方程的显著性检验所应用的方法,是数理统计学中的假设检验。,1、关于假设检验,假设检验是统计推断的一个主要方面,它的基本任务是根据样本所提供的信息,对未知总体分布的某些方面的假设作出合理的判断。假设检验的程序是,先根据实际问题的要求提出一个论断,称为统计假设,记为H0;然后根据样本的有关信息,对H0的真伪进行判断,作出拒绝H0或接受H0的决策。,假设检验的基本思想是概率性质的反证法。也就是说,为了检验原假设H0是否正确,先假定这个假设是正确的,看由此能推出什么结果。如果导致一个不合理的结果,则表明“假设H0为正确”是错误的,即原假设H0不正确,因此要拒绝原假设H0。如果没有导致一个不合理现象的出现,则不能认为原假设H0不正确,因此不能拒绝原假设H0。,概率性质的反证法的根据是小概率事件原理,该原理认为“小概率事件在一次试验中几乎是不可能发生的”。,2、方程的显著性检验,方程的显著性检验:对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。用以进行方程的显著性检验的方法主要有三种:F检验、t检验、r检验。它们的区别在于构造的统计量不同,即设计的“事件”不同。其中,应用最为普遍的是F检验。,方程显著性的F检验,检验模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立,也就是要检验模型,(i=1,2,n),中的参数是否显著不为0。,(1),按照假设检验的原理与程序,可以提出假设:,显然,当H0成立时,即表示模型的线性关系不成立;当H1成立时,即表示模型的线性关系成立。,(2),并且,RSS与ESS相互独立。,所以,统计量,该统计量即为用于方程显著性检验的F统计量。,直观上看,回归平方和ESS是解释变量整体对被解释变量Y的线性作用的结果,如果ESS/RSS的比值较大,则解释变量整体对Y的解释程度高,可以认为总体存在线性关系;反之,总体可能不存在线性关系。因此,可以通过该比值的大小对总体线性关系进行推断。,可以证明,当,成立时,有,,,,,-,。,例 在前述消费模型中,k=2,n=16,给定=0.01,查得0.01(2,13)=6.70,而=28682.516.70,所以该线性模型在0.99的置信水平下显著成立。,关于拟合优度检验与方程显著性检验关系的讨论,拟合优度检验和方程显著性检验是从不同原理出发的两类检验:前者是从已经得到估计的模型出发,检验它对样本观测值的拟合程度,后者是从样本观测值出发检验模型总体线性关系的显著性。,但是二者又是关联的:模型对样本观测值的拟合程度高,模型总体线性关系的显著性就强。,这两个用作检验标准的统计量之间存在如下的数量关系:,多大才算通过拟合优度检验?,实际上,有许多著名的模型,R2小于0.5,支持了重要的结论。例如西蒙库兹涅茨关于收入差距的倒U型规律、H钱纳里的发展的形式1950-1970。,重新回到前面的问题:,这说明,在应用中不必对,过分苛求,重要的是考察模型的,经济关系是否合理。,方程显著性检验(F检验)的步骤,(1)对总体参数提出联合假设:,(2)在原假设H0的基础上,根据样本数据计算F统计量的经验值:,三、变量显著性检验Testing the Individual Significance,1、什么是变量的显著性检验?,对于多元线性回归模型,方程的总体线性关系是显著的,并不能说明每个解释变量对被解释变量的影响都是显著的。因此,必须对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。如果某个变量对被解释变量的影响并不显著,应该将它剔除,以建立更为简单的模型。这就是变量显著性检验的任务。变量显著性检验的数理统计学基础相同于方程显著性检验,检验的思路与程序也与方程显著性检验相似 用以进行变量显著性检验的方法主要有三种:F检验、t检验、z检验。它们的区别在于构造的统计量不同。其中,应用最为普遍的是t检验。,注意,模型中包括几个解释变量,就要计算几个t的数值。,2、变量显著性的t检验,在前述消费模型中:变量GDP和CONS(-1)各自的t统计量样本值分别为 tgdp=22.00 tcons(-1)=4.188 给定=0.01,查得t0.005(13)=3.012。由于tgdp、tcons(-1)都大于临界值t0.005(13),所以,变量GDP和CONS(-1)在0.99的水平下都显著。,变量显著性检验(t 检验)的步骤,(1)对总体参数提出假设:,(2)在原假设H0的基础上,根据样本数据计算t 统计量的经验值:,3、在一元线性回归(k=1)中,t检验与F检验是一致的。,