第四章违反经典假定的回归模型(蓝色)new.ppt
《第四章违反经典假定的回归模型(蓝色)new.ppt》由会员分享,可在线阅读,更多相关《第四章违反经典假定的回归模型(蓝色)new.ppt(210页珍藏版)》请在三一办公上搜索。
1、1,在前面几章里我们讨论的回归模型中都有一些基本的假定。只有当一个回归模型满足经典假定条件时,才能得到一个较好的估计。然而,在研究实际的社会经济等问题时,经常会遇到一些违背经典假定的情况。,第四章违背经典假定的回归模型,2,在这些情况下,如果直接用普通最小二乘法建立模型,会得到很不理想的结果。因此,如何处理这些问题,就是我们需要面对的问题。,3,在这一章里我们将重点讨论模型中出现了违背经典假定的几种情况时的诊断及解决办法。异方差 序列相关 多重共线性,4,第一节异方差性,一、异方差性的概念和产生的原因,(一)异方差性的概念,5,在回归模型的基本假设中,假定随机误差项u1,u2,un 具有相同的
2、方差,独立或不相关,即对于所有样本点,有:,(4.1),6,但是在建立实际问题的回归模型时,经常存在与此假设相违背的情况,一种是经济计量建模中常说的方差非齐性或异方差性,即:,当 时,(4.2),7,异方差性:在线性模型的基本假定中,关于方差不变的假定不成立,其他假定不变的情形称为异方差性。,8,(二)异方差产生的原因,实际问题是非常错综复杂的,因而在建立实际问题的回归分析模型时,经常会出现某一因素或一些因素随着解释变量观测值的变化而对被解释变量产生不同的影响,导致随机误差项产生不同方差。通过下面的几个例子,我们可以了解产生异方差性的背景和原因。,9,【例4.1】按照差错学习模式,当人们学习时
3、,动作上出现的差错随时间的增加而逐渐减少。如在某一时期内测验打字差错数(Y)与打字实习小时数(X)之间的关系。随着打字实习小时数的增加,打字差错平均字数及它们的方差不是不变的,而是随之减少的。这个模型中就出现了异方差。,10,【例4.2】在研究城镇居民收入与消费的关系时,我们知道居民收入与消费水平有着密切的关系。用 Xi 表示第 i 户的收入,Yi 表示第 i 户的消费额,那么反映收入与消费之间的模型为:,(4.3),11,在式(4.3)的模型中,因为各户的收入不同,消费观念和习惯的差异,导致消费的差异非常大,模型中存在明显的异方差性。一般情况下,低收入的家庭购买差异性较小,大都购买生活必需品
4、;,12,但是高收入的家庭购买行为差异就很大,高档消费品很多,房子、汽车的规格选择余地也很大,这样购买金额的差异就很大;导致消费模型的随机误差项具有不同的方差。,13,【例4.3】利用某行业的不同企业的截面样本数据估计生产函数,(4.4),由于这里的u表示了包括不同企业的工艺、地理条件、工人素质、管理水平上的差异以及其他因素。对于不同企业,这些因素对产出的影响程度不同,引起ui偏离均值的程度不同,出现了异方差。,14,引起异方差的原因还有很多,如模型中省略了重要的解释变量,模型的函数形式设定不准确等都容易产生异方差。一般情况下样本数据为截面数据时容易产生异方差性。,15,二、异方差产生的后果,
5、当一个回归模型中的随机误差项存在异方差时,是否可以继续使用普通的最小二乘法?倘若我们仍然使用,将会产生什么样的后果?,16,17,当模型中存在异方差时,普通最小二乘估计存在以下问题。,18,1.参数估计量虽是无偏的,但不是最小方差线性无偏估计 根据经典线性回归中关于参数估计量的无偏性和有效性的证明过程,可以看出,当线性回归模型出现异方差性时,其普通最小二乘法参数估计量仍然具有无偏性,但不具有有效性。,19,2.参数的显著性检验失效 在经典线性回归模型中,关于变量的显著性检验构造了t 统计量,在该统计量中包含有随机误差项共同的方差,并且该t 统计量服从自由度为(n-k)的t 分布。如果出现了异方
6、差性,t 检验就失去意义。采用其他检验也是如此。,20,3.回归方程的应用效果极不理想,或者说模型的预测失效。一方面,由于上述后果,使得模型不具有良好的统计性质;另一方面,在预测值的置信区间中也包含有随机误差项共同的方差。所以,当模型出现异方差性时,它的预测功能失效。,21,三、异方差性的检验,对于异方差性的检验,人们进行了大量的研究,提出的诊断方法已有10多种,但没有一个公认的最优方法,下面介绍几种常见的方法。,22,(一)残差图分析法,残差图分析法是一种直观、方便的分析方法。它以残差 为纵坐标,以其他适宜的变量为横坐标画散点图。常用的横坐标有三种选择:(1)以拟合值 为横坐标;(2)以Xi
7、为横坐标;(3)以观测时间或序号为横坐标。,23,图4.1,24,图4.2,25,图4.1和图4.2是以X 为横坐标,残差e2为纵坐标的残差图,表现出残差有一定的趋势。这样的情况下,我们就可以判断出该回归模型有一定的异方差性。图4.1表明ui的方差 反比于解释变量Xi,图4.2表明ui 的方差 正比于解释变量Xi。,26,在EViews软件包中,直接给出了以ei 为纵坐标,以观测时间或序号为横坐标的残差图。,27,如果回归模型适合于样本数据,那么残差ei 应反映ui 所假定的性质,因此可以根据ei 来判断回归模型ui 是否具有某些性质。一般情况下,当回归模型满足所有假定时,以ei 为纵坐标的残
8、差图上的n 个点散布应是随机的、无任何规律。,28,等级相关系数法又称斯皮尔曼(Spearman)检验,是一种应用较广泛的方法。这种检验方法既适用于大样本,也适用于小样本。将异方差性与误差项和某个解释变量之间相关程度联系起来,从而将对异方差性的研究转化为对它们之间相关程度的研究。,(二)等级相关系数法,29,进行等级相关系数检验通常有三个步骤:,第一步,作Y 关于X 的普通最小二乘估计,求出ui 的估计值,即ei 的值。,30,第二步,取ei 的绝对值,即,把 Xi 和 按递增或递减的次序划分等级。按下式计算出等级相关系数,(4.5),其中,n为样本容量,di 为对应于Xi 和 的等级的差数。
9、,31,第三步,做等级相关系数的显著性检验。在n8的情况下,用下式对样本等级相关系数 rs 进行t 检验。检验的统计量为,(4.6),32,如果,则可以认为异方差性问 不存在,如果,说明 Xi 和 之间存在系统关系,则说明模型中存在异方差。,33,在多元的情况下,需对每一个解释变量做等级相关系数检验。只有当每个解释变量检验都不存在异方差时模型中才不存在异方差。否则,模型中存在异方差。,34,首先将样本按某个解释变量的大小顺序排列,并将样本从中间截成两段;然后各段分别用普通最小二乘法拟合回归模型,并分别计算各段的残差平方和。,(三)戈德菲尔德匡特检验(样本分段比检验),35,令第一段为高方差段,
10、第二段为低方差段,并记两段的样本容量分别为n1 和n2,模型参数个数为k,两段样本回归残差分别为e1i和e2i,则两段的残差平方和分别为 和,从而可计算出各段模型的随机误差项的方差估计量分别为 和,36,由此可构造出检验统计量为,(4.7),37,该统计量服从自由度为(n1-k)和(n2-k)的分布。在给定的显著性水平 之下,若此统计量的值大于临界值 则可认为有异方差的存在。,38,为了提高此检验的功效,戈德菲尔德和匡特曾经建议,将观测样本分成两段时,可将中间的部分数据删掉。然而,删掉的数据越多,各段中估计的自由度就越小,从而又会影响检验的功效。因此,删掉的中间部分数据也不能太多。一般地,删掉
11、的数据不应多于样本观测数据的/3。,39,用残差绝对值 对每个解释变量建立各种回归模型,如,等等,并检验回归系数 2 是否为。,(四)戈里瑟(Glejser)检验,40,设原假设为 H0:2=0,备择假设为H1:20,应用t 检验判断,如果20 则有异方差。这种方法不仅能检验出模型中存在的异方差,而且把异方差的表现形式找出来便于后面改进时使用。,41,(五)怀特检验,用残差平方 对所有解释变量及其平方项和交叉乘积项 进行线性回归,并检验各回归系数是否为。,42,对于两个解释变量的回归模型,(4.8),怀特检验步骤如下:第一步,使用普通最小二乘法估计模型(4.8),并获得残差 ei。,43,第二
12、步,做如下的辅助回归,(4.9),就是将残差ei 的平方 对所有的解释变量及解释变量的平方与交叉积回归,求这个辅助回归的判定系数 R2。,44,第三步,在无异方差的原假设下,可以证明,辅助回归的 R2 乘以样本容量n,渐近地服从自由度为辅助回归中解释变量个数 r(不包括常数项)的x2分布,即,(4.10),在本例中,辅助回归有5个解释变量,因此r=5。,45,第四步,如果 nR2大于选定显著性水平的临界2 值,则有异方差。如果不大于临界2值,则无异方差,即在辅助回归中,2=3=4=5=6=0.在EViews软件中,给出了怀特检验程序,可以直接输入相应条件,即可获得怀特检验的结果。,46,四、异
13、方差性的修正办法,当我们所研究的问题存在异方差性时,就违背了线性回归模型的经典假定。此时,就不能用普通最小二乘法进行参数估计。,47,必须寻求适当的补救方法,对原来的模型进行变换,使变换后的模型满足同方差性假定,然后进行模型参数的估计,就可得到理想的回归模型。,48,我们考虑一元线性回归模型,(4.11),加权最小二乘法,49,(一)已知时,如果每个观察值的误差项方差 是已知的,使用 为权数,对模型(4.11)作如下变换:,(4.12),50,由于,通过加权变换使误差项变成同方差了。,51,如果模型的其他假定条件都满足,则模型(4.12)就变成满足经典假定的回归模型了,就可利用普通最小二乘法估
14、计参数,得到的估计量是最佳线性无偏估计量。,52,通过加权变换使原模型中的异方差误差项转换为同方差误差项,使加权变换后的模型满足最小二乘法的假定,从而使用普通最小二乘法估计参数,这种方法称为加权最小二乘法。,53,(二)未知时,如果 是未知的,一般情况下,我们可根据误差与解释变量或被解释变量的关系来确定变换的权数。一般我们先采用戈里瑟检验方法确定ei 与Xi 之间的关系。,54,1如 之间为线性关系,则可认为,(4.13),这时,选择 为权数,即对模型(4.11)两边同时乘以,将异方差模型变为同方差模型。,55,即将模型(4.11)变为,(4.14),56,容易证实模型(4.14)为同方差模型
15、。可用普通最小二乘法估计模型(4.14)的参数,得到最佳线性无偏估计量。,模型(4.14)是无截距模型,要用过原点回归去估计参数,EViews软件包提供了这种功能。,57,2如 之间为线性关系,则可认为,(4.15),58,这时,选择1/Xi为权数,可将模型(4.11)变换为如下模型:,(4.16),59,容易证实,模型(4.16)为同方差模型,可使用普通最小二乘法估计参数 1,2。注意,在变换后的模型(4.16)中,斜率项1是原模型(4.11)的距截项,截距项 2是原模型(4.11)的斜率项。,60,五、实际案例,现有2001年北京市规模最大的41个百货零售商店的商品销售收入和利税总额资料如
16、表4.1所示。,61,表4.1 北京市41家最大百货商店销售资料 单位:万元,62,续表,63,64,利用普通最小二乘法,根据表4.1中的数据,我们可以估计出该回归方程为,(4.17),65,根据此回归方程,可以求出利税总额的回归估计值和残差,然后将销售收入Xi 作为横坐标,残差ei 为纵坐标,画出回归残差图。从残差图看,残差的有不断扩大的趋势,ui 存在明显的异方差性。,66,图4.3 残差图,67,我们运用戈里瑟检验,可得如下的残差回归方程:,(4.18),68,(4.19),很明显,对这二个残差回归方程的回归系数的显著性检验,均拒绝同方差假设,表明存在异方差性。,69,对原模型进行怀特检
17、验,统计量nR2=11.296x0.10(2)=4.605,p值为0.00350.10,说明有异方差存在。选用1/X,1/X(1/2),1/e为权系数使用加权最小二乘法(WLS)进行参数估计。分别进行异方差的怀特检验,结果如下:,70,nR2=8.844,p值为0.0120.10,说明异方差依然存在。,71,nR2=9.306,p值为0.02550.10,说明异方差依然存在。,72,nR2=1.616,p值为0.6560.10,说明异方差已消除。应采用该模型。,73,最后,我们得到的最佳估计值应为-327.006和0.073,最终模型应为,(4.21),74,第二节序列相关,一、序列相关的概念
18、和产生的原因,(一)序列相关的概念,75,在进行回归分析时,我们总假定其随机误差项是不相关的,即,(4.22),上式表示不同时点的误差项之间不相关。如果一个回归模型不满足上式,即,,则我们称随机误差项之间存在着序列相关现象,也称为自相关。,76,(二)序列相关产生的背景和原因,我们在实际问题的研究中,经常遇到时间序列中出现序列相关的情形。产生序列相关的背景及其原因通常有以下几个方面。,77,遗漏了重要的解释变量 在回归分析的建模过程中,如果忽略了一个或几个重要的解释变量,而这些遗漏的重要变量随着时间的推移而呈现出相关的趋势,回归模型中的误差项就会具有明显的相关趋势,这是因为误差项包含了遗漏的变
19、量。,78,经济变量的滞后性 在实际问题的研究中,许多经济变量都会产生滞后影响,例如物价指数、基建投资、国民收入、消费、货币发行量等都有一定的滞后性。如前期消费额对后期消费额一般会有明显的影响。,79,消费支出对收入的回归分析中,经常会发现当期的消费支出除了依赖于其他变量外,还依赖于前期的消费支出,用模型表示为:。出 现这种现象的原因是由于心理、技术及制度上等等的原因,消费者不轻易改变他们的消费习惯。这个模型中就出现了序列相关。,80,回归函数形式的设定错误也可能引起序列相关 例如,假定某实际问题的正确回归函数应由指数模型(4.23)来表示。,(4.23),81,但是,研究者误用线性回归模型(
20、4.24)来表示。,(4.24),这时,误差项 表现为序列相关。,82,蛛网现象(Cobweb Phenomenon)。是微观经济学中的一个概念。它表示某种商品的供给量因受前一期价格影响而表现出来的某种规律性,即呈蛛网状收敛或发散于供需的均衡点。由于规律性的作用,使得所用回归模型的误差项不再是随机的了,而产生了某种自相关。,83,例如,许多农产品的当期供给受前一期的价格的影响。这样,今年某种农产品的生产和供给计划取决于上一年的价格。因此,农产品的供给函数可表示为,(4.25),其中,St=t 时期农产品供给量;Pt-1=t-1时期农产品的价格。,84,假设在t 时期末,价格Pt 低于Pt-1,
21、于是在t+1期初,农民决定比t 时期少生产一些,则t+1期的产量会低于t期。这样下去,就会形成蛛网现象。,85,对原始数据加工整理。在回归分析建模中,我们经常要对原始数据进行一些处理,如在具有季节性时序资料的建模中,我们常常要消除季节性,对数据作修匀处理。但如果采用了不恰当的差分变换,也会带来序列相关。,86,序列相关问题不仅在时序资料的建模中会经常碰到,而且在截面样本中有时也会存在。大多数经济时间序列由于受经济波动规律的作用,一般随着时间的推移有一种向下或向上变动的趋势。所以,随机误差项ut 一般会出现序列相关的情形。,87,二、序列相关性带来的后果,当一个线性回归模型的随机误差项存在序列相
22、关时,就违背了线性回归方程的经典假定,如果仍然直接用普通最小二乘法估计未知参数,将会产生严重后果,一般情况下序列相关产生的后果与异方差类似。,88,2可能严重低估误差项的方差,1参数的估计量是无偏的,但不是 有效的,89,3常用的 检验和t 检验失效 使用普通最小二乘法估计参数可能导致回归参数统计检验为显著,但实际上并不显著的严重错误结论。,90,4如果不加处理地运用普通最小二乘法估计模型参数,回归参数的置信区间和利用回归模型进行预测的结果会存在较大的误差。,91,三、序列相关的检验,当随机误差项存在序列相关时会给普通最小二乘法的应用带来非常严重的后果。因此,如何诊断随机误差项是否存在序列相关
23、就成为一个极其重要的问题。下面介绍几种主要的诊断方法。,92,图示检验法,DW检验法,序列相关的检验,自相关系数法,93,(一)图示检验法,图示法是一种直观的诊断方法,它是把给定的回归模型直接用普通最小二乘法估计参数,求出残差项et,et作为ut随机项的真实估计值,再描绘et 的散点图,根据散点图来判断et的相关性。残差et的散点图通常有两种绘制方式。,94,图 4.4 et与et-1的关系,95,绘制et-1,et 的散点图。用(et-1,et)(t=1,2,n)作为散布点绘图,如果大部分点落在第、象限,表明随机误差项ut存在着正的序列相关,如图4.4所示。,96,如果大部分点落在第、象限,
24、那么随机误差项ut 存在着负自相关,如图4.5所示。,97,按照时间顺序绘制回归残差项的et 图形。如果et(t=1,2,n)随着t 的变化逐次有规律地变化,呈现锯齿形或循环形状的变化,就可断言et 存在相关,表明存在着序列相关;如果et 随着t的变化逐次变化并不断地改变符号,那么随机误差项ut 存在负的序列相关;如图4.6所示。,98,如果et 随着t 的变化逐次变化并不频繁地改变符号,而是几个正的et 后面跟着几个负的,则表明随机误差项存ut 在正的序列相关,如图4.7所示。,99,(二)自相关系数法,误差序列 的自相关系数定义为,(4.26),100,自相关系数 的取值范围是-1,1,当
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 违反 经典 假定 回归 模型 蓝色 new
链接地址:https://www.31ppt.com/p-6005584.html