现代统计分析方法与应用ppt课件 第六章 违背基本假设的回归分析.ppt
《现代统计分析方法与应用ppt课件 第六章 违背基本假设的回归分析.ppt》由会员分享,可在线阅读,更多相关《现代统计分析方法与应用ppt课件 第六章 违背基本假设的回归分析.ppt(122页珍藏版)》请在三一办公上搜索。
1、2022/12/9,中国人民大学六西格玛质量管理研究中心,1,第6章 违背基本假设的回归分析,6.1 关于异方差性问题6.2 关于自相关性问题 6.3 关于多重共线性问题6.4 异常值与强影响值,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,2,第6章 违背基本假设的回归分析,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,3,6.1 关于异方差性问题,一、异方差产生的原因由于实际问题是错综复杂的,因而在建立具体问题的回归分析模型时,经常会出现某一因素或一些因素随着解释变量观测值的变化而对被解释变量产生不同的影响
2、,导致随机误差项产生不同方差。通过下面的几个例子,我们可以了解产生异方差性的背景和原因。,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,4,6.1 关于异方差性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,5,6.1 关于异方差性问题,利用平均数作为样本数据,也容易出现异方差性。因为正态分布的普遍性,许多经济变量之间的关系遵从正态分布。引起异方差的原因很多,但样本数据为截面数据时容易出现异方差性。,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,6,6.1 关于异方
3、差性问题,二、异方差性带来的问题 当一个回归问题存在异方差性时,如果仍用普通最小二乘法估计未知参数,将引起严重后果,特别是最小二乘估计量不再具有最小方差的优良性,即最小二乘估计的有效性被破坏了。,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,7,6.1 关于异方差性问题,当存在异方差时,普通最小二乘估计存在以下问题:(1)参数估计值虽是无偏的,但不是最小方差线性无偏估计;(2)参数的显著性检验失效;(3)回归方程的应用效果极不理想。,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,8,6.1 关于异方差性问题,三
4、、异方差性的检验关于异方差性的检验,统计学家们进行了大量的研究,提出的诊断方法已有十多种,但没有一个公认的最优方法。本书介绍残差图分析法与等级相关系数检验法二种常用方法。(一)残差图分析法,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,9,6.1 关于异方差性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,10,6.1 关于异方差性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,11,6.1 关于异方差性问题,(二)等级相关系数法等级相关系数检验法又称斯皮尔曼(
5、Spearman)检验(见参考文献5),是一种应用较广泛的方法。这种检验方法在样本容量大或小时都可应用。进行等级相关系数检验通常有三个步骤。,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,12,6.1 关于异方差性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,13,6.1 关于异方差性问题,例6.3 设某地区一些企业的广告投入与销售收入的横截面样本数据(单位:万元)如表6.1所示。 (1)用普通最小二乘法建立销售收入y与广告投入x的回归方程,并画出残差散点图;(2)诊断该问题是否存在异方差;,目录 上页
6、下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,14,6.1 关于异方差性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,15,6.1 关于异方差性问题,从残差图看出,误差项具有明显的异方差性,误差随着x的增加而增加。,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,16,6.1 关于异方差性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,17,6.1 关于异方差性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西
7、格玛质量管理研究中心,18,6.1 关于异方差性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,19,6.1 关于异方差性问题,对一般情况,等级相关系数可以如实反映呈单调趋势变动的变量间的相关性,而简单相关系数只能反映呈直线趋势变动的变量间的相关性。,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,20,6.1 关于异方差性问题,四、加权最小二乘估计 当我们所研究的问题存在异方差性时,线性回归模型的基本假定就被违反了。此时,就不能用普通最小二乘法进行参数估计,必须寻求适当的补救方法,对原来的模型进行变换,使变
8、换后的模型满足同方差性假设,然后进行模型参数的估计,就可得到较为理想的回归模型。消除异方差性的方法通常有加权最小二乘法,Box-Cox变换法,方差稳定化变换法(参见参考文献6)。下面结合例6.3介绍加权最小二乘法。加权最小二乘法(Weighted Least Square,简记为WLS)是一种最常用的消除异方差性的方法。,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,21,6.1 关于异方差性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,22,6.1 关于异方差性问题,目录 上页 下页 返回 结束,202
9、2/12/9,中国人民大学六西格玛质量管理研究中心,23,6.1 关于异方差性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,24,6.1 关于异方差性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,25,6.1 关于异方差性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,26,6.1 关于异方差性问题,五、寻找最优权函数利用SPSS软件可以确定(6.6)式幂指数m的最优取值。对例6.3的数据,依次点选Statistics-Regression-Weight
10、 Estimation进入估计权函数对话框,默认的幂指数m的取值为m=-2.0,-1.5,-1.0,-0.5,0,0.5,1.0,1.5,2.0,这一默认值可以更改。先将因变量y与自变量x选入各自的变量框,再把x选入Weight变量框,幂指数(Power)取默认值,计算结果如下(格式略有变动):,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,27,6.1 关于异方差性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,28,6.1 关于异方差性问题,对异方差问题的处理至今没有什么更好的方法,一些方法的处理效果往
11、往不甚明显,所以此例能有所改进也就不错了。,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,29,6.1 关于异方差性问题,六、 多元加权最小二乘(1)多元加权最小二乘法,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,30,6.1 关于异方差性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,31,6.1 关于异方差性问题,(2)权函数的确定方法,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,32,6.1 关于异方差性问题,目录
12、 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,33,6.1 关于异方差性问题,仿照例6.3,用Weight Estimate估计幂指数m,得m的最优值为m=1.5,部分输出结果为,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,34,6.1 关于异方差性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,35,6.2 关于自相关性问题,这里的自相关现象不是指两个或两个以上的变量之间的相关关系,而指的是一个变量前后期数值之间存在的相关关系。本节主要讨论自相关现象产生的背景和原因
13、,自相关现象对回归分析带来的影响,诊断自相关是否存在的方法,以及如何克服自相关现象带来的影响。,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,36,6.2 关于自相关性问题,一、 自相关的背景及其原因在实际问题的研究中,经常遇到的时间序列出现正的序列相关的情形。产生序列自相关的背景及其原因通常有以下几个方面。 1.遗漏关键变量时会产生序列的自相关性。2.经济变量的滞后性会给序列带来自相关性。3.采用错误的回归函数形式也可能引起自相关性。 4.蛛网现象(Cobweb phenomenon)可能带来序列的自相关性。5.因对数据加工整理而导致误差项之间产生自
14、相关性。,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,37,6.2 关于自相关性问题,二、自相关性带来的问题当一个线性回归模型的随机误差项存在序列相关时,就违背了线性回归方程的基本假设,如果仍然直接用普通最小二乘法估计未知参数,将会产生严重后果,一般情况下序列相关性会带来下列问题。,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,38,6.2 关于自相关性问题,1.参数的估计值不再具有最小方差线性无偏性。2.均方误差MSE可能严重低估误差项的方差。3.容易导致对t值评价过高,常用的F检验和t检验失效。如果忽视这
15、一点,可能导致得出回归参数统计检验为显著,但实际上并不显著的严重错误结论。,5.如果不加处理地运用普通最小二乘法估计模型参数,用此模型进行预测和结构分析将会带来较大的方差甚至错误的解释。,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,39,6.2 关于自相关性问题,三、自相关性的诊断由于随机扰动项存在序列相关时给普通最小二乘法的应用带来了非常严重的后果,因此,如何诊断随机扰动项是否存在序列相关就成为一个极其重要的问题。(一) 图示检验法,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,40,6.2 关于自相关性问
16、题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,41,6.2 关于自相关性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,42,6.2 关于自相关性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,43,6.2 关于自相关性问题,(二)自相关系数法,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,44,6.2 关于自相关性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,45,6
17、.2 关于自相关性问题,(三)D.W检验D.W检验是J.Durbin和G.S.Watson于1951年提出的一种适用于小样本量的一种检验方法。D.W检验验只能用于检验随机扰动项具有一阶自回归形式的序列相关问题。这种检验方法是建立计量经济学模型中最常用的方法,一般的计算机软件都可自动产生出D.W值。,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,46,6.2 关于自相关性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,47,6.2 关于自相关性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大
18、学六西格玛质量管理研究中心,48,6.2 关于自相关性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,49,6.2 关于自相关性问题,上述判别准则可用图6.4表示,可看到D.W=2的左右,有一个较大的无自相关区域,所以,通常当D.W的值在2左右时,则无须查表,即可放心地认为模型不存在序列的自相关性。,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,50,6.2 关于自相关性问题,D.W检验的缺点和局限性。 1.D.W检验有一个不能确定的区域,一旦D.W值落在这个区域,就无法判断。这时,只有增大样本容量或选取其
19、他方法。 2.D.W统计量的上、下界表要求n15,这是因为样本如果再小,利用残差就很难对自相关的存在性作出比较正确的诊断。 3.D.W检验不适应随机项具有高阶序列相关的检验。,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,51,6.2 关于自相关性问题,四、自相关问题的处理方法当一个回归模型存在序列相关性时,首先要查明序列相关产生的原因。如果是回归模型选用不当,则应改用更适当的回归模型;如果是缺少重要的自变量,则应增加自变量;如果以上两种方法不能消除序列相关性,则需采用差分法、自回归法、移动平均法,或者这些方法的综合运用等方法处理.本书在此介绍两种简单
20、的方法,迭代法和差分法。,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,52,6.2 关于自相关性问题,(一)迭代法 以一元线性回归模型为例,设一元线性回归模型的误差项存在一阶自相关,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,53,6.2 关于自相关性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,54,6.2 关于自相关性问题,模型(6.24)式有独立随机误差项,它已满足线性回归模型的基本假设,用普通最小二乘法估计的参数估计量具有通常的优良性。,目录 上页 下
21、页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,55,6.2 关于自相关性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,56,6.2 关于自相关性问题,(二)差分法差分法就是用增量数据代替原来的样本数据,将原来的回归模型变为差分形式的模型。一阶差分法通常适用于原模型存在较高程度的一阶自相关的情况。,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,57,6.2 关于自相关性问题,对(6.26)式这样不带有常数项的回归方程仍用最小二乘法,但它与前边的带有常数项的情形稍有不同,它是回归直
22、线过原点的回归方程。根据第4章习题过原点的回归的最小二乘估计得:,一阶差分法的应用条件是自相关系数=1,在实际应用中,接近1时我们就采用差分法而不用迭代法,这有两个原因。第一,迭代法需要用样本估计自相关系数,对的估计误差会影响迭代法的使用效率;第二,差分法比迭代法简单,人们在建立时序数据的回归模型时,更习惯于用差分法 。,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,58,6.2 关于自相关性问题,(三)实例分析,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,59,6.2 关于自相关性问题,目录 上页 下页 返
23、回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,60,6.2 关于自相关性问题,1.用迭代法消除自相关。,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,61,6.2 关于自相关性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,62,6.2 关于自相关性问题,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中心,63,6.2 关于自相关性问题,2.用一阶差分法消除自相关。,目录 上页 下页 返回 结束,2022/12/9,中国人民大学六西格玛质量管理研究中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 现代统计分析方法与应用ppt课件 第六章 违背基本假设的回归分析 现代 统计分析 方法 应用 ppt 课件 第六 违背 基本 假设 回归 分析
链接地址:https://www.31ppt.com/p-1591283.html