逐步回归分析ppt课件.pptx
《逐步回归分析ppt课件.pptx》由会员分享,可在线阅读,更多相关《逐步回归分析ppt课件.pptx(51页珍藏版)》请在三一办公上搜索。
1、多元逐步回归方法的基本思路:自动地从大量的可供选择的变量中选取最重要的变量,据以建立回归分析的预测或者解释模型。 变量选取的根据是自变量对因变量作用程度的大小:保留作用程度大的变量,剔除作用小的变量。是否选取一个变量,定量判据之一就是相关系数。假定有m 个自变量,1 个因变量(用y 表示),则全部变量(包括自变量和因变量)之间的相关系数矩阵可以表作,6.1 基本原理,根据相关系数定义一个自变量的“贡献”系数,按照贡献系数的大小决定一个自变量的去留。式中Pj表示第j 个自变量对因变量的贡献系数,Rjy 表示第j 个自变量与因变量的相关系数,Rjj 表示相关系数矩阵对角线上第j 行第j 列元素(j
2、=1,2,m)。,第l 步计算的贡献系数表示为,在逐步回归分析过程中,我们不仅要引入贡献最大的自变量,同时要考虑剔除贡献最小的因变量。因此,变量的存留与否又涉及到另一个统计判据F 检验。设定一个显著性水平,查F 检验表,找到F 检验的临界值F。 在第l步计算中,假如第v个自变量的贡献系数最大,数值为,根据F 检验来判断该自变量是否应该被引入模型。式中h 为尚且没有被引入模型的变量序号,v 为选出的变量对应的原始变量序号(v=1,2,m)。计算变量引入的F 值判断公式如下,式中n 为样品个数,l 为计算步骤数, 为第v 个变量第l 步的贡献系数,Ryy 为因变量的自相关系数。,如果FinF,则在
3、这个显著性水平下,该变量可以被引入模型,否则不要引入。,在第l 步计算中,如果第v 个自变量的贡献系数为,则可以根据F 检验来判断该自变量包括已经引入的变量是否应该被剔除。计算变量剔除的F 值判断公式如下,如果Fout F,则在这个显著性水平下,该变量应该被剔除,否则就要保留。 在整个逐步回归计算过程中,变量的引入和剔除在两端同时进行。像这样循环往复地计算,直到所有该引入的变量都被引入,该剔除的变量均被剔除为止。,6.2.1 数据准备,6.2 计算方法,借助一个简单的实例说明逐步回归分析的方法。问题是山东省淄博市旅游业的发展分析,我们想搞清楚哪些因素影响淄博市的旅游总收入(表6-2-1)。所能
4、考虑的因素包括:国内游客数量、海外游客数量、第三产业的发展和人均GDP 数量(m=4)。从1995 年到2004年一共10 个年份的数据(n=10)。,这些因素都与旅游业总收入具有明确的关系。而且,作为自变量,它们彼此之间也有很强的关系。如果将这四个变量全部引入模型,就会导致多重共线性的问题。为了得到简约、可靠的模型,需要借助逐步回归分析技术。,为了更为有效地说明问题,我们对表6-2-1 的变量排列顺序稍作调整(表6-2-2),利用表6-2-2 的数据,容易计算相关系数,得到矩阵如下(表6-2-3)。逐步回归计算就是从这种相关系数矩阵出发的。将这个矩阵记为,首先设定F 统计量的临界值。取显著性
5、水平=0.05,我们有m=4个自变量,n=10个观测值。不妨取回归自由度为4、剩余自由度为n-m-1=10-4-1=5的临界值为我们引入变量的F 值下限,即取Fc(in)=5.192。另一方面,假定一个变量被淘汰,则有m=3。我们取显著性水平=0.05、回归自由度为3、剩余自由度为n-m-1=10-3-1=6的F 临界值为剔除一个变量的上限,即取Fc(out)=4.757。,这一步的计算可以分解为如下几个步骤。,6.2.2 第一轮计算,(1)计算自变量的贡献系数,(2)找出最大和最小贡献系数及其对应的变量序号,显然, 等于0.98246最大,对应的变量序号v=1。因此,首先考虑引入的变量是国内
6、游客数量x1; 等于0.92574最小,对应的变量序号v=4。故这一步可以考虑将人均GDP即变量x4剔除。,国内游客数量这个变量是否能被引入模型,还要进行一次F 检验。对于我们的问题,n=10,现在计算第l=1步。,(3)计算变量引入和剔除的F 统计量,根据,这个数值远远大于我们设定的临界值Fc(in)=5.192,因此变量x1可以被引入模型。,接下来考虑排除贡献系数最小的变量。但是否排除,要视Fout值而定。根据上述计算结果,0.92574最小,由式下面公式,这个数值高于剔除变量的F临界值4.757,因此第一步不能剔除。,作为对比,可以计算出所有变量的F 变化值。例如,对于第二个变量“第三产
7、业产值”,变量引入和剔除的F 值分别为,(4)相关系数矩阵变换,将 化为,假定第v个变量在第l步被引入,则相关系数矩阵的第v个元素称为主元。矩阵变换是围绕主元进行的。相关系数矩阵的变换公式如下,式中j、k分别为相关系数矩阵的行列编号。根据这个公式,第一步应该改变非主元所在的行、列的元素( j v, k v),第二步改变主元所在的行的元素( j = v, k v),第三步改变主元所在的列的元素( j v, k = v),第四步改变主元本身( j = v, k = v)。,首先变换非主元所在的行和列的元素。我们的主元在第j=1行、第k=1列,故非主元所在的元素为1行、1列以外的元素。例如,其余计算
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 逐步回归 分析 ppt 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-1364536.html