多元回归补充已读.ppt
《多元回归补充已读.ppt》由会员分享,可在线阅读,更多相关《多元回归补充已读.ppt(65页珍藏版)》请在三一办公上搜索。
1、多元线性回归分析,目的,回顾一元线性回归应用场合了解回归的几种类型了解多元线性回归的应用场合掌握多元线性回归的分析方法直接利用回归先利用逐步回归寻找合适的自变量,再进行回归先利用最佳子集回归寻找合适的自变量,再进行回归掌握多元共线性问题的解决办法,多元回归,一元回归的方法很容易就可以推广到多元的问题。这在实际工作中是经常出现的,因为对于一个事物来说,影响它的因素是多方面的,当这些因素中每一个都很重要,或者说有几个是很重要的,而不是只有一个因素最重要,这时我们就需要用到多元回归分析的方法。如在预测销售量时,在最简单的情况下,可以认为它只与你的广告预算有关,但在实际工作中,如果要比较准确地预测销售
2、量,可能还需要考虑其他因素,如:季节因素,库存情况,销售能力、产品质量等。多元回归又分为多元非线性回归和多元线性回归。,回归模型的类型,一元非线性回归,多元线性回归,多元非线性回归,一元线性回归,范例1:巴特勒运输公司,巴特勒是美国加利福利亚州的一家独立运输公司,其主营业务地域为本地,为了建立更好的工作日程表,经理们计划为他们的驾驶员估计日常行驶时间。经理们认为日常行驶时间跟行驶距离有关,试根据所学知识,求:两者之间的关系式。,打开文件:“12_A_ 多元回归 Muliti Regression.Mpj”中:“运输公司.mtw”,范例1:巴特勒运输公司数据,范例1:巴特勒运输公司,范例1:巴特
3、勒运输公司,R2=66.4%,只能解释66.4%的变异比例。,范例1:巴特勒运输公司,经理们这时开始考虑,也许日常行驶时间不仅跟行驶距离有关,还跟运货次数有关,试求:行驶时间与行驶距离及运货次数之间的关系式。我们可以考虑使用多元回归!,范例1:巴特勒运输公司,范例1:巴特勒运输公司,这时,R2由原来的66.4%上升到现在的90.4%,现在能解释90.4%的变异比例。模型拟合得更好了!,范例1:巴特勒运输公司,由于增加自变量的数量将会影响到因变量中的变异性被估计的回归方程解释的变异比,为了避免高估这一影响,所以许多分析学家提出用自变量的数量去修正R 的值,R调整的计算公式如下:,n=数据的行数;
4、前面案例中n=10.,p=项数(包含常数项,如Y=kx+b;则p=2,前面案例中p3),R 调整值越大说明通常说明该方程式越合适。,R调整值,范例1:巴特勒运输公司,S越小越好,当S=0时,R2100,范例1:巴特勒运输公司,在方差分析表中的P值小于0.05,代表整个方程是统计上显著的,也就是行驶时间至少与与行驶距离或运货次数之间的一个或两个因子间的数学关系是显著的。,范例1:巴特勒运输公司,行驶距离和送货次数的P值都小于0.05,说明两个因子都属于显著因子。,练习1:多元回归,练习 1:一家广告公司的老板打算将客户的每周总营业收入作为电视广告费和报刊广告费的函数来估计,8周的历史数据见:“广
5、告费用.mtw”,请分析回归方程式,如果电视广告费为3500美元,报刊广告费为1800美元,试估计该周总收入。,打开文件:“12_A_ 多元回归 Muliti Regression.Mpj”中:“广告费用.mtw”,练习1:多元回归,练习1:多元回归,家电商品的需求量Y与其价格X1及居民家庭平均收入X2有关,下表给出了某市10年中某家电商品需求量与价格和家庭年平均收入水平间的数据。求该商品年需求量Y关于价格X1和家庭年平均收入X2的回归 方程。预计下一年度该商品的价格水平为3500元,家庭年平均收入为18000元,希望预测该商品下一年的需求量,练习2:多元回归,打开文件:“12_A_ 多元回归
6、 Muliti Regression.Mpj”中:“家电.mtw”,多元回归的使用时机,当流程或噪音输入变量为计量型数据(连续型数据),且输出变量的类型也是计量型(连续型数据)时,而且输入变量的个数超过一个时,可用多元回归分析来研究输入变量和输出变量间的关系。,在计划经济时期,我国钢材产量Y主要与以下因素有关:原油产量X1,生铁产量X2,原煤产量X3,电力产量X4,固定资产投资X5,国民收入消费额X6,铁路运输能力X7。下表给出了我国自1975年到1986年12年间上述各项经济指标数据。试建立计划经济时期影响我国钢材产量最合适的回归模型。,范例2:多元回归,打开文件:“12_A_ 多元回归 M
7、uliti Regression.Mpj”中:“钢材产量.mtw”,钢材产量与其他经济变量数据,范例2:钢材产量与其他经济变量,范例2:钢材产量与其他经济变量,在方差分析表中的P值小于0.05,代表整个方程是统计上显著的,R2=99.8%,代表方程式能够解释的变异比例很高。,范例2:钢材产量与其他经济变量,有些X的P值大于0.05,代表该X可能对Y不显著。我们需要把P值大于0.05的一个一个进行判断和排除,先从P值最大的开始排除。再次进行回归,把X7不要考虑进回归模型,因为X7的P值=0.975,最大。,范例2:钢材产量与其他经济变量,再次进行回归,把X7不要考虑进回归模型,把X1X6放到预测
8、变量中。,范例2:钢材产量与其他经济变量,再次进行回归,把X6不要考虑进回归模型,(因为X6的P值最大);把X1X5放到预测变量中。,范例2:钢材产量与其他经济变量,依次进行回归,直到回归模型中所有的预测变量的P值小于0.05为止。,多元回归选择合适模型的其他方法,在上题中使用 Minitab 中的回归程序,来看看我们如何找到合适数量的输入变量预测Y。七个变量中哪些变量与Y的关系密切,最佳回归模型中应该包含哪些因子?显然使用回归的方法效率太低!那是否存在更好的缩减因子,选择最佳拟合模型的方法呢?我们可以考虑如下步骤:步骤1:我们将讨论 多元回归时选择最佳模型的两种不同的方法:方法1:逐步 此程
9、序筛选所有输入,以产生“最佳”的模型 方法2:最佳子集 此程序提供最佳单变量、双变量、三变量等模型,但在处理多输入变量时会耗費大量时间。步骤2:回归 一旦最佳模型被选定后,回归程序将用该模型实施更详细的分析,我们同时会执行残差分析,步骤1的方法1:逐步回归,逐步回归分析菜单,响应是我们需要预测的Y值,预测变量X1X7全部选入。,若大于,则从模型中删除该变量,再重复上述操作过程。如果没有任何自变量可以删除,则会尝试再加入一个新的自变量,重复上述操作,直至不能再引入也不能再删除为止。,逐步回归分析法就是让计算机自动进行多元回归分析中的自变量筛选工作。主要有三种方法:(1)逐步(向前或向后)的方法是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 回归 补充
链接地址:https://www.31ppt.com/p-6109238.html