多元线性回归分析ppt课件.ppt
《多元线性回归分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《多元线性回归分析ppt课件.ppt(68页珍藏版)》请在三一办公上搜索。
1、第十五章 多元线性回归分析,(Multiple Linear Regression),讲述内容第一节 多元线性回归第二节 自变量选择方法第三节 多元线性回归的应用 及其注意事项,人的体重与身高、胸围血压值与年龄、性别、劳动强度、饮食习惯、吸烟状况、家族史糖尿病人的血糖与胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂射频治疗仪定向治疗脑肿瘤过程中,脑皮质的毁损半径与辐射的温度、与照射的时间,例 子,目的:作出以多个自变量估计应变量的多元线性回归方程。资料:应变量为定量指标,一定是随机的;自变量全部或大部分为定量指标,可以是随机变动的,也可以是人为选定的,若有少量定性或等级指标需作转换。用途:解释和
2、预报。更精确,第一节 多元线性回归,变量:应变量 1 个,自变量m 个,共 m+1 个。样本含量:n数据格式见表15-1回归模型一般形式:,一、多元线性回归模型,表15-1 多元回归分析数据格式,条件,两自变量与应变量的散点图,一般步骤,建立回归方程,(2)检验并评价回归方程及各自变量的作用大小,二、多元线性回归方程的建立,例15-1 27名糖尿病人的血清总胆固醇、甘油三脂、空腹胰岛素、糖化血红蛋白、空腹血糖的测量值列于表15-2中,试建立血糖与其它几项指标关系的多元线性回归方程。,表15-2 27名糖尿病人的血糖及有关变量的测量结果,采用 最小二乘法建立多元线性回归方程,即寻找适宜的系数b0
3、,b1,b2,使得因变量观测值yi与其回归估计值 之间残差平方和最小。,求偏导数(一阶),原 理最小二乘法,统计软件包,最小,三、假设检验及其评价,1. 方差分析法:,(一)对回归方程,方差分析法可将回归方程中所有自变量X1,X2,Xm,作为一个整体来检验他们与应变量Y之间是否具有线性关系,并对回归方程的预测或解释能力做出综合评价。,表15-4 例15-1的方差分析表,表15-3 多元线性回归方差分析表,SPSS软件输出结果Analysis of Variance,2. 决定系数R 2:,3.复相关系数,可用来度量应变量 与多个自变量间的线性相关程度,亦即观察值 与估计值 之间的相关程度。,Y
4、,Y,计算公式:,,本例,若,m,=1,自变量,则有,,,r,为简单相关系数。,(二)对各自变量的假设检验与评价 指明方程中的每一个自变量对Y的影响,1. 偏回归平方和,在其它自变量存在于回归方程中的条件下,考察某一自变量Xj对应变量Y的回归效应,表15-5 对例15-1数据作回归分析的部分中间结果,各自变量的偏回归平方和可以通过拟合包含不同自变量的回归方程计算得到,表15-5给出了例15-1数据分析的部分中间结果。,结果,2. t 检验法 是一种与偏回归平方和检验完全等价的一种方法。计算公式为,结 果,结 论,对于同一资料,不同自变量的t值间可以相互比较,t的绝对值越大,说明该自变量对Y的回
5、归所起的作用越大。,3标准化回归系数 自变量取值的单位及其离散程度是不同的,因此量纲不同的各回归系数之间不能直接比较大小,可对变量进行标准化变换,然后拟合回归方程,这样获得的回归系数称为标准化回归系数。(可说明各自变量相对贡献大小)。 变量标准化是将原始数据减去相应变量的均数,然后再除以该变量的标准差。,计算得到的回归方程称作标准化回归方程,相应的回归系数即为标准化回归系数。,注意: 一般回归系数有单位,用来解释各自变量对应变量的影响,表示在其它自变量保持不变时, 增加或减少一个单位时Y的平均变化量 。不能用各 来比较各 对 的影响大小。 标准化回归系数无单位,用来比较各自变量对应变量的影响大
6、小, 越大, 对 的 影响越大。,结论,第四节自变量筛选,目的:使得预报和(或)解释效果好,多元线性回归方程中所包含的自变量是根据专业知识和经验事先选择好的,但在许多回归分析的、应用中,由于没有清晰的理论依据,回归模型所包含的自变量难以预先确定,如果将一些不重要的自变量也引入方程,会降低模型的精度,因此选择有意义的自变量是回归分析的第一步。 选择自变量的基本思路是:尽可能将回归效果显著的自变量选入回归方程中,将作用不显著的特别是与自变量有密切线性关系的自变量排除在外。,一、全局择优法,目的:根据一些准则建立 “最优”回归模型意义:对自变量各种不同的组合所建立 的回归方程进行比较 , 择优选择方
7、法:,决定系数R2的缺点: 当回归方程中包含有很多自变量,即使其中有一些自变量对解释应变量变异的贡献极小,随着回归方程的自变量的增加,R2 值表现为只增不减。,例15-2 用全局择优法对例15-1数据的自变量进行选择。,全局择优法的局限性,如果自变量个数为4,则所有的回归模型有241 15个;当自变量数个数为10时,所有可能的回归为 2101 1023个;当自变量数个数为50时,所有可能的回归为25011015个。,二、逐步选择法,1.,1.前进法,回归方程中的自变量从无到有、从少到多逐个引入回归方程。此法已基本淘汰。 2.后退法,先将全部自变量选入方程,然后逐步剔除无统计学意义的自变量。 剔
8、除自变量的方法是在方程中选一个偏回归平方和最小的变量,作F检验决定它是否剔除,若无统计学意义则将其剔除,然后对剩余的自变量建立新的回归方程。重复这一过程,直至方程中所有的自变量都不能剔除为止。理论上最好,建议使用采用此法。 3.逐步回归法,逐步回归法是在前述两种方法的基础上,进行双向筛选的一种方法。该方法本质上是前进法。,1.从不包含任何自变量的模型开始(截距)2.添加具有最大统计学意义的变量进入模型,如p值最小,小于预先给定的进入标准的变量。3.重复第二步,直到没有p值小于预先给定的进入标准的变量。,1.从整个模型开始(包含研究所涉及所有自变量及其交互项2.剔除对参数进行t检验或方差分析的结
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 线性 回归 分析 ppt 课件

链接地址:https://www.31ppt.com/p-1891789.html