多元线性回归分析.ppt
《多元线性回归分析.ppt》由会员分享,可在线阅读,更多相关《多元线性回归分析.ppt(28页珍藏版)》请在三一办公上搜索。
1、李国奇安贞医院,多元线性回归,(multiple linear regression),主要内容,第一节:多元线性回归概念及统计描述第二节:多元线性回归假设检验第三节、多元线性回归自变量的筛选第四节:多元线性回归应用第五节:多元线性回归应注意问题第六节:实例分析(SAS),第一节:多元线性回归概念及统计描述,概念:用于分析一个连续型因变量与多个自变量之间的线性关系的统计学分析方法。例:血压值与年龄、性别、劳动强度、饮食习惯、吸烟状况、家族史 糖尿病人的血糖与胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂,多元线性回归数据结构,假定对n例观察对象逐一测定了因变量Y与m个自变量X1,X2,Xm的数值
2、。例号 X1 X2 Xm Y 1 X11 X12 X1m Y1 2 X21 X22 X2m Y2 3 n Xn1 Xn2 Xnm Yn,多元线性回归模型,多元线性回归数学模型:相应的由样本估计而得到的回归模型:其中表示Y的总体平均值的估计值,b0为常数项,也称为截距,bi为Xi的偏回归系数,表示当方程中其他自变量不变时,自变量Xi变化一个计量单位,反应变量Y的总体平均值的估计值变化的单位数.,标准化偏回归系数,因为各自变量都有各自的计量单位以及不同的变异度,所以不能直接用普通偏回归系数的大小来比较方程中各个自变量对反应变量Y的影响大小。需要求出标准化偏回归系数。设:与一般回归系数bi对应的标准
3、化偏回归系数为Bi,则 SXi、SY分别为Xi和Y的标准差。,偏回归系数的估计-最小二乘法,基本思想:利用收集到的因变量和自变量建立线性函数,使得每一个实际测量的Yi与估计的Yi之间的离差的平方和尽可能的小。只有一个自变量时,回归结果为二维平面的一条直线,而有两个自变量时,结果为三维空间的一个平面,有更多的自变量时,回归的结果则是在三维以上空间的“超平面”,无法直观图形表达,只能想象。,多元线性回归分析前体条件LINE,(1)linear:Y与X1,X2,,Xm之间具有线性关系。(2)independent:各个体观测值间相互独立。(3)normal distribution:在一定范围内,对
4、任意一组自变量X1,X2,,Xm值,Y都服从正态分布。(4)equal variance:在一定范围内,不同组自变量对应的Y具有相同方差。,残差分析,通过残差分析可以深入了解实际资料是否符合回归模型假设(如正态、方差齐),多元线性回归决定系数,决定系数:回归平方和(SS回)在总平方和(SS总)中比例。R2=SS回/SS总0R21,R2接近1,表示样本数据很好的拟合了所用的线性回归模型。R2反映了线性回归模型能多大程度上解释Y的变异。,第二节:多元线性回归假设检验,在多元线性回归模型中,由于变量众多,需要对模型的合理性以及参数的显著性进行检验。一、回归方程的假设检验(F检验)H0:1=2=p=0
5、 H1:1,2p不全为0如果H0成立,认为回归方程不显著,如果拒绝H0,认为回归方程显著。,二、回归系数的假设检验(t检验)在F检验中,如果拒绝H0假设,只能说1,2p不全为0,还需要进一步检查每个自变量的总体偏回归系数。H0:i=0,H1:i0(i=1,2p)如果H0成立,认为偏回归系数i不显著,如果拒绝H0,认为偏回归系数i显著。,第三节、自变量的筛选,多元回归分析时收集的某些自变量对因变量无影影响或影响甚微;也不敢保证自变量之间是相互独立的,因而在建立多元线性回归方程时,需要使回归方程尽可能包含对解释因变量有较大贡献的自变量,而把贡献不大的或无贡献以及与其他自变量有密切关系的自变量排除。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 线性 回归 分析
链接地址:https://www.31ppt.com/p-5255433.html