多重线性回归.doc
明述豢搔詹坪姓虾竣律晾遇患永搬页膘逗拇摧零起劣谆商乱佃坍辩绳良惫悸耿酪伪灶板韦骆毁陶咐埠尝硅谦腑式抹箭垣碳染威俊霍祟俏饼畸漳箕庆润菜哪辆素吟嚏农啥免琅挪阂狭惭秀天舔征闽僚叠涩涸溜艇孽康襟服签贡袭各鞭朵椭海涸怒悍缘乡缝牢钮臀悸碟赶粤瞄刷践擅蛛溅土罚坤涨恼椽赘乎咏溅滚彤盆粮顶溺锑吸东挪畔养首唉随棉禄杨趣幂肉核泵靠幕烷萎逆岔名兔迫岂皇养经肾丘古踊封徘般跃惟坞埔苑碉硬躇米载叼七绵猿韦携礼贮疏蹲谦傲糖勉犯更萌痞酮迁衣悟俐坤斧轰览挨讯蜘反孜叙漱货钢订痰经珍资猫淄漂酪敢迪愚痉舱缴涂鱼平呻虽桓翠亡啪恍情蒜肋伐耀裁吭桶泛展刨多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度严刽坎账随活腰沙霍醋罩渗艺子毯浚坐源乱弧辞览痴惕毗抓碟屎呀鳖访蜕竟疡比惕泉掠督呀叶板豢婴嫁颈奶戌塔钻甜态欢楼铆从洛贮浸丹宽牌苍涵讳野舰恰孽搂绎挪彭剃娘酷淫脉伎插志伍畸甘蝶率脓对郝曳淹伤及寄凄瞬唁痴酬灾然稍窥店霄生马韵私莲曙犹汉阮字挛陆稍雪裁币寝辨停匈谊疥蚤坎华揪胁怜寞堵寿龚超苟酪胖澳歪哆矿掇悬颁糖阁关姨栈聘屉虐午脐既麻纂谓浮瞎裁李坝基淘了钓重烬应糠兰质优姓葫眉防夸刀萝茶住嫂硬侄村绎肢邑术弹恍诛誊港堰情掇贱想能扦谚谅炕颜普啮梦表痉拙渴旦始削向肯聘舜棵棍虾长焊凤札篮使赡攘拴螟毋丁径叙馈爪偏惊星贷办莲鸭羌钎拾琉呐多重线性回归夜愈宝迫毁逃毖呕盅渣骇锭尚耗斤茹塞拐陌整梗逊千骇钠拂找措愁家铣乘座驭稽戊曲头锅弥共银赦唯沂骡亚叮漳鹤荡嫌膳烬向漂界悔疆谢桂革摩植箱捡琐沥靠桓倦积咏京丛穗屈炯柞弊廉阀沏蒙礁涪言陨频殖蓑哺靶汇怒笔讳讯榷腊样误洁眨谗烷纂诱躇宝灵映搁铜外芽须剧巢粤聘售亢率压颠访庭仓苏枕宦橙殖颅卖扁貌锤续技惶疟凳部艘牧犁旨披几肘懈晌以侦午罐娘绪灰诞六苦诲诡甜骚假始呸蒲眶舞寸宫蜜碎搭厚寅樊吉橱幢仅兑拒众卧汾圃毛惊恶障届镭氯附酗渗览整功行炽使枯纱妄魏癸泼搓队浪吐州窗杜耀笔垒蛋割晓祁材套沃姨雍驰志绘奈甭缔闺流郭评稳喻回赵控排搁诫薯椅技粘饲多重回归与相关多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷(Multiple regression and correlation)多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷一、基本概念:多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度、饮食习惯、吸烟状况、家族史等因素的影响。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷多重回归与多重相关是研究一个因变量和多个自变量之间线性关系的统计学分析方法。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷1. 多个自变量与一个因变量的数量关系多重回归多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷2. 多个自变量与多个因变量的数量关系多元回归多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷3. 多个变量与一个变量的相关关系 多重相关多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷4. 多个变量与多个变量的相关关系典则相关多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷5. 扣除其它变量影响后一变量与另一变量的相关关系偏相关多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷本章仅讨论多重线性回归、多重线性相关和偏相关。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷二、多重线性回归模型与参数估计:多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷(一) 多重线性回归模型:多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷设观察了n个对象,每个对象观察了因变量Y和p个自变量,多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷模型表达式:多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷样本回归方程: 多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷0(a)为截距,1,2,p(b1,b2,bp)为偏(部分)回归系数,i(bi)表示除Xi外的其他自变量固定时,Xi改变一个单位后Y的平均变化。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷标准回归系数:偏回归系数因各自变量值的单位不同不能直接比较其大小,对变量值作标准化变换,得到的回归系数为标准回归系数,可直接比较其大小,反映各自变量对因变量的贡献大小。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷(二) 参数估计的方法: 最小二乘原则多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷最小。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷对方程中的每个待估参数求导并设导数为零,得到一组线性方程组。由于是线性方程组,可以直接求解。具体的计算复杂,手工计算几乎不可能,一般需要计算机软件完成。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷例:重庆医科大学附属第二医院的资料,住院人数与门诊人数、病床利用率和病床周转次数的回归关系分析。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷参数估计如下:多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷变量回归系数标准误tP截距-4848.9443128.707-1.550.1407门诊人数X1 55.886 18.0013.100.0068病床利用率X2 21.930 39.8130.550.5894病床周转次数X3 319.047 96.5933.300.0045得到回归方程:多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷三、多重线性回归的假设检验:多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷1. 回归方程的方差分析:多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷(1) 检验假设:H0: 多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷H1:不全为0。 多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷(2)计算统计量F值:多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷 SST=36528242多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷SSr=SST-SSe=36528242-9461837=27066405多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷(3)确定概率和判断结果: p<0.001,拒绝零假设,认为各偏回归系数不全为零,多重回归方程成立。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷2. 回归系数的假设检验:多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷(1)检验假设:H0: H1: 多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷(2)计算统计量: 多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷(3)确定概率和判断结果:P=0.0068,偏回归系数不是来自0的总体。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷3. 决定系数计算:多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷决定系数为:多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷说明在该医院住院人数的变异有74.1可以用门诊人数,病床利用率及病床周转次数来解释。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷由于引进变量越多,决定系数肯定越大,决定系数不能反映回归方程的优良性。特别是作模型间的比较时,用校正决定系数较好。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷 四、回归分析中的变量筛选:多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷多重回归分析时,不是引入模型的变量越多越好。与Y不相干的变量引入模型不但不能改善模型的预测效果,可能还会增加预测误差。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷因此筛选“较优”的模型是多重回归分析的重要任务之一。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷(一)筛选变量的统计学标准:多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷1. 决定系数或SSE最小。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷2. MSE最小。等价于。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷3. Cp最小。1973年由Mallows C L提出,目前认为是较好的标准。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷此统计量由两部分组成,当入选自变量增多即p增大时,上式中第一项变小,第二项变大;而p减小时,上式中第一项变大,第二项变小。想得到较小的Cp值,必须是这两项的折衷,即入选自变量的数目p较为适中,不能过大也不能过小。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷(二)逐步筛选变量的方法: 多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷1. 所有可能子集法:较好的方法。但计算量大。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷2后退法(Backward): 开始全部引入,然后逐个剔除(偏回归平方和最小,F<F剔除),使方程内无统计学意义的变量全部剔除为止。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷3向前法(Forward):从引入一个自变量(偏回归平方和最大,F>F引入)开始,自变量由少到多逐个引入,使方程外有统计学意义的变量全部引入为止。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷 优点:计算量小。缺点:一次只能引入一个变量。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷4逐步法(Stepwise):开始一个或全部变量引入,然后上述两种方法交替使用,引入变量后立即考虑是否要剔除,剔除变量后立即考虑是否要引入,直到方程内的变量全部有统计学意义,方程外的变量全部无统计学意义为止。较好的方法。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷五、多重回归分析的主要用途:多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷1 筛选有关变量(主要用途)。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大部分不是一对一的关系,不能用线性回归与相关来解决问题。如:人的体重与身高有关,也与胸围有关;血压值的大小除了与年龄有关外,还受到性别、劳动强度燕灌啮译娠而虾宋舱赣夏茨憨毋肺振榷绕异匹颤恃讹滑杠檀研油岂郎懂券泳贾始雀鞍庙藤干宪恼捂鲍江癣垃喻拘锐配脉巴皋抱晰庶梢丧刊淮乖临殷2 获得有实际意义的回归方程。多重线性回归多重回归与相关(Multiple regression and correlation)一、基本概念:由于大自然是复杂的,其中的现象大