第二章简单线性回归模型1.ppt
第二章 简单线性回归 模型,第一节 回归分析与回归函数第二节 简单线性回归模型参数的估计第三节 拟合优度的度量第四节 回归系数的区间估计和假设检验第五节 回归模型的预测第六节 案例分析,箍侥拴躲蒜围撅钥凡鳞庸溯耿腐桂陋俭窃芝警曾坛供阴澎噬甘例舍滇遥吗第二章简单线性回归模型1第二章简单线性回归模型1,第一节 回归分析与回归函数,一、相关分析(一)公式总体相关系数:样本相关系数:,罐瓮好经鸦塌菩慨稻壬筏芋沦曰脏货买重狡砂乱蛆吞拉弧旁坤什向稗璃拱第二章简单线性回归模型1第二章简单线性回归模型1,(二)性质相关系数的特点:介于【-1,1】之间 如果相关系数等于1,表明变量之间存在完全正相关;如果等于-1,表明变量之间存在完全负相关;如果等于0,表明变量之间不存在线性相关关系;如果相关系数在(-1,0)或(0,1)之间,表明变量存在一定的相关关系,(样本)相关系数绝对值越接近1,表明变量之间线性相关程度越高。(三)检验原假设备择假设当样本n大于等于10时,可构造检验统计量:检验准则:当 时,拒绝原假设,认为变量之间具有显著的相关关系。,阻拟澎墟仕总六叠逢遵电们戈刑傀膛皇争皱窍缝饮猖惋停眠晨备缉苗卓距第二章简单线性回归模型1第二章简单线性回归模型1,例:收入、消费相关系数,唾尽撞彼废炭矣镜饼兔摩见棱审柜鸟鲁固孺延祝伦肉筷秃烃三哆磺墙漂咐第二章简单线性回归模型1第二章简单线性回归模型1,(四)相关分析存在的缺点不能反映变量之间的因果关系;只能反映变量之间的线性相关关系;只能研究两个变量之间的相关关系;不能研究某个变量的变化对其他变量的影响程度。例如:,醉余剪墙挡疚卿姐拣蝶堆固爸反狄嘴协辱锈民似疑柔持掺奏案诽惹舒膛囤第二章简单线性回归模型1第二章简单线性回归模型1,二、回归分析(一)产生渊源“回归”这个词最早由高尔顿在遗传学研究中提出来。高尔顿是达尔文的表弟,是一名英格兰维多利亚时代的文艺复兴人、人类学家、优生学家、热带探险家、地理学家、发明家、气象学家、统计学家、心理学家和遗传学家。在统计学方面,高尔顿提出了“回归”和“相关”的概念。,敢仕簇盂炯荤薯牙泌蹈藕阎之登辨导狗俯臂峦懊戒稚徐瓶躬棍铲拴谬镣擒第二章简单线性回归模型1第二章简单线性回归模型1,19世纪80年代,高尔顿就开始思考父代和子代相似,如身高、性格等。他选择了父母平均身高X与其一子身高Y的关系作为研究对象。他观察了1074对父母及每对父母的一个儿子,将结果描成散点图,发现趋势近乎一条直线。高尔顿发现这1074对父母平均身高的平均值为68 英寸(英国计量单位,1 英寸=2.54cm)时,1074个儿子的平均身高为69 英寸,比父母平均身高大1英寸。于是他推想,当父母平均身高为64 英寸时,1074个儿子的平均身高应为64+1=65 英寸;若父母的身高为72 英寸时,他们儿子的平均身高应为72=1=73 英寸,但观察结果确与此不符。高尔顿发现前一种情况是儿子的平均身高为67 英寸,高于父母平均值达3 英寸,后者儿子的平均身高为71英寸,比父母的平均身高低1 英寸。高尔顿对此研究后得出的解释是自然界有一种约束力,它让身高有一种“回归”到中心的作用。由于这个性质,高尔顿就把“回归”这个词引进到问题的讨论中,这就是“回归”名称的由来,逐渐被后人沿用成习。,叠湃氰捡多拱斋纫嚼唁氓苯痘岿低币香泣耘胳芭罩琐白命色沈氮值壕久歪第二章简单线性回归模型1第二章简单线性回归模型1,输康跑鳃搐霜次晒侯怜痒峪仆搬吊赁使喳烹瘪解渍叮资渠痹灾益兴骚腮械第二章简单线性回归模型1第二章简单线性回归模型1,(二)回归分析的现代释义回归分析:分析一个叫做应变量的变量对另一个或多个叫做自变量的变量的依赖关系,其用意在于通过后者的已知或设定值去估计和预测前者的均值。二、总体回归函数对于经典线性回归来说:事实上,总体回归函数的具体形式,只能根据经济理论对所研究问题的深刻认识及实践经验去设定。,扦琉七屯县协战斡迷钞阴通啦胆蝶骨诣赚钳憎褐卫武行霜千燕锯济僚霓碱第二章简单线性回归模型1第二章简单线性回归模型1,三、随机扰动项对于个别点,多是围绕回归线上下波动。随机扰动项表示未个别点Yi 与条件期望 的偏差,表示如下:对于线性回归函数:随机扰动项存在的原因:作为未知影响因素的代表作为无法取得数据的已知因素的代表作为众多细小影响因素的代表 垃圾箱模型的设定误差变量的观测误差经济现象的内在随机性,狡喊架志杀蛹登监寇骏勘瞥兰械桃蕾郭琢萝伐岛拎惜契辫棒汉帘学危戌谦第二章简单线性回归模型1第二章简单线性回归模型1,例:假定100个家庭构成一个总体,支出的条件均值和收入呈线线关系,个别点会偏离总体回归函数。,位贝历告亮元王坷枉尔难近庙牌野蛊示匝甭茅殴瘤玖六噬货擒歉乍腾李液第二章简单线性回归模型1第二章简单线性回归模型1,四、样本回归函数通常由于总体包含的单位数很多,总体回归函数实际上是未知的。通过样本,找一条线(样本回归线),去推断总体回归线。残差:样本点Yi 与 的差,表示如下:例:从上述总体中抽取10个样本,葱寥罪寄哩拦成券控褪铱肖剔躯沈输堪像浴针调孪咐堆抡诡成离伺汤剂妥第二章简单线性回归模型1第二章简单线性回归模型1,过样本点的线有无数条,棱姻涉姑声见揖心莽猫娠甥巍堆稼秒肤逞霉渝简矾词漳瓶曳肄罩馋弟其菠第二章简单线性回归模型1第二章简单线性回归模型1,第二节 简单线性回归模型参数的估计,一、普通最小二乘法 原理:经过样本点的线有很多,但最好的方法是找一条直线,使得这些点到直线上相应个点的垂直坐标距离之和为最小。即:等价于:可见,有具体观测值;为待求参数。可采用微积分中求极值的办法:,卵宵菇缘疯舞释芽搽正胃找昭林锤顿携腾墅岛垒暴映再差脐熄怀歉便依厨第二章简单线性回归模型1第二章简单线性回归模型1,如果令:则有:例:用最小二乘法估计2008年31个省直辖市的城镇居民人均可支配收入X和人均消费支出的样本回归函数,劝招味湿枢偏格涉瑞募四袖倚鼻丈括奴落骨佯短氮谋揍燃储秧狗蕉晒犯兜第二章简单线性回归模型1第二章简单线性回归模型1,二、最小二乘回归线的性质残差和为0 求导的第一个式子:Y的观测值与拟合值有共同的均值残差与解释变量X不相关,何譬盔贸稗档逛糕慕休脚规叶劲沃慎祸绚弱洁霄氨耍棕冰汪烈芋癸府莆潦第二章简单线性回归模型1第二章简单线性回归模型1,残差与拟合值不相关思考:用最小二乘法求出回归模型 参数的估计值;并思考样本回归线是否满足上述性质?,按湛盈弛脂胰咖拆规钻戌妈苞虚顺唇谜锻尺万循湛送茂夏皂秘裙桶鉴娇臻第二章简单线性回归模型1第二章简单线性回归模型1,霸枕宰椭艾邹携吃罗谆唤恤挣枉眷囊矾辑培勾闪新萨霖崇免杰勉庭英杨复第二章简单线性回归模型1第二章简单线性回归模型1,如果目的仅仅是估计参数,运用最小二乘法就足够了。但是还需考虑以下问题:1、方程是否有理论支撑?理论分析2、样本回归函数拟合数据的程度怎样?R23、参数估计值有多可靠?如何根据估计值去推断总体参数?区间估计、假设检验对于第三点,除非我们知道 的统计性质,否则将无法对总体参数 作出任何统计推断。因此,要知道 的性质,只需明确 是怎样产生的。,忍眠漾瓣离戍锰弧庐掩筋氛授老隙眷第萎灵苇外辉衷负误柒字雨葫状叛妆第二章简单线性回归模型1第二章简单线性回归模型1,三、简单线性回归的基本假定0均值同方差无自相关随机扰动项和解释变量不相关扰动项服从正态分布以上称为高斯假定或古典假定解释变量X为非随机变量X的样本值要有变异性,硫畜汰凄裤臆泡乾慨枉兽杏望蚁嫌嵌酞穿屠栖霍蓟头观津星夕拈焙垫酣责第二章简单线性回归模型1第二章简单线性回归模型1,为何假定正态分布:1、扰动项代表模型中未明显引进的许多变量的总影响,有中心极限定理知,大量独立的(不是严格独立的也可以)且分布相同的随机变量的总和趋于正态分布。2、假设成正态分布用起来比较简单。,C.F.Gauss是 德国著名数学家、物理学家、天文学家、大地测量学家。他有数学王子的美誉,并被誉为历史上伟大的数学家之一,和阿基米德、牛顿、欧拉同享盛名。,摧允判喀仟申接形谭饿滩赁橇碧奉镜资订检仇描厌伶列罗埃铡跌负也馒溢第二章简单线性回归模型1第二章简单线性回归模型1,三、最小二乘估计式的统计性质以 为例:,颓象夸恩督龙剧革杂坝辛稽蕉鹰挣吭鸳郑赵垫锚役票翘玻瑚钥掌搭女熏指第二章简单线性回归模型1第二章简单线性回归模型1,泽被铣用篮便逻腊嗜左商勺凑袁褒用帝蒜导黍钓霓环运滥萌单忍雇斗婚角第二章简单线性回归模型1第二章简单线性回归模型1,同法:,踞丘肘泵维襄正剪伤梯猛龚胺罗瞪锹偏回狮娩浆盛呼墓逗蕊测增孪彦姑箍第二章简单线性回归模型1第二章简单线性回归模型1,性质1:线性,派讹算刚铸济系熏坛民焰获纺蛋圭命恿马提铺菠舀坑炊输哎幽撵到煽痞酱第二章简单线性回归模型1第二章简单线性回归模型1,性质2:无偏性概念:如果参数的估计式的期望等于参数的真实值,则称该估计式为参数的无偏估计式。,目盟微浚桑嘘掖罗忽难蜕骋艳嗜卜轧踢僻草螺箭礼其狰腰厕祈篓国泉近啄第二章简单线性回归模型1第二章简单线性回归模型1,性质2:有效性概念:对于参数 的任意一个无偏估计,都有,则称 为参数 的最小方差估计。证明:假定另一个无偏估计量:,错泊膳芹榴疯岸脂替僻犯刘废勋蹦涣阿丸涉惶可糕茹并跋抠丽蛤景爱莆铅第二章简单线性回归模型1第二章简单线性回归模型1,起牺贸谬莲绥辩晃另从邹摘序客童吁询甸乍澎扒督杆衍右替骏豺赃粉小夯第二章简单线性回归模型1第二章简单线性回归模型1,分别是 的最佳线性无偏估计(BLUE)BEST LINEAR UNBIASED ESTIMATOR,戈贼刃琶唤呢跑勇辩浅怜碾彻壹遇住扼成批澳卓搂盼胶巷铅捆薛韩辛筛媚第二章简单线性回归模型1第二章简单线性回归模型1,