《多元回归》PPT课件.ppt
1,第4章 多元回归:估计与假设检验,1)多元回归模型的概念2)如何估计多元回归模型,估计过程与一元模型有什么不同3)多元回归模型的假设检验与一元模型有什么不同4)多元回归模型与一元模型相比有哪些独特之处5)如果决定多元模型的解释变量个数,中国汽车的保有量会达到1.4亿辆吗?,中国经济的快速发展,使居民收入不断增加,数以百万计的中国人开始得以实现拥有汽车的梦想,中国也成为世界上成长最快的汽车市场。中国交通部副部长在中国交通可持续发展论坛上做出预测:“2020年,中国的民用汽车保有量将比2003年的数字增长倍,达到1.4亿辆左右”。是什么因素导致中国汽车数量的增长?,影响中国汽车行业发展的因素并不是单一的,经济增长、消费趋势、市场行情、业界心态、能源价格、道路发展、内外环境,都会使中国汽车行业面临机遇和挑战。,分析中国汽车行业未来的趋势,应具体分析这样一些问题:中国汽车市场发展的状况如何?(用销售量观测)影响中国汽车销量的主要因素是什么?(如收入、价格、费用、道路状况、能源、政策环境等)各种因素对汽车销量影响的性质怎样?(正、负)各种因素影响汽车销量的具体数量关系是什么?所得到的数量结论是否可靠?中国汽车行业今后的发展前景怎样?应当如何制定汽车的产业政策?,很明显,只用一个解释变量已很难分析汽车产业的发展,还需要寻求有更多个解释变量情况的回归分析方法。,多元线性回归模型:表现在线性回归模型中的解释变量有多个。一般表现形式:,i=1,2,n,其中:k为解释变量的数目,j称为回归参数(regression coefficient)。0是截距,表示解释变量为零时Y的平均值,4.1 多元线性回归模型,6,2、偏回归系数B2、B3称为偏回归系数B2表示当其他条件不变时,X2变动一个单位Y的均值的改变量;B3表示当其他条件不变时,X3变动一个单位Y的均值的改变量。,7,多元线性回归模型:,Y:因变量X2,Xk:自变量,4.2 多元线性回归模型的若干假定,8,多元回归模型的假定,4.1 回归模型是参数线性的,并且正确设定。4.2 X是非随机变量,或与扰动项不相关。4.3 误差项的期望值为0。4.4 同方差假定。4.5 无自相关假定。4.6 解释变量之间不存在完全共线性。4.7 误差项服从正态分布。,9,4.3 多元回归参数的估计,最小二乘准则:真实值与拟合值的离差平方和最小。,10,回归系数的OLS估计量,11,OLS估计量的代数性质,(1)OLS残差和为零。,(2)X和OLS残差的协方差为零。,12,OLS估计量的方差与标准误,13,多元回归OLS估计量的性质,在古典线性回归模型的基本假定下,OLS估计量是最优线性无偏估计量。,14,4.6 多元回归的假设检验,假设误差项u服从正态分布,则OLS估计量服从正态分布,15,实例:美国未偿付抵押贷款债务,1、提出问题:为了研究未偿付抵押贷款余额与个人收入和抵押贷款费用的关系。Y:美国非农业未偿还抵押贷款(单位:亿美元)X2:个人收入(单位:亿美元)X3:抵押贷款费用(%)预期X2的系数为正,X3的系数为负。,16,2、数据表,3、回归结果,18,偏回归系数的意义,(1)Y对X2回归得到回归残差序列 RY-X2,表示Y中未被X2解释的部分;,19,(2)X3 对X2回归得到回归残差序列 RX3-X2,RX3-X2表示X3中未被X2解释的部分,即X3中独立于X2的部分;,20,(3)RY-X2对RX3-X2 回归RX3-X2的系数就是二元回归方程中X3的系数。RY-X2对RX3-X2 回归的实质:Y中不能被X2解释的部分作为因变量,以X3中不能被X2解释的部分作为自变量的回归即X3对Y的独立贡献。偏回归系数。,21,b2(X2 的系数):表示在其他条件不变时,收入每增加1美元,抵押贷款债务平均地增加83美分;b3(X3的斜率系数):表示在其他条件不变时,抵押贷款费用每上升一个百分点,抵押贷款债务将平均下降56亿美元。b1:截距项。,22,工资方程,educ:受教育的年数exper:工作经历tenure:现任职务的任期当一个人在同一企业多待一年,对工资的影响?,23,拟合优度R2和调整的R2,R2 拟合优度(判定系数、决定系数),总离差平方和=残差平方和+回归平方和 TSS=ESS+RSS,24,拟合优度 R2,解释变量引起的变动占总变动的百分比取值在01之间,越接近1拟合程度越高在回归方程中加入更多的自变量会不断提高R2,25,调整的R2,用残差平方和与总平方和各自的自由度进行调整。以免增加解释变量数,提高拟合优度。,26,引入调整拟合优度的作用,添加解释变量,拟合优度增加调整的拟合优度当变量个数增加到一定程度时,开始下降,27,多元回归的总体显著性检验,检验联合假设:B2=B3=0F检验把模型作为一个整体进行假设检验,检验模型中被解释变量与解释变量之间的线性关系是否显著的成立。,28,F检验统计量的构造,总离差平方和=残差平方和+回归平方和,29,1-,F,F,f(F),F检验的拒绝域,30,F与R2的关系,F检验:可用于检验R2的显著性R2是否显著不为0。,什么时候增加新的解释变量,通常而言,在增加解释变量后,调整的R2值增加,就可以增加新的解释变量。当增加变量系数t值的绝对值大于1时,调整的R2值就会增加。,31,