第四章+多元线性回归课件.ppt
1,第四章 多元线性回归模型,一元线性回归模型的推广,2,1、研究中国的GDP增长 a.影响GDP增长的因素有哪些(投资、消费、出口、货币供应量等)?b.GDP与各种因素关系的性质是什么?(增、减)c.各影响因素与GDP的具体的数量关系?d.所作数量分析结果的可靠性如何?e.今后的发展趋势怎么样?,3,2、中国股票价格的波动,股票价格变动的情况怎样(股价指数)?影响股票价格变动的因素是什么(资金、政策、利率等)?股价与各种因素的关系是什么(利空、利多)?各种因素影响的具体数量规律是什么?所得结果可不可靠?今后的发展趋势怎样?,4,3、中国家庭汽车的市场,汽车市场状况如何(销售量)?影响汽车销量的主要因素是什么(收入、价格、道路状况等)?各种因素对汽车销量影响的性质怎样(正、负、无)?各种因素影响汽车销量的具体数量程度?以上分析所得结论是否可靠今后发展趋势怎样?,5,很明显,只用一个解释变量已很难分析,还需要寻求有更多个解释变量情况的回归分析方法。,6,多元线性回归分析:研究因变量(被解释变量)与两个或两个以上自变量(解释变量)之间的回归问题,称为多元回归分析。,线性回归自变量个数大于等于2,多元线性回归,7,第四章 多元线性回归模型,第一节 多元线性回归模型及其估计第二节 拟合优度第三节 显著性检验第四节 实例,8,多元线性模型 i=1,2,n 在这个模型中,Y由X2,X3,XK所解释,有K个未知参数1、2、K.其中,“斜率”j的含义是其它变量不变的情况下,Xj改变一个单位对因变量所产生的影响,也称为偏回归系数。,第一节 多元线性回归模型及其估计,9,二元线性回归模型(总体)样本回归模型,10,与简单线性回归分析一样,多元线性回归分析要解决的主要问题仍是:根据观测样本估计模型中的各个参数;对估计的参数及回归方程进行统计检验;利用回归模型进行预测和经济分析。,11,为什么要做基本假定模型中有随机扰动,估计的参数是随机变量,只有对随机扰动的分布作出假定,才能确定所估计参数的分布性质 只有具备一定的假定条件,所作出的估计才具有较好的统计性质,也才可能进行假设检验和区间估计,12,一、多元线性回归中的基本假定,假定1:零均值假定 假定2和假定3:同方差和无自相关假定 假定4:随机扰动项与解释变量不相关 假定5:无多重共线性假定(多元中)假定各解释变量之间不存在线性关系,或各个解释变量观测值之间线性无关。假定6:正态性假定,13,二、普通最小二乘法(OLS),最小二乘原则 剩余平方和最小:求偏导,令其为0:,14,例如二元线性回归模型,要使残差平方和最小,则应有:,15,由最小二乘法得到正规方程:,16,由正规方程解得三个OLS统计量,17,三、最小二乘估计量的性质,同样是最优线性无偏估计量 1、无偏性 2、线性性 3、最小方差性,18,1、无偏性,无偏性保证参数估计值在参数真实值左右波动,并且估计值平均水平就是参数的真实值,19,3、最小方差性,20,随机扰动项方差 的估计,多元回归中 的无偏估计为:,21,练习题3.3建立家庭书刊消费的计量经济模型:,22,23,24,(49.460)(0.029)(5.202)t=(-1.011)(2.944)(10.067)R2=0.951 df=15,25,26,思 考,简单线性回归模型与多元线性回归模型的基本假定是否相同?,27,已知含有截距项的三元线性回归模型估计的残差平方和,样本容量为n=24,则随机误差项的方差估计量为()。A.33.33 B.40 C.38.09 D.36.36,28,对于双变量线性模型,我们有,第二节 拟合优度,一、决定系数R2,29,对于多元线性模型,我们可用同样的方法定义决定系数:,对于多元线性模型,30,残差平方和的一个特点是,每当模型增加一个解释变量,残差平方和的值会减小。即:解释变量个数增加 减小 R2 增大也就是说,人们总是可以通过增加模型中解释变量的方法来增大 R2 的值。为此,我们定义修正可决系数,31,二、调整的可决系数(adjusted coefficient of determination),在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:,其中:n-k为残差平方和的自由度,n-1为总体平方和的自由度。K为参数个数。,32,自 由 度,自由度(degree of freedom,df)当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数称为该统计量的自由度。通俗点说,一个班上有50个人,我们知道他们语文成绩平均分为80,现在只需要知道49个人的成绩就能推断出剩下那个人的成绩。你可以随便报出49个人的成绩,但是最后一个人的你不能瞎说,因为平均分已经固定下来了,自由度少一个了,33,自由度为n-3。,自由度为n-1。,对于二元线性回归模型来说,34,变差来源 平方和 自由度归于回归模型归于剩余总变差,方差分析表,35,可决系数 必定非负,但修正的可决系数 可能为负值,这时规定 k1时,,与可决系数 的关系:,36,例题3.1,37,课本例题P86,38,求修正的可决系数,39,例.设 n=20,k=4,R2=0.70 求 解:,下面改变n的值,看一看 的值如何变化。我们有 若n=10,则=0.6438 若n=5,则=-0.20,40,思 考,多大才算通过拟合优度检验?,41,一、偏回归系数的显著性检验,检验假设步骤:1.原假设:2.给出检验统计量;3.根据数据计算统计量值和根据表查理论值4.比较理论值与实际值,做出结论,第三节 显著性检验,一、变量的显著性检验(t检验),42,课本例题P86,43,对各个回归参数作假设检验,提出假设H0:2=0 H1:2不等于0构造t统计量T=4.976t0.025(11-3)=2.306拒绝原假设,说明2不等于0同理3不等于0,44,在多元回归中有多个解释变量,需要说明所有解释变量联合起来对应变量影响的总显著性,或整个方程总的联合显著性。对方程总显著性检验需要在方差分析的基础上进行F检验,45,二、方程的显著性检验(F检验),1、检验过程,即检验模型Yi=1+2X2+3X3+kXk+i 中的参数j是否显著不为0。,(1)提出如下原假设与备择假设:,H0:1=2=k=0 H1:j不全为0,46,F检验构造统计量的思想,如果这个比值较大,则X的联合体对Y的解释程度高,可认为总体存在线性关系,反之总体上可能不存在线性关系。因此,可通过该比值的大小对总体线性关系进行推断。,47,(2)统计量如下,服从自由度为(k-1,n-k)的F分布,(3)给定显著性水平,可得到 临界值F(k-1,n-k)(4)比较若F F(k-1,n-k)或 FF(k-1,n-k)来拒绝或接受原假设H0。,48,F(k-1,n-k),F检验示意图,49,课本例题P86,提出假设H0:1=2=3=0 H1:1、2、3不全为0构造F统计量,50,课本练习题3.5 P100,51,52,注意:在一元回归中F检验与t检验等价,且 但在多元回归中F检验与t检验作用不同。,53,练 习,1、多元线性回归分析中的 RSS反映A应变量观测值总变差的大小 B应变量回归估计值总变差的大小 C.应变量观测值与估计值之间的总变差 DY关于X的边际变化,54,2、已知某一元线性回归方程的判定系数为0.81,则解释变量与被解释变量间的线性相关系数绝对值为()A.0.81 B.0.90 C.0.66 D.0.32 3、对模型Yi=1+2X2i+3X3i+i进行总体显著性F检验,检验的零假设是 A.2=3=0 B.2=0 C.3=0 D.1=0或2=0,55,4、在多元线性回归中,判定系数R2随着解释变量数目的增加而()A减少 B增加 C不变 D变化不定 5、对两个包含的解释变量个数不同的回归模型进行拟合优度比较时,应比较它们的:()A.判定系数 B.调整后判定系数 C.标准误差 D.估计标准误差,56,6、用一组20个观测值的样本估计模型Yi=1+2X2i+3X3i+i后,在0.1的显著性水平上对2的显著性作t检验,则2显著地不等于0的条件是统计量t大于等于:()A.t0.1(20)B.t0.05(18)C.t0.05(17)D.F0.1(2,17),57,7、调整后的判定系数与判定系数之间的关系叙述不正确的有(),A.均非负B.判断多元回归模型拟合优度时,使用调整后的可决系数C、模型中包含的解释变量个数越多,两者相差越大 D、只要模型中包括截距项在内的参数的个数大于1,则前者小于后者,58,8、用一组有30个观测值的样本估计模型Yi=1+2X2i+3X3i+i,并在0.05的显著性水平下对总体显著性作F检验,则检验拒绝零假设的条件是统计量F大于()A.F0.05(3,30)B.F0.025(3,30)C.F0.05(2,27)D.F0.025(2,27),59,2、关于拟合优度检验与方程显著性检验关系的讨论,由,可推出:,与,或,F和R2同方向变化:当R2=0时,F=0 R2越大时,F值也就越大 R2=1时,F为无穷大,60,因此,F检验时所估计回归的总显著性的一个度量,也是R2的一个显著性检验。也就是检验H0:1=2=3=k=0 等价于 R2=0,回答了前面的问题:R2多大才能通过拟合优度检验,61,设k为回归模型中的参数个数,n为样本容量。则对多元线性回归方程进行显著性检验时,所用的F统计量可表示为(),B,AB.CD,62,根据可决系数R2与F统计量的关系可知,当R2=1时有()。A.F=1 B.F=1 C.F+D.F=0,63,已知:解释变量对被解释变量的判定系数为:R2=0.729,n=10,要求:在显著水平,的情况下对总体回归模型,进行显著性检验。,第二步:构造统计量,第一 步:提出假设,64,第三步:在给定的显著水平,下,查,分布表得,第四步:比较判断:因为,,所以拒绝,说明解释变量X2,X3,对被解释变量,的共同影响显著。,=0.729*7/(0.271*2)=9.42,设某商品的需求量Y(百件),消费者平均收入X2,(百元),该商品价格X3(元)。经Eviews软件对观察的10个月份的数据用最小二乘法估计,结果如下:(被解释变量为Y),VARIABLE COEFFICIENT STD.ERROR T-STAT C 99.469 13.473 7.383 X1 2.502 0.754()X2-6.581 1.376()R-squared 0.949 Mean of dependent var 80.000Adjusted R-squared()S.D.of dependent var 19.579S.E of regression 4.997 Sum of squared resid 174.792Durbin-Watson stat F statistics(),完成以下问题:(至少保留三位小数)1写出需求量对消费者平均收入、商品价格的线性回归估计方程。2解释偏回归系数的经济含义。3对该模型做经济意义检验。4估计调整的可决系数。5在95%的置信度下对方程整体显著性进行检验。6在95%的置信度下检验偏回归系数(斜率)的显著性。,67,第四节 案例分析,案例:中国税收增长的分析提出问题改革开放以来,随着经济体制改革的深化和经济的快速增长,中国的财政收支状况发生很大变化,为了研究影响中国税收收入增长的主要原因,分析中央和地方税收收入的增长规律,预测中国税收未来的增长趋势,需要建立计量经济模型。,