经典单方程计量经济学模型-多元线性回归.ppt
《经典单方程计量经济学模型-多元线性回归.ppt》由会员分享,可在线阅读,更多相关《经典单方程计量经济学模型-多元线性回归.ppt(112页珍藏版)》请在三一办公上搜索。
1、竭尽全力而不是尽力而为,在美国西雅图一所著名的教堂里,一位德高望重的牧师同教会学校一个班的学生讲故事。猎人带着猎狗去打猎,猎人击中了兔子的后腿,受伤的兔子拼命地逃跑,猎狗在后穷追不舍。可是追了一阵子,猎狗没追上,只好悻悻地回来。猎人气急败坏地说:“你真没用,连一只受伤的兔子都追不到!”猎狗辩解道:“我已经尽力而为了呀!”逃脱的兔子回来跟大家说:“他是尽力而已,我是竭尽全力呀!他没有追上我最多挨一顿骂,而我若不竭尽全力的跑,可就没命了呀!”,牧师讲完故事后,又向全班承诺:谁要能背出圣经.马太福音中第五章到第七章的全部内容,他就邀请谁去“太空针”高塔餐厅参加免费聚餐会。圣经.马太福音中第五章到第七
2、章的全部内容有几万字,而且不押韵,要背诵起全文难度极大。尽管参加免费的聚餐会是许多学生梦寐以求的事情,但几乎所有的人都望而却步了。几天后,班上一个11岁的男孩,胸有成竹从头到尾按要求背了下来,竟然没有出一点差错。牧师比别人更清楚,即使在成年的信徒中,能背诵这篇文章的人也是罕见的。牧师不禁好奇地问:“你为什么能背下这么有长有难的文字呢?”男孩不假思索地回答道:“我竭尽全力。”如今,那个男孩成了首富,他就是比尔.盖茨。,第三章 经典单方程计量经济学模型:多元线性回归模型Multiple Linear Regression Model,引 子:中国汽车的保有量会达到2亿辆吗?,中国经济的快速发展,使
3、居民收入不断增加,数以百万计的中国人开始得以实现拥有汽车的梦想,中国也成为世界上成长最快的汽车市场。截至2015年底,全国机动车保有量达2.79亿辆,其中汽车1.72亿辆。工信部装备工业司副司长王富昌日前指出,预计到2020年中国汽车保有量将超过2亿辆。是什么因素导致中国汽车数量的增长?影响中国汽车行业发展的因素并不是单一的,经济增长、消费趋势、市场行情、业界心态、能源价格、道路发展、内外环境、相关政策等,都会使中国汽车行业面临机遇和挑战。,分析中国汽车行业未来的趋势,应具体分析这样一些问题:中国汽车市场发展的状况如何?(用销售量观测)影响中国汽车销量的主要因素是什么?(如收入、价格、费用、道
4、路状况、能源、政策环境等)各种因素对汽车销量影响的性质怎样?(正、负)各种因素影响汽车销量的具体数量关系是什么?所得到的数量结论是否可靠?中国汽车行业今后的发展前景怎样?应当如何制定汽车的产业政策?很明显,只用一个解释变量已很难分析汽车产业的发展,还需要寻求有更多个解释变量情况的回归分析方法。,怎样分析多种因素的影响?,第三章 多元线性回归模型,本章主要讨论:如何将简单线性回归的研究方法推广到多元的情况 多元线性回归模型及古典假定 多元线性回归参数的估计 多元线性回归方程的拟合优度 多元线性回归的区间估计和假设检验 多元线性回归模型的预测 含有虚拟变量的多元线性回归模型,3.1 多元线性回归模
5、型,一、多元线性回归模型 二、多元线性回归模型的基本假定,一、多元线性回归模型,多元线性回归模型:表现在线性回归模型中的解释变量有多个。一般表现形式:,i=1,2,n,其中:k为解释变量的数目,j称为回归参数(regression coefficient)。习惯上:把常数项看成为一虚变量的系数,该虚变量的样本观测值始终取1。这样:模型中解释变量的数目为(k+1),也被称为总体回归函数的随机表达形式。它的非随机表达式为:,方程表示:各变量X值固定时Y的平均响应。j也被称为偏回归系数,表示在其他解释变量保持不变的情况下,Xj每变化1个单位时,Y的均值E(Y)的变化;或者说j给出了Xj的单位变化对Y
6、均值的“直接”或“净”(不含其他变量)影响。,指对各个回归系数而言是“线性”的,对变量则可是线性的,也可是非线性的例如:生产函数取自然对数,多元线性回归的“线性”,总体回归模型n个随机方程的矩阵表达式为,其中,样本回归函数:用来估计总体回归函数,其随机表示式:,ei称为残差或剩余项(residuals),可看成是总体回归函数中随机扰动项i的近似替代。样本回归函数的矩阵表达:,或,其中:,总结:,二、多元线性回归模型的基本假定,假设1:回归模型是正确设定的。假设2:解释变量在所抽取的样本中具有变异性,且各X之间不存在严格线性相关性(无完全多重共线性)。假设3,随机误差项具有条件零均值性,假设4,
7、随机误差项具有条件同方差及不序列相关性,假设5,随机项满足正态分布,上述假设的矩阵符号表示式:,假设2,n(k+1)矩阵X的秩为k+1,即X列满秩。假设3,,假设4:随机误差项具有条件同方差及不序列相关性。,其中,I为一n阶单位矩阵。,假设5,向量 有一多维正态分布,即,基本假定的推论:,注:CLRM 和 CNLRM,以上假设(正态性假设除外)也称为线性回归模型的经典假设或高斯(Gauss)假设,满足该假设的线性回归模型,也称为经典线性回归模型(Classical Linear Regression Model,CLRM)。同时满足正态性假设的线性回归模型,称为经典正态线性回归模型(Class
8、ical Normal Linear Regression Model,CNLRM)。,3.2 多元线性回归模型的参数估计,一、普通最小二乘估计二、参数估计量的性质三、样本容量问题四、参数估计举例,说 明,估计对象:模型结构参数随机项的分布参数(方差)估计方法:3大类方法:OLS、ML或者MM在经典模型中多应用OLS在非经典模型中多应用ML或者MM,一、普通最小二乘估计,对于随机抽取的n组观测值,如果样本函数的参数估计值已经得到,则有:,i=1,2n,根据最小二乘原理,参数估计值应该是下列方程组的解,其中,于是得到关于待估参数估计值的正规方程组:,正规方程组的矩阵形式,条件?,即:,将上述过程
9、用矩阵表示如下:,即求解方程组:,得到:,于是:,正规方程组 的另一种写法,对于正规方程组,于是,或,(*)或(*)是多元线性回归模型正规方程组的另一种写法。,(*),(*),样本回归函数的离差形式,i=1,2n,其矩阵形式为,其中:,在离差形式下,参数的最小二乘估计结果为,随机误差项的方差的无偏估计,可以证明,随机误差项 的方差的无偏估计量为,二、参数估计量的性质,在满足基本假设的情况下,其结构参数的普通最小二乘估计、最大或然估计及矩估计仍具有:线性性、无偏性、有效性。,同时,随着样本容量增加,参数估计量具有:渐近无偏性、渐近有效性、一致性。利用矩阵表达可以很方便地证明,注意证明过程中利用的
10、基本假设。,1、线性性,其中,C=(XX)-1 X 为一仅与固定的X有关的行向量。,2、无偏性,这里利用了假设:E(X)=0,3、有效性(最小方差性),其中利用了,和,三、样本容量问题,所谓“最小样本容量”,即从最小二乘原理和最大或然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。,最小样本容量,样本最小容量必须不少于模型中解释变量的数目(包括常数项),即 n k+1因为,无多重共线性要求:秩(X)=k+1,2、满足基本要求的样本容量,从统计检验的角度:n30 时,Z检验才能应用;n-k8时,t分布较为稳定,一般经验认为:当n30或者至少n3(k+1)时,才能说满足模型估计
11、的基本要求。,模型的良好性质只有在大样本下才能得到理论上的证明。,地区城镇居民消费模型,被解释变量:地区城镇居民人均消费Y解释变量:地区城镇居民人均工资性收入X1地区城镇居民人均其它X2样本:2013年,31个地区,四、多元线性回归模型的参数估计实例,数据,变量间关系,变量间关系,OLS估计,OLS估计结果,3.3 多元线性回归模型的统计检验,一、拟合优度检验 二、方程的显著性检验(F检验)三、变量的显著性检验(t检验)四、参数的置信区间,一、拟合优度检验,1、可决系数与调整的可决系数,则,总离差平方和的分解,由于,=0,所以有:,注意:一个有趣的现象,可决系数,该统计量越接近于1,模型的拟合
12、优度越高。,问题:在应用过程中发现,如果在模型中增加一个解释变量,R2往往增大。这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。,调整可决系数的原因,对于有k个解释变量的多元回归方程,可决系数的另一计算式如下:,其中,分母总离差平方和TSS是不变的,当每增加一个解释变量时,只要新增解释变量前系数不为0,则残差平方和会变小;分子中每一项的符号均为正(每一项中相乘的两项同号),所以R2会随解释变量增加而增加,因此,应该调整。,调整可决系数的原因,调整的可决系数(adjusted coefficient
13、of determination),在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:,其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。,*2、赤池信息准则和施瓦茨准则,为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的标准还有:赤池信息准则(Akaike information criterion,AIC),施瓦茨准则(Schwarz criterion,SC),这两准则均要求仅当所增加的解释变量能够减少AIC值或AC值时才在原模型中增加该解释变量。,地区城镇居
14、民消费模型(k=2),地区城镇居民消费模型(k=1),二、方程总体线性的显著性检验(F检验),方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。,1、方程显著性的F检验,即检验模型中的参数j是否显著不为0。,可提出如下原假设与备择假设:,H0:1=2=k=0 H1:j不全为零(j=1,2,k),F检验的思想来自于总离差平方和的分解式:TSS=ESS+RSS,如果这个比值较大,则X的联合体对Y的解释程度高,可认为总体存在线性关系,反之总体上可能不存在线性关系。因此,可通过该比值的大小对总体线性关系进行推断。,根据数理统计学中的知识,在原假设H0成立的条
15、件下,统计量,服从自由度为(k,n-k-1)的F分布,给定显著性水平,可得到临界值F(k,n-k-1),由样本求出统计量F的数值,通过 F F(k,n-k-1)或 FF(k,n-k-1)来拒绝或接受原假设H0,以判定原方程总体上的线性关系是否显著成立。,地区城镇居民消费模型,伴随概率:拒绝0假设,犯错误的概率为0,2、关于拟合优度检验与方程显著性检验关系的讨论,F与R2同向变化:当R2=0时,F=0;R2越大,F值也越大;当R2=1时,F为无穷大。,对于一般的实际问题,在5%的显著性水平下,F统计量的临界值所对应的R2的水平是较低的(例中,F0.05(2,28)=3.34,对应的调整R2为0.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 经典 方程 计量 经济学 模型 多元 线性 回归
链接地址:https://www.31ppt.com/p-6014893.html