欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    多元线性回归模型ppt课件.ppt

    • 资源ID:1891793       资源大小:3.19MB        全文页数:281页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    多元线性回归模型ppt课件.ppt

    2022/12/24,1,计量经济学,第四章 多元线性回归模型,2022/12/24,2,在本章将把一元线性回归模型推广到多元线性回归模型,即在模型中将包含二个以上的解释变量。多元线性回归模型是实践中广泛应用的模型。我们从简单的双解释变量多元线性回归模型入手,然后再将其推广到三个及三个以上解释变量的多元线性回归模型。,预测大学足球比赛的获胜得分差额,为检验一场大学足球比赛中“争球码数”、“传球码数”、“回传次数”、“控球时间”以及“主场优势”等变量对比赛最后得分的影响,分析人员建立了一个多元线性回归模型。该模型的因变量是“比赛的获胜得分差额”,它等于胜方的最后得分减去负方的最后得分从高校体育协会前20名球队的比赛中随机抽取了90场,收集到自变量和因变量的数据,并进行多元回归分析,得到的回归结果如右表,2022/12/24,4,主要内容第一节 多元回归模型的定义第二节 最小二乘估计第三节 多元线性回归模型的检验第四节 回归模型的函数形式第五节 多元回归模型的设定偏误第六节 多重共线性,2022/12/24,5,第一节 多元回归模型的定义,一、多元回归模型的意义,在一元线性回归模型中,我们假定影响被解释变量的因素只有一个,即解释变量X,这种情形在经济计量分析中往往是不适宜的。因为在经济系统中,影响被解释变量的重要变量往往不只一个。,2022/12/24,6,例如在收入消费模型中,除了收入影响消费外,还有其它因素明显地影响消费,很明显财富就是影响消费的重要变量。在劳动力市场上,影响工资的变量不仅仅是工作年限,受教育程度也是影响工资的一个重要变量。因此,在回归分析模型中,就需要引进更多的解释变量。,2022/12/24,7,多元回归分析与一元回归分析相比有如下优点,1多元回归分析可以研究多个影响因素对被解释变量的影响。 2在回归模型中增加一些有助于解释Y 的因素, 的变动就能更好地予以解释。因此,多元回归分析有助于更好地预测 Y 。,2022/12/24,8,3多元回归模型更具有一般性。一元回归模型中,只能有一个解释变量,其函数形式不一定恰当。而多元回归模型具有较大的灵活性,有利于对总体回归模型做出正确的判断。,多元回归模型是经济学和其它社会科学进行计量分析时使用最为广泛的一个工具。,2022/12/24,9,含有两个解释变量的多元回归模型是最简单的多元回归模型。模型形式为,二、含有两个解释变量的多元回归模型,(4.1),其中,Yi 是被解释变量,X2i 和X3i 是解释变量,ui是随机干扰项,i 指第i 项观测。,2022/12/24,10,2022/12/24,11,系数 和 为偏回归系数, 表示在保持X3不变的条件下,X2每变化一个单位时,Y的均值的变化。类似地, 表示在保持X2不变的条件下,X3每变化一个单位时,Y的均值的变化。,2022/12/24,12,例如在汽车需求分析中,可设定模型为,(4.2),其中,Yt 汽车需求量,Pt 汽车价格,It 居民收入。t 代表第t 次观测。式(4.2)中,汽车需求量主要受到价格和收入这两个变量的影响。,2022/12/24,13,又如在劳动力市场中,工资水平模型为,(4.3),其中,Wi工资,Ei 受教育水平,EPi 工作经验。式(4.3)表示工资水平主要受受教育水平和工作经验两个变量的影响。,2022/12/24,14,在含有两个解释变量的多元回归模型中,经典线性回归模型的假定条件如下。,假定1:ui 零均值假定,E(ui|X2i, X3i)0对每个i,(4.4),2022/12/24,15,假定3:ui 无序列相关假定,Cov(ui, uj)0ij,(4.6),假定2:ui 同方差假定,(4.5),2022/12/24,16,假定4:ui 与每一个解释变量无关,(4.7),假定5:无设定偏误,2022/12/24,17,2022/12/24,18,三、含有多个解释变量的模型,多个解释变量的多元回归模型是一元回归模型和二元回归模型的推广。含被解释变量Y 和k-1个解释变量X2,X3,Xk 的多元总体回归模型表示如下:,2022/12/24,19,2022/12/24,20,式(4.9)的均值表达式为,i1, 2, , n,(4.10),2022/12/24,21,把式(4.10)表示为增量形式则为,(4.11),X2的系数 的意义为:在所有其它变量X3i,X4i,Xki 保持不变的条件下,X2改变一个单位而导致Yi 的均值的变化量。,2022/12/24,22,即在保持X3,X4,Xk 不变的条件下,有:,(4.12),其它斜率系数的意义与此类似。,2022/12/24,23,例如,在汽车需求分析中,要研究竞争性市场中某一品牌汽车的需求。据需求理论,影响汽车需求的因素除了价格和收入外,还有与之竞争的其它品牌汽车的价格。 因此,该品牌汽车的需求模型为,(4.13),2022/12/24,24,式(4.13)中,Yt 某品牌汽车需求量,Pt 该品牌汽车价格,It 居民收入, 竞争性品牌汽车的价格。 代表当居民收入It 与竞争性品牌汽车价格不变时,该品牌汽车价格降低1元,需求量增加的数量。,2022/12/24,25,四、多元线性回归模型的矩阵表示,K-1个解释变量的多元线性回归模型的 次观测数据,可表示为,2022/12/24,26,用矩阵表示,2022/12/24,27,2022/12/24,28,第二节 最小二乘估计,2022/12/24,29,根据最小二乘准则,应选择使残差平方和最小的 。在给定Y,X1和X2的n个观测值时,同时选择 使下式取最小值。,(4.15),2022/12/24,30,2022/12/24,31,2022/12/24,32,(4.18),2022/12/24,33,2022/12/24,34,用矩阵表示因为样本回归函数为 两边左乘 ,有:因为 ,则正规方程为:,2022/12/24,35,如果使用普通最小二乘法而得到了式(4.16)的样本回归函数,我们就称其为:将Y 对X2, X3, , Xk 进行了回归。,2022/12/24,36,【例4.1】 工资回归模型,利用横截面数据估计参数得到如下包含三个解释变量的模型。,Ln(Y)=0.284+0.092X2+0.0041X3+0.022X4,(4.19),式中,Y工资,X2受教育年限,X3工龄,X4现任职务的任期。,2022/12/24,37,在式(4.19)中,系数0.092表示在保持X3和X4固定不变的情况下,劳动者多受一年教育,Ln(Y)增加0.092,即工资增长9.2%。也就是说,如果有两个劳动者具有同样的工龄和现职任期,在受教育水平相差一年时,X2的系数表示了预计工资的差别。,2022/12/24,38,二、判定系数R2及调整的判定系数,(一)判定系数R2,在一元回归模型中,判定系数R2是回归方程拟合优度的一个度量;它给出了在被解释变量Y的总变差中由(一个)解释变量X解释了的比例或百分比。,2022/12/24,39,将其推广到多元回归模型中,判定系数依然为解释平方和ESS与总平方和TSS的比值,即:,(4.20),2022/12/24,40,判定系数R2的一个重要性质是:在回归模型中增加一个解释变量后,它不会减少,而且通常会增大。即R2是回归模型中解释变量个数的非减函数。,(二)调整的判定系数,2022/12/24,41,2022/12/24,42,为了消除解释变量个数对判定系数R2的影响,需使用调整后的判定系数:,(4.21),式中,k 为包括截距项在内的模型中的参数个数。在二元回归模型中k3,在一元回归模型中 k2。,2022/12/24,43,所谓调整,就是指 的计算式中的 和 都用它们的自由度(nk)和(n1)去除。,2022/12/24,44,2022/12/24,45,在回归分析中,我们的目的并不是为了得到一个高的 ,而是要得到真实总体回归系数的可靠估计并做出有关的统计推断。在实证分析中,经常碰到有着较高的 ,但某些回归系数在统计上不显著的回归模型,这样的模型是没有应用价值的。,(三)回归分析中 的应用,2022/12/24,46,所以,我们应更加关心解释变量对被解释变量的理论关系和统计显著性。如果在其它条件相同的条件下,得到一个较高 ,当然很好;如果 偏低,也不能说明模型不好。在经典线性回归模型中,并不要求 一定是较高的。,2022/12/24,47,【例4.2】 大学平均成绩的决定因素,根据某大学141名学生的样本,以大学平均成绩Y 为被解释变量,高中平均成绩X1和大学能力测验分数X2为解释变量,用普通最小二乘法得到样本回归模型为,式(4.23)中,R20.176,n141。,(4.23),2022/12/24,48,截距项1.29没有实际意义。因为,没有人在高中时的成绩为0、测验成绩也为0时进入大学。R20.176意味着,高中平均成绩X1和大学能力测验分数X2一起解释这个学生样本中大学平均成绩Y 的方差的17.6%。这个比例虽然不高,但不能判定模型不好。因为影响一个学生大学表现的因素还有很多,包括家庭背景、个性、高中教育的质量和对大学专业的喜恶等。,2022/12/24,49,三、最小二乘估计量的期望值和方差,(一)偏回归系数 的期望值,在多元回归模型满足经典假定的条件下,普通最小二乘估计量是总体参数的无偏估计。即:,j1, 2, , k,(4.24),2022/12/24,50,对这一结果有直接影响的假定为E(ui)0,随机扰动项的期望值为0和Cov(Xi, ui)0,X 非随机并与扰动项u 不相关。,2022/12/24,51,在多元回归分析中,如果回归模型的函数形式设定有误或遗漏了与包含在模型中的变量相关的重要解释变量,都会导致经典假定E(ui)0不成立,即E(ui)0。如此,则使得最小二乘估计量 不是总体参数的无偏估计,即 。,2022/12/24,52,虽然在多元回归分析中,模型的函数形式更多,包含的变量数也较多,相对于一元回归分析,出现函数形式设定偏误和遗漏重要解释变量的可能性较小。但是,在一项应用研究中,由于理论的含糊性或数据的局限性,总有一些重要解释变量不能包含到回归模型中。如此,则会破坏普通最小二乘估计的无偏性。,2022/12/24,53,无偏性不是针对某一特定样本而言的,而是指将普通最小二乘法用于各种可能的随机样本时,这种方法得到的结果是无偏的。,关于Cov(Xi, ui)0假定不能满足,从而破坏无偏性,我们将在后面章节讨论它。,2022/12/24,54,2022/12/24,55,因为一个估计值是从一个特定的样本得到的一个固定数,它也许等于总体参数,也许不等于总体参数,我们无法判定。虽然我们总是希望得到最接近总体真实性的估计值,但最小二乘法并不能保证这一点。,2022/12/24,56,(二) 的方差和标准误,的期望值度量了 的集中趋势。而 的方差则度量了 围绕其期望值的集中程度,也就是度量了 的估计精度。,2022/12/24,57,2022/12/24,58,具有非常重要的指导意义。方差越大,则意味着估计量越不精确。,的方差取决于如下三个因素: 。脚标 j 表示第j 个解释变量。,2022/12/24,59,2022/12/24,60,回归模型的干扰项u是对回归结果的干扰,干扰 越大,使得估计任何一个解释变量对Y 的局部影响就越困难。由于 是总体的一个特征,所以它与样本容量无关。,2022/12/24,61, 与Xj 的总样本变异SSTj 成反比;总样本变异SSTj 越大, 的方差越小。,2022/12/24,62,2022/12/24,63, 与解释变量之间的线性关联程度 正 相 关; 越大, 的方差 越大。,2022/12/24,64,在一元回归模型中,只有一个解释变量,不存在这一问题。这里的 与Y 无关,它只涉及到原模型中的解释变量X2, X3, , Xk,其中Xj 作为被解释变量,其它解释变量作为解释变量。,2022/12/24,65,在二元回归模型: 中, 的方差为,(4.26),是X2对X3(含截距)进行一元回归所得到的R2。,2022/12/24,66,由于R2度量了拟合优度,所以当 接近于1时,则表明在这个样本中,X3解释了X2的大部分变动,就是说X2与X3高度相关。随着 的逐渐增加, 会越来 越大。因此,X2与X3之间的线性关系越密切,斜率系数的普通最小二乘估计量的方差就越大。,2022/12/24,67,对于一般情况,Rj2 是Xj 总变异中由模型中包括的其它解释变量解释的部分。也就是Xj 与其它解释变量之间的线性关联程度,关联程度越高,方差就越大;关联程度越小,方差就越小。,2022/12/24,68,最理想的情形是 0,但这种情形是难以碰到的。在所有其它条件都不变的 情况下,就估计 来说,Xj 与其它解释变量之间关联程度越低越好。,2022/12/24,69,其中,X3与X4高度相关,则 和 都很大。,另外,在多元回归模型中,某些解释变量之间的高度相关不影响模型中其它参数的估计方差。例如,有一个三个解释变量的模型:,(4.27),2022/12/24,70,但X3与X4之间的相关程度对 没有直接影响。如果X2与X3、X4无关,则无论X3与X4如何相关,都有 和 。如果我们所关心的是参数 ,我们可以不管X3与X4之间的相关程度。,2022/12/24,71,将 开方,则得 的标准误:,(4.28),2022/12/24,72,2022/12/24,73,2022/12/24,74,正的平方根被称为回归标准误。该估计值在 EViews 计量分析软件的输出结果中直接给出,表示为: .E. of regression,该估计值的引用格式为:方程名称.se。,2022/12/24,75,四、最小二乘估计量的性质,在多元回归模型中,最小二乘估计量同样具有一元回归中的优良性质。高斯马尔可夫定理对此给予了精辟的阐述。,2022/12/24,76,2022/12/24,77,我们已经知道 是 的无偏估计量,即 , 这表明了估计量 的集中趋势。,2022/12/24,78,线性一词的含义是指 是被解释变量的线性函数。,(4.31),式(4.31)中,每个Wji 都是所有自变量样本值的一个函数。可以证明,式(4.31)是成立的。,2022/12/24,79,2022/12/24,80,高斯马尔可夫定理的意义在于,当经典假定成立时,我们不需要再去寻找其它无偏估计量,没有一个会优于普通最小二乘估计量。也就是说,如果存在一个好的线性无偏估计量,这个估计量的方差最多与普通最小二乘估计量的方差一样小,不会小于普通最小二乘估计量的方差。,2022/12/24,81,高斯马尔可夫定理证明了在多元线性回归分析中,使用普通最小二乘法进行参数估计的合理性。但是,这一定理是依赖于经典假定条件的,如果经典假定中的条件不成立,这个定理也就不再成立,普通最小二乘估计量也就不再是最佳线性无偏估计量了。,2022/12/24,82,2022/12/24,83,2022/12/24,84,2022/12/24,85,在经济计量分析中,我们最关心的是解释变量Xj 是否与被解释变量Y 线性相关。因此,我们的主要目的在于检验原假设,(4.34),2022/12/24,86,式(4.34)中,j 对应k1个解释变量中的任意一个。 是第 j 个变量的偏回归系数,度量了在所有其它解释变量不变的条件下,Xj 对Y的影响;即Xj 变化一个单位,对Y的期望值的影响。,2022/12/24,87,如式(4.34)成立,即 ,则意味着Xj 对Y的期望值没有任何影响。例如,工资模型中:,(4.35),其中,Wi工资,Ei受教育水平,EPi工作经验。,2022/12/24,88,2022/12/24,89,在经济计量分析中,备择假设通常设定为,(4.36),式(4.36)表示 Xj 对 Y 有显著影响, 可正可负。,2022/12/24,90,2022/12/24,91,在式(4.37)中, ,所以 与 的符号相同。在 给定的条件下, 与 成正比。,2022/12/24,92,2022/12/24,93,由于在估计 中存在抽样误差,所以 的大小就必须由其抽样误差来衡量,即由 的标准误 来衡量。因此, 度量了被估计的 与0相差多大。 的值充分远离0将导致拒绝原假设 ,拒绝的标准决定于所选择的显著性水平 。,2022/12/24,94,我们所进行的假设检验是关于总体参数的,我们不是在检验一个来自特定样本的估计值。因此,将一个原假设表达成“H0 : 0 ”,或者在样本中的参数估计值是0.205时说“H0 : 0.2050”,都是毫无意义的,我们要检验的是未知总体参数 是否为0。,2022/12/24,95,多元回归中的t 检验决策规则与一元回归相同。,2022/12/24,96,【例4.3】 工资回归模型,例4.1中估计的工资回归方程如下,Ln(Y)0.2840 + 0.0920X2 + 0.0041X3 + 0.0220X4,Se = (0.1040) (0.0070) (0.0017) (0.0030),R20.3160n526,(4.38),2022/12/24,97,式(4.38)中,Y工资,X2受教育年限, X3 工龄,X4现任职务的任期。,2022/12/24,98,查t 分布表可知,5%显著性水平下的临界值t0.025(522)1.960。模型中参数的t统计量均大于临界值t0.025(522)1.960,每一个估计的偏回归系数在统计上都是显著的,即显著地异于0。也就是说,我们拒绝每个原假设。,2022/12/24,99,这就意味着模型中的三个解释变量:受教育年限、工龄和现任职务的任期对被解释变量工资都有显著的影响。,2022/12/24,100,我们除了要判断每一个偏回归系数的显著性外,还需要对多元回归模型的总体显著性进行判断。,二、回归模型的整体显著性检验F检验,2022/12/24,101,多元回归模型的总体显著性就是对原假设,(4.39),进行检验。检验的目的就是判断被解释变量Y 是否与X2, X3, , Xk 在整体上有线性关系。,2022/12/24,102,例如,对于二元回归模型,(4.40),若原假设 成立,则表明Y 与X2, X3没有线性关系,X2, X3对Y 都没有显著的线性影响。这个回归模型应为,(4.41),2022/12/24,103,2022/12/24,104,在一元回归模型中,只有一个解释变量,对个别回归系数 的t 检验就是对回归模型的整体显著性检验。而在多元回归模型中,可以证明,对偏回归系数的逐一显著性检验并不能代替对回归模型的整体显著性检验。,2022/12/24,105,可以证明,对于多元线性回归模型,(4.42),在ui 服从正态分布和原假设,成立条件下,统计量,2022/12/24,106,(4.43),服从自由度为(k1)和(nk)的分布,即,(4.44),2022/12/24,107,从F 的表达式可以看出,如果原假设 是真实的,则表明Y 与X2,X3,Xk 整体上无线性关系,Y 的变异全部来源于干扰项ui ,F 统计量的值较小。,2022/12/24,108,如果原假设 是虚假的,则表明Y 与X2,X3,Xk整体上有线性关系,X2,X3,Xk对Y 有显著影响,则解释平方和ESS要远远大于残差平方和RSS,从而得到一个较大的F 统计量。,2022/12/24,109,2022/12/24,110,2022/12/24,111,2022/12/24,112,2022/12/24,113,可以证明F 统计量与判定系数R2 的关系如下:,(4.46),式(3.46)表明,F 统计量与R2是同向变化的。当R20时,F0;R2越大,F 值也越大。R21时,F 无穷大。F 检验既是对回归模型整体显著性的检验,也是对判定系数R2的一个显著性检验。,2022/12/24,114,2022/12/24,115,【例4.5】 人口寿命回归模型,表4.1给出了1992年亚洲各国人均寿命Y,按购买力平价计算的人均GDP X2,成人识字率X3(%)和一岁儿童疫苗接种率X4(%)。在一个经济系统中,人口寿命与生活水平、基本教育普及率和儿童疫苗接种状况有密切关系。,2022/12/24,116,表4.1 亚洲各国(地区)人的发展指标(1992年),2022/12/24,117,续表,2022/12/24,118,要研究人口寿命问题,可将模型设定为,(4.47),式(4.47)中,Y人均寿命(年),X2人均GDP(100美元),X3成人识字率(%),X4一岁儿童疫苗接种率(%)。,2022/12/24,119,据表4.1的样本数据,使用普通最小二乘法估计参数,得到样本回归模型:,Se(3.0915) (0.0146) (0.0404) (0.0485),t(10.6903) (4.8707) (4.3079) (3.5954),P (0.0000) (0.0001) (0.0004) (0.0021),R20.9086 0.8933 DW1.7114,F59.6339 n22,(4.48),2022/12/24,120,EViews 输出结果为,2022/12/24,121,1判定系数 R20.9086,说明解释变量人均 GDP、成人识字率、一岁儿童疫苗接种率解释了人口寿命总变异的90.86%。,人口寿命回归模型评价,2022/12/24,122,2022/12/24,123,2022/12/24,124,可以看出,回归方程中4个t 统计量均大于t0.025(18)=2.101,所以各偏回归系数均显著,说明模型中的解释变量均对被解释变量人口寿命有显著影响。在其它因素保持不变的条件下,人均GDP每增加100美元,人口平均寿命增加0.0709 年;成人识字率每增加1个百分点,人口平均寿命增加0.1741年;一岁儿童疫苗接种率增加1个百分点,人口平均寿命增加0.1744年。,2022/12/24,125,实际上,从式(4.48)给出的实际显著性P 值可以看出,各偏回归系数实际显著性水平均小于0.01,也就是说,即使是在1%的显著性水平下,各偏回归系数依然是显著的。,2022/12/24,126,3总体显著检验F检验,式(4.48)中已给出F59.6339,已知k4,n22,自由度为k-13和n-k18,取显著水平 =0.01,查F分布表可知F0.01(3, 18)5.09,F F0.01(3, 18),因此拒绝原假设 , 接受备择假设 不全为0,j2, 3, , k。,2022/12/24,127,说明人口人均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率整体上有线性关系,人均GDP、成人识字率、一岁儿童疫苗接种率对人口人均寿命有显著影响。,2022/12/24,128,第四节 回归模型的函数形式,在前面所用的回归分析中,除工资模型外,被解释变量与解释变量的关系均为线性关系,即被解释变量对解释变量的一阶导数均为常数。但是在经济系统中,这种线性关系并不能满足要求,我们要用到许多变量间非线性关系的回归模型。,2022/12/24,129,在此,我们主要讨论如下四种形式的回归模型。,一、对数线性模型二、半对数模型三、倒数模型四、多项式模型,2022/12/24,130,一、对数线性模型,在进行某商品的市场需求分析时,我们知道价格是影响需求量的重要因素,我们设定如下模型,(4.49),式(4.49)中,Yi 需求量,Xi 价格。,2022/12/24,131,对式(4.49)取对数可得,(4.50),式(4.50)中n表示以e (e2.718)为底的自然对数。,2022/12/24,132,2022/12/24,133,令,则式(4.51)可表达为,(4.52),2022/12/24,134,在式 (4.51)中,取LnY 对LnX 的导数可得,(4.53),2022/12/24,135,2022/12/24,136,2022/12/24,137,在回归分析中使用对数线性模型的优点和规则。,1对数线性模型的优点,(1)对数线性模型中斜率系数度量了一个变量(Y)对另一个变量(X)的弹性。 (2)斜率系数与变量X,Y的测量单位无关。,2022/12/24,138,(3)当Y 0时,使用对数形式LnY比使用水平值Y作为被解释变量的模型更接近经典线性模型。大于零的变量,其条件分布常常是有异方差性或偏态性;取对数后,虽然不能消除这两方面的问题,但可大大弱化这两方面的问题。,2022/12/24,139,(4)取对数后会缩小变量的取值范围,使得估计值对被解释变量或解释变量的异常值不会很敏感。,2022/12/24,140,对于何时取对数并不存在一个固定模式,但有一些经验法则。 (1)对于大于0的数量变量,通常均可取对数。例如,需求量、价格、工资等。,2对数线性模型的经验法则,2022/12/24,141,(2)以年度量的变量,如受教育年数、工龄、年龄等则通常以其原有形式出现。 (3)以比例或百分比度量的变量,如失业率、通货膨胀率、犯罪率等变量,既可使用原形式也可使用对数形式。但两种使用方法中参数的意义不同。 (4)使用对数时,变量值不能取0或负数。,2022/12/24,142,【例4.6】 美国咖啡需求函数 (19701980年),我们要用需求的价格弹性来解释价格对需求量的影响,因此,我们采用对数线性模型,(4.54),2022/12/24,143,表4.2 美国咖啡需求量(Y)和实际价格(X),2022/12/24,144,2022/12/24,145,EViews输出结果为,2022/12/24,146,从样本回归模型可以看出,咖啡需求的价格弹性为 -0.25 。就是说,在19701980年的样本期内,咖啡每磅实际价格每增加1%,咖啡需求量(每日饮用咖啡的杯数)平均减少0.25%。因为咖啡价格弹性的绝对值小于1,所以说咖啡的需求是价格非弹性的。,2022/12/24,147,【例4.7】中国柯布道格拉斯生产函数,柯布道格拉斯(Cobb-Douglas)生产函数是描述经济系统投入与产出关系的著名模型,简称C-D生产函数。,C-D生产函数的经济计量模型为,(4.56),其中:Y产出, L劳动投入, K资本投入,u随机干扰项,e 自然对数底。,2022/12/24,148,式(4.56)为非线性模型,取对数后可得,(4.57),式(4.57)是一个对参数而言的线性模型。LnY 对变量L, K 为非线性,但对它们的对数LnL,LnK 为线性,这是一个对数对数线性模型。,2022/12/24,149,在C-D生产函数中,1参数 是产出对劳动投入的弹性,表示在资本投入保持不变的条件下,劳动投入变化1%时的产出变化百分比。 2参数 是产出对资本投入的弹性,表示在劳动投入保持不变的条件下资本投入变化1%时的产出变化百分比。,2022/12/24,150,3总和( +)显示经济系统规模报酬状态。 如 +1为规模报酬不变,2倍的投入带来2倍的产出,3倍的投入带来3倍的产出。如 +1,则为规模报酬递增,即2倍的投入将带来多于2倍的产出。,2022/12/24,151,表4.3 19852003年中国实际GDP、就业人数和投资额,2022/12/24,152,假定式(4.57)为经典线性回归模型,使用普通最小二乘法得到中国C-D生产函数。,2022/12/24,153,2022/12/24,154,EViews 输出结果为,2022/12/24,155,从式(4.58)的中国C-D生产函数中可以看出,劳动和资本弹性分别为1.1396和0.6122。在样本期内(1985 2003年),保持资本投入不变 ,劳动投入增加1%,产出平均增加1.14%;保持劳动投入不变,资本投入增加1%,产出平均增加0.61%。,2022/12/24,156, + 1.1396 + 0.61221.7518 1,说明中国在19852003年期间的经济系统处于规模报酬递增阶段。 中国C-D生产函数的判定系数R20.9931,说明产出的对数变异的99.31%可以由劳动投入和资本投入的对数来解释。,2022/12/24,157,二、半对数模型,(一)对数到线性模型 在经济系统中, 人们用GDP、失业、进出口、投 资、人口等指标的增长率来描述经济系统的发展状态。对数线性模型为我们提供了方便,该类对数线性模型为,(4.59),2022/12/24,158,时间变量t的使用,主要是研究被解释变量在时间上的变动规律。例如, 我们常常要研究GDP、 就业、失 业、股票价格等经济现象在一定时期内的变化规律。,式(4.59)中,Yt 要研究的经济现象,t时间变量。,2022/12/24,159,在式(4.59)中,被解释变量为对数形式,解释变量为线性形式,称为对数到线性的半对数模型。式(4.59)的通用形式为,(4.60),2022/12/24,160,式(4.60)中,斜率系数的含义为:解释变量X绝对量改变一个单位时,被解释变量Y 的相对改变量。即,(4.61),2022/12/24,161,对于式(4.59),如果Yt国内生产总值,取 ,则,(4.62),很显然, 代表经济增长率。,2022/12/24,162,【例4.8】利用表4.3中实际GDP数据,取时间变量 t1, 2, , 19,得到中国19852003年的经济增长模型为,Ln(GDP)9.009 + 0.0899t(4.63) Se(0.0179) (0.0016) t(502.1731) (57.1157) P (0.0000) (0.0000) R20.9948 F3262.204 n =19,2022/12/24,163,式(4.63)的中国经济增长模型说明中国在19852003年期间,实际GDP每年增长8.99%。,2022/12/24,164,EViews 输出结果为,2022/12/24,165,(二)线性到对数模型,类似于对数到线性的半对数模型,如果我们想测度解释变量的相对改变量对被解释变量的绝对改变量的影响,我们就需要使用解释变量是对数形式,被解释变量是线性形式的回归模型。,(4.64),2022/12/24,166,我们称式(4.64)为线性到对数模型。模型中斜率系数的含义为解释变量X 相对量改变1个单位时,被解释变量Y的绝对变化量。,(4.65),(4.66),2022/12/24,167,当 1% 0.01时, ,即当解释变量X变化1%时,被解释变量Y变化的绝对量为0.01 。,2022/12/24,168,【例4.9】 中国能源消费对GDP的影响(19892003年),为了研究能源增长的相对变化对经济总量GDP增长的影响,可使用线性到对数模型(为了说明线性到对数回归模型的应用,此处使用了也许不恰当的一元回归模型)。,2022/12/24,169,表4.4 中国能源消费与GDP,2022/12/24,170,(4.67),式(4.67)中,Y国内生产总值(亿元),X能源消费总量(万吨标准煤)。 利用表4.4中数据,使用普通最小二乘法,可得回归模型如下:,2022/12/24,171,Se(86405.97) (7760.78) t (-7.7970) (8.0966) P (0.0000) (0.0000)R2 0.8345 F65.5551 n15,(4.68),2022/12/24,172,EViews 输出结果为,2022/12/24,173,回归模型(4.68)中,斜率系数 是高度显著的, 59597.34 ,说明在19892003年期间,能源消费量每增加1%,国内生产总值平均增长595.9734亿元。,2022/12/24,174,三、倒数模型,当解释变量以倒数形式出现时的模型称为倒数模型或双曲线模型。,(4.69),2022/12/24,175,2022/12/24,176,1,图可用来描述平均总成本曲线,单位固定成本随着产量X的增加而下降。,2022/12/24,177,2022/12/24,178,图可用来描述宏观经济学中著名的菲利普斯曲线(Phillips curve)。在工资变化率Y 随失业率X 的变化中,存在两个明显不同的阶段。在失业率X低于自然失业率X0时,由失业率的单位变化引起的工资变化,要快于当失业率高于自然失业率X0时,由失业率的同样的变化引起的工资变化。 表示工资变化率的渐近底线。,2022/12/24,179,2022/12/24,180,图可用来描述恩格尔支出曲线。如令Y 为对某一商品的支出,X 为收入,则某些商品具有如下特性:(1)收入上存在一个临界水平。当收入低于此水平时,消费者就不会购买该商品;这个临界水平就是图中的 。,2022/12/24,181,(2)消费上有一饱和水平。当消费达到这一水平时,无论消费者收入有多高,都不会多购买一点。这个饱和水平就是图中的渐近线 。,2022/12/24,182,四、多项式模型,多项式模型在研究成本和生产函数的经济计量分析中有较大的应用价值。边际成本曲线和平均总成本曲线均为U形曲线,我们可以用二次曲线去描述它。,(4.70),式(4.70)称为二次函数或二次多项式。,2022/12/24,183,对于更加复杂的总产量曲线和总成本曲线,可使用三次多项式去描述。,(4.71),式(4.71)称为三次函数或三次多项式。,2022/12/24,184,【例4.10】 总成本函数,表4.5 给出了某产品的产量和总成本数据。,表4.5 产量与总成本,2022/12/24,185,使用表4.5中的数据绘制散点图。如图4.2所示,图4.2 总成本曲线,2022/12/24,186,由图4.2可以看出,总成本与总产出之间的关系为一条拉长的S曲线,因此需要用三次多项式来描述它。,2022/12/24,187,(4.72),式(4.72)中,Y总成本,X产量。,利用表4.5中的数据,使用普通最小二乘法,得到如下的回归模型:,2022/12/24,188,Se(6.3753) (4.7786) (0.9857) (0.0591)t(22.2368) (13.2837) (-13.1501) (15.8968)P(0.0000) (0.0000) (0.0000) (0.0000)R20.9983 F1202.22 n 10,模型中各偏回归系数均显著,拟合优度很高,是个较优良的总成本函数。,(4.73),2022/12/24,189,EViews输出结果为,2022/12/24,190,第五节 多元回归模型的设定偏误,一、正确的多元回归模型,在前面的讨论中,我们假定所设定回归模型是正确设定的,正确设定的回归模型应具有如下特点:,2022/12/24,191,1模型中只包含关键变量,就是说所选定的模型是最简便的。 模型是对现实经济系统的抽象。一个模型应尽量简单,我们应在设定模型时只引进抓住现实本质的关键变量,把影响微弱的变量放到干扰项u中去。 2模型参数可识别。对于给定的一组数据,估计的参数具有唯一值。,2022/12/24,192,3较高的拟合优度。 要用解释变量X 解释被解释变量Y,X 对Y 的解释能力就应该较高,就要求有尽可能高的 。 4估计的回归系数与经济理论一致。 如果回归模型中估计的参数的符号是错误的,那么回归模型也是不成立的。,2022/12/24,193,一个正确的回归模型的判定并没有一个统一的标准,在经济计量分析实践中,我们会使用各种检验方法去判断回归模型的性质,后面还会重点阐述这些内容。,2022/12/24,194,多元回归模型的设定偏误主要包括以下三种:,1回归模型中包含了无关解释变量,2回归模型中遗漏了重要解释变量,3回归模型中的函数形式设定偏误,2022/12/24,195,多元回归模型中包含了无关解释变量,即对模型进行了过度设定。就是说,我们把一个在总体回归模型中对Y 没有影响的解释变量放到了样本

    注意事项

    本文(多元线性回归模型ppt课件.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开