计量经济学一元线性回归模型.ppt
《计量经济学一元线性回归模型.ppt》由会员分享,可在线阅读,更多相关《计量经济学一元线性回归模型.ppt(163页珍藏版)》请在三一办公上搜索。
1、计量经济学理论方法EViews应用 郭存芝 杜延军 李春吉 编著,第二章 一元线性回归模型,学习目的,理解回归模型的概念,学会对一元线性回归模型进行参数估计、检验和预测,为多元线性回归模型的学习打下基础。,基本要求,1)理解样本回归模型、总体回归模型的概念;2)掌握一元线性回归模型的普通最小二乘参数估计方法,了解一元线性回归模型的基本假设、一元线性回归模型的最大似然参数估计方法、一元线性回归模型的普通最小二乘参数估计量与样本回归线的性质、一元线性回归模型随机误差项方差的估计;3)学会对一元线性回归模型进行拟合优度检验,对一元线性回归模型的参数进行区间估计和假设检验;4)学会进行一元线性回归模型
2、被解释变量的总体均值和个别值预测;,第二章 一元线性回归模型,第二章 一元线性回归模型回归模型概述 一元线性回归模型的参数估计 一元线性回归模型的拟合优度检验 一元线性回归模型的统计推断 一元线性回归模型的预测 案例分析,相关分析与回归分析,第一节 回归模型概述,随机误差项,总体回归模型,样本回归模型,1.经济变量之间的关系,计量经济研究是对经济变量之间关系的研究,针对某一具体经济问题展开研究时,首先需要考察的就是相关经济变量之间有没有关系、有什么样的关系。,确定的函数关系,不确定的相关关系,经济变量之间的关系,一、相关分析与回归分析,函数关系,指某一经济变量可直接表示为其他经济变量的确定的函
3、数,函数表达式中没有未知参数,不存在参数估计的问题。,1)某一商品的销售收入Y与单价P、销售数量Q之间的关系Y=PQ 2)某一农作物的产量Q与单位面积产量q、种植面积S之间的关系Q=q S,例如:,一、相关分析与回归分析,相关关系,指不同经济变量的变化趋势之间存在某种不确定的联系,某一或某几个经济变量的取值确定后,对应的另一经济变量的取值虽不能唯一确定,但按某种规律有一定的取值范围。,居民消费C与可支配收入Y之间的关系,可支配收入的取值确定后,消费的取值虽不能唯一确定,但有一定的取值范围,0 C Y,遵循边际消费倾向递减的规律。居民消费C与可支配收入Y之间的关系可表示为C=+Y,、为待估参数。
4、,例如:,相关关系的表达式一般表示为含有未知参数的函数形式,需要进行参数估计。,一、相关分析与回归分析,相关关系的分类,a)按照涉及的变量的数量,单相关(一元相关),复相关(多元相关),-指两个经济变量之间存在的相关关系,-指多个经济变量之间存在的相关关系,可能是几个经济变量的某种综合效果与一个经济变量有趋势方面的联系。,一、相关分析与回归分析,相关关系的分类,b)按照相关的程度,完全相关,不完全相关,不相关,一、相关分析与回归分析,相关关系的分类,c)按照相关的性质,正相关,负相关,一、相关分析与回归分析,相关关系的分类,c)按照相关的性质,线性相关,非线性相关,一、相关分析与回归分析,函数
5、关系与相关关系的区别,确定的函数关系可以直接用于经济活动,无需分析。,不确定的相关关系,隐含着某种经济规律,是有关研究的重点,一、相关分析与回归分析,2.相关分析,研究变量之间的相关关系的形式和程度的一种统计分析方法,主要通过绘制变量之间关系的散点图和计算变量之间的相关系数进行。,绘制变量之间关系的散点图,例如:,计算变量之间的相关系数,一、相关分析与回归分析,相关系数,十九世纪末英国著名统计学家卡尔皮尔逊(Karl Pearson)度量两个变量之间的线性相关程度的简单相关系数(简称相关系数),一、相关分析与回归分析,(2-2),(2-3),或,相关系数的取值介于11之间,取值为负表示两变量之
6、间存在负相关关系;取值为正表示两变量之间存在正相关关系;取值为1表示两变量之间存在完全负相关关系;取值为0表示两变量不相关;取值为1表示两变量之间存在完全正相关关系。,一、相关分析与回归分析,对变量间统计依赖关系的考察主要是通过相关分析(correlation analysis)或回归分析(regression analysis)来完成的:,例如:函数关系:,统计依赖关系/统计相关关系:,3.回归分析,研究不仅存在相关关系而且存在因果关系的变量之间的依存关系的一种分析理论与方法,是计量经济学的方法论基础,,主要内容,1)设定理论模型,描述变量之间的因果关系;,2)根据样本观察数据利用适当方法对
7、模型参数进行估计,得到回归方程;,3)对回归方程中的变量、方程进行显著性检验,推求参数 的置信区间、模型的预测置信区间;,4)利用回归模型解决实际经济问题。,一、相关分析与回归分析,4.相关分析与回归分析之间的关系,联系:,1)都是对存在相关关系的变量的统计相关关系的研究;2)都能测度线性相关程度的大小;3)都能判断线性相关关系是正相关还是负相关。,4.相关分析与回归分析之间的关系,区别:,1)相关分析仅仅是从统计数据上测度变量之间的相关程度,不考虑两者之间是否存在因果关系,因而变量的地位在相 关分析中是对等的;回归分析是对变量之间的因果关系的分析,变量的地位是 不对等的,有被解释变量和解释变
8、量之分。,2)相关分析主要关注变量之间的相关程度和性质,不关注变 量之间的具体依赖关系。回归分析在关注变量之间的相关程度和性质的同时,更关注变量 之间的具体依赖关系,因而可以深入分析变量间的依存关系,有 可能达到掌握其内在规律的目的,具有更重要的实践意义。,习 题,下表列出若干对自变量与因变量。对每一对变量,你认为它们之间的关系如何?是正的、负的、还是无法确定?并说明理由。,含有随机误差项是计量经济学模型与数理经济模型的一大区别。,例如:,对于供给不足下的生产活动,可以认为产出是由资本、劳动、技术等投入要素决定的,并且,一般情况下,产出随着投入要素的增加而增加,但要素的边际产出递减。,二、随机
9、误差项,例如:,对于供给不足下的生产活动,可以认为产出是由资本、劳动、技术等投入要素决定的,并且,一般情况下,产出随着投入要素的增加而增加,但要素的边际产出递减。,二、随机误差项,存在原因,第一,人类的经济行为本身带有随机性;,第二,通常一个变量总是受众多因素的影响;,第三,任何函数反映经济变量之间的关系都只是一种简化反映;,第四,经济数据来源于调查统计,而非严格的控制实验;,二、随机误差项,结论,一个经济变量通常不能被另一个经济变量完全精确地决定,需要引入随机误差项来反映各种误差的综合影响,主要包括:,1)变量的内在随机性的影响;,2)解释变量中被忽略的因素的影响;,3)模型关系设定误差的影
10、响;,4)变量观察值的观察误差的影响;,5)其他随机因素的影响。,二、随机误差项,有何特性?,众多因素对被解释变量Y的影响代表的综合体对Y的影响方向有正有负由于是次要因素代表,对Y的总平均影响可能是0对Y的影响是非趋势性的,而是随机扰动。,二、随机误差项,习 题,例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为(1)随机扰动项包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。,习题答案,(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上
11、述简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设4不满足。,1总体回归曲线与总体回归函数,给定解释变量条件下被解释变量的期望轨迹称为总体回归曲线(population regression curve),或总体回归线(population regression line)。,描述总体回归曲线的函数称为总体回归函数(pop
12、ulation regression function)。,三、总体回归模型,三、总体回归模型,例2-1,假设一个由100个家庭构成的总体,并假设这100个家庭的月可支配收入水平只限于1300元、1800元、2300元、2800元、3300元、3800元、4300元、4800元、5300元、5800元10种情况,每个家庭的月可支配收入与消费数据如表2-1所示,要研究这一总体的家庭月消费支出Y与家庭月可支配收入X之间的关系,以便根据已知的家庭月可支配收入水平测算该总体的家庭月消费支出平均水平。,表2-1 100个家庭的月可支配收入与消费数据 单位:元,家庭消费支出主要取决于家庭可支配收入,但不是
13、唯一取决于家庭可支配收入,还会受到其他各种不确定性因素的影响,因而可支配收入相同的不同家庭的消费支出各不相同。,由此可求得对应于家庭可支配收入X的各个水平的家庭消费支出Y的条件 均值(conditional mean)或称为条件期望(conditional expectation),如表2-2所示。,析:,表2-2 100个家庭的月可支配收入与消费数据 单位:元,由表2-1、表2-2中的数据绘制不同可支配收入家庭的消费支出散点图、家庭消费支出与可支配收入关系的总体回归曲线,如图2-1所示。,从散点图可以清晰地看出,不同家庭的消费支出虽然存在差异,但总体趋势随可支配收入的增加而增加,总体回归曲线
14、反映了这一趋势。,回归函数(PRF)说明被解释变量Y的平均状态(总体条件期望)随解释变量X变化的规律。,含义:,函数形式:可以是线性或非线性的。,将居民消费支出看成是其可支配收入的线性函数时:,为一线性函数。其中,0,1是未知参数,称为回归系数(regression coefficients)。,三、总体回归模型,事实上,经济活动中的总体包含的个体的数量往往非常多,一般不大可能像例2-1假设的那样得到总体中所有个体的观察数据,因此也就不大可能依据总体的所有观察数据计算得到被解释变量Y的条件期望,无法画出精确的总体回归曲线,相应地,总体回归函数的具体形式也无法精确确定。所以,对于总体回归函数,通
15、常只能根据经济理论或实践经验进行设定,也就是说,通常需要对总体回归函数作出合理的假设。,三、总体回归模型,2总体回归模型,三、总体回归模型,的离差(deviation),,三、总体回归模型,例:个别家庭的消费支出为:,(*)式称为总体回归函数(方程)PRF的随机设定形式。表明被解释变量除了受解释变量的系统性影响外,还受其他因素的随机性影响。,(1)该收入水平下所有家庭的平均消费支出E(Y|Xi),称为系统性(systematic)或确定性(deterministic)部分。(2)其他随机或非确定性(nonsystematic)部分i。,即,给定收入水平Xi,个别家庭的支出可表示为两部分之和:,
16、(*),由于方程中引入了随机项,成为计量经济学模型,因此也称为总体回归模型。,三、总体回归模型,3线性总体回归模型,确定性部分为线性函数的总体回归模型称为线性总体回归模型。,线性总体回归模型是计量经济学中最常见的总体回归模型。,只含有一个解释变量的线性总体回归模型称为一元线性总体回归模型,简称一元线性回归模型或简单线性回归模型(simple linear regression model),其一般形式是,(2-8),三、总体回归模型,3线性总体回归模型,三、总体回归模型,注意:,这里所说的线性函数和通常意义下的线性函数不同,这里的线性函数指参数是线性的,即待估参数都只以一次方出现,解释变量可以
17、是线性的,也可以不是线性的。,例如:,都是线性回归模型。,三、总体回归模型,注意:,例如:,都不是线性回归模型。,三、总体回归模型,对于参数线性、解释变量非线性的回归模型,只要稍作变换,就可化为线性回归模型的一般形式。,例如:,模型,三、总体回归模型,4线性回归模型的普遍性,例如,著名的Cobb-Dauglas生产函数表现为幂函数形式,著名的菲利普斯曲线(Phillips curves)表现为双曲线形式。,三、总体回归模型,对于其他复杂的函数形式,可通过级数展开化为线性形式,三、总体回归模型,+余项,令,,,,,余项,原模型可化为,三、总体回归模型,总体的信息往往无法掌握,现实的情况只能是在一
18、次观测中得到总体的一个样本。,问题1:能从一次抽样中获得总体的近似的信息吗?,回答:能,四、样本回归模型,问题2:如果可以,如何从抽样中获得总体的近似信息?,1样本回归函数与样本回归曲线,根据样本数据对总体回归函数作出的估计称为样本回归函数。,由样本回归函数绘制的曲线称为样本回归曲线(样本回归线)。,四、样本回归模型,例2-2,假设没有取得总体中所有家庭的可支配收入与消费支出数据,而是按可支配收入水平的不同水平调查取得了一组有代表性的样本,如表2-3所示。,表2-3 家庭月可支配收入与消费支出的一个样本 单位:元,以例2-1为例(假设一个由100个家庭构成的总体,并假设这100个家庭的月可支配
19、收入水平只限于1300元、1800元、2300元、2800元、3300元、800元、4300元、4800元、5300元、5800元10种情况,每个家庭的月可支配收入与消费数据如表2-1所示,要研究这一总体的家庭月消费支出Y与家庭月可支配收入X之间的关系,以便根据已知的家庭月可支配收入水平测算该总体的家庭月消费支出平均水平。),若将家庭月可支配收入X与消费支出Y的总体回归函数设定为一元线性回归函数的形式,四、样本回归模型,根据样本数据和样本回归方程可绘制不同可支配收入家庭的消费支出散点图、家庭消费支出与可支配收入关系的样本回归线,如图2-2所示。,从图中可以清晰地看出,样本回归线是通过对样本数据
20、的较好的拟合对总体回归线作出的一种估计。,这里将样本回归线看成总体回归线的近似替代,则,注意:,回归分析的主要目的:根据样本回归函数SRF,估计总体回归函数PRF。,注意:这里PRF可能永远无法知道。,即,根据,估计,2样本回归模型,在样本回归函数中引入残差项后,得到的是随机方程,成为了计量经济学模型,称为样本回归模型。,对于例2-2中的样本回归函数,例如:,四、样本回归模型,3线性样本回归模型,确定性部分是线性函数的样本回归模型称为线性样本回归模型。,四、样本回归模型,3线性样本回归模型,四、样本回归模型,习 题,判断正误并说明理由:1、随机误差项ui和残差项ei是一回事2、总体回归函数给出
21、了对应于每一个自变量的因变量的值3、线性回归模型意味着变量是线性的4、在线性回归模型中,解释变量是原因,被解释变量是结果回答下列问题:随机误差项ui和残差项ei的区别与联系。,习 题,下列方程哪些是正确的?哪些是错误的?为什么?,一元线性回归模型的基本假设,第二节 一元线性回归模型的参数估计,参数的普通最小二乘估计,参数的最大似然估计,普通最小二乘参数估计量的性质,普通最小二乘样本回归函数的性质,随机误差项方差的估计,一元线性回归模型的基本假设,参数的普通最小二乘估计,参数的最大似然估计,普通最小二乘参数估计量的性质,普通最小二乘样本回归函数的性质,随机误差项方差的估计,讲课内容,一、一元线性
22、回归模型的基本假设,一元线性回归模型的基本假设包括对解释变量的假设、对随机误差项的假设、对模型设定的假设几个方面,主要如下:,1)解释变量是确定性变量,不是随机变量。,2)随机误差项具有0均值、同方差,且在不同样本点之间是独立的,不存在序列相关,即,3)随机误差项与解释变量不相关。即,4)随机误差项服从正态分布,即,5)回归模型是正确设定的。,假设:线性回归模型就参数而言是线性的 对变量为线性:对参数为线性:,E(Y|Xi)=+xiE(Y|Xi)=+x2i,E(Y|Xi)=+x2iE(Y|Xi)=xi,变量非线性函数有多种形式,其中一些可以通过适当的方式变换为参数线性函数,一、一元线性回归模型
23、的基本假设,这5条假设中的前4条是线性回归模型的古典假设,也称为高斯假设,满足古典假设的线性回归模型称为古典线性回归模型(classical linear regression model)。,在这5条假设中,若前两条假设满足,第3条自然满足,因为前两条假设成立时有,且由第2条假设有,因为,习 题,例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为(1)随机扰动项包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。,习题答案,(1)收入、年龄、家庭状况、政府的相关政
24、策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设4不满足。,一元线性回归模型的基本假设,参数的普通最小二乘估计,参数的最大似然估计,普通最小二乘参数估计量的性质,普通最小二乘样本回归函数的性质,随机误差项方差的估计,讲课内容,二、参数的普通最小二乘估计,普通最小二乘法(ordinary
25、 least squares,OLS)的基本思想使样本回归函数尽可能好地拟合样本数据,表现在图上就是要使样本散点偏离样本回归线的距离最小,表示被解释变量的估计值与实际观察值的偏差总体上最小,称为最小二乘准则。,对于一元线性回归模型,(2-14),整理得,(2-15),解得,(2-16),方程组(2-14)或(2-15)称为正规方程组。,式(2-16)可改写为,(2-17),若一元线性回归模型中没有常数项,即模型为,可得普通最小二乘参数估计量为,(2-18),例:在上述家庭可支配收入-消费支出例中,对于所抽出的一组样本数,参数估计的计算可通过下面的表进行。,因此,由该样本估计的回归方程为:,例2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 经济学 一元 线性 回归 模型
链接地址:https://www.31ppt.com/p-6202910.html