计量经济学庞皓第二章简单线性回归模型.ppt
《计量经济学庞皓第二章简单线性回归模型.ppt》由会员分享,可在线阅读,更多相关《计量经济学庞皓第二章简单线性回归模型.ppt(77页珍藏版)》请在三一办公上搜索。
1、1,第二章 简单线性回归模型,计量经济学,引子:中国旅游业总收入将超过3000亿美元吗?,未来我国旅游需求将快速增长,根据中国政府所制定的远景目标,到2020年,中国入境旅游人数将达到2.1亿人次;国际旅游外汇收入580亿美元,国内旅游收入2500亿美元。到2020年,中国旅游业总收入将超过3000亿美元,相当于国内生产总值的8%至11%。(来源:2008年中国旅行社发展研究咨询报告)(参考现状:第一产业占GDP的15%,建筑业占GDP 的7%)什么决定性因素能使中国旅游业总收入超过3000亿美元?旅游业的发展与这种决定性因素的数量关系究竟是什么?怎样具体测定旅游业发展与这种决定性因素的数量关
2、系?,2,需要研究经济变量之间数量关系的方法,为了不使问题复杂化,我们先在某些标准的(古典的)假定条件下,用最简单的模型,对最简单的变量间数量关系加以讨论,显然,对旅游起决定性影响作用的是“中国居民的收入水平”以及“入境旅游人数”等因素。“旅游业总收入”(Y)与“居民平均收入”(X1)或者“入境旅游人数”(X2)有怎样的数量关系呢?能否用某种线性或非线性关系式 Y=f(X)去表现这种数量关系呢?具体该怎样去表现和计量呢?,4,第一节 回归分析与回归函数 一、相关分析与回归分析1、相关分析 变量性质:都是随机变量且关系对等。分析方法:图表法和相关系数。分析目的:判定变量之间相关的方向和关系的密切
3、程度。,5,相关关系度量:X和Y的总体线性相关系数:其中:-X 的方差-Y的方差-X和Y的协方差,6,如果只知道 X 和 Y 的样本观测值,则X和Y的样本线性相关系数为:其中:和 分别是变量X和Y的样本观测值,和 分别是变量 X 和Y 样本值的平均值注意:是随抽样而变动的随机变量。,相关系数较为简单,也可以在一定程度上测定变量间的数量关系,但是对于具体研究变量间的数量规律性还有局限性。,X和Y 都是相互对称的随机变量,线性相关系数只反映变量间的线性相关程度,不能说明非线性相关关系 样本相关系数是总体相关系数的样本估计值,由于抽样波动,样本相关系数是随抽样而变动的随机变量,其统计显著性还有待检验
4、,7,对相关系数的正确理解和使用,8,2、回归分析,回归的古典意义:高尔顿遗传学的回归概念(父母身高与子女身高的关系)子女的身高有向人的平均身高回归的趋势回归的现代意义:一个被解释变量对若干个解释变量依存关系的研究回归的目的(实质):由解释变量去估计被解释变量的平均值,9,被解释变量Y的条件分布和条件概率:当解释变量X取某固定值时(条件),Y 的值不确定,Y的不同取值会形成一定的分布,这是 Y 的条件分布。X取某固定值时,Y 取不同值的概率称为条件概率。被解释变量 Y 的条件期望:对于 X 的每一个取值,对 Y 所形成的分布确 定其期望或均值,称 为 Y 的条件期望或条件均 值,用 表示。注意
5、:Y的条件期望是随X的变动而变动的,Y,X,明确几个概念(为深刻理解“回归”),10,回归线:对于每一个X的取值,都有Y的条件期望 与之对应,代表Y的条件期望的点的轨迹形成的直线或曲线称为回归线。回归函数:被解释变量Y的条件期望 随解释变量X的变化而有规律的变化,如果把Y的条件期望表现为 X 的某种函数,这个函数称为回归函数。回归函数分为:总体回归函数和样本回归函数,X,Y,11,举例:假如已知由100个家庭构成的总体的数据(单位:元),二、总体回归函数(PRF),12,消费支出的条件期望与收入关系的图形,对于本例的总体,家庭消费支出的条件期望与家庭收入 基本是线性关系,可以把家庭消费支出的条
6、件均值表示为家庭收入的线性函数:,13,1.总体回归函数的概念 前提:假如已知所研究的经济现象的总体的被解释变量Y和解释变量X的每个观测值(通常这是不可能的!),那么,可以计算出总体被解释变量Y的条件期望,并将其表现为解释变量X的某种函数 这个函数称为总体回归函数(PRF)本质:总体回归函数实际上表现的是特定总体中被解释变量随解释变量的变动而变动的某种规律性。计量经济学的根本目的是要探寻变量间数量关系的规律,也就要努力去寻求总体回归函数。,14,条件期望表现形式例如Y的条件期望 是解 释变量X的线性函数,可表示为:个别值表现形式(随机设定形式)对于一定的,Y的各个别值 并不一定等于条件期望,而
7、是分布在 的周围,若令各个 与条件期望 的偏差为,显然 是个随机变量 则有,2.总体回归函数的表现形式,PRF,作为总体运行的客观规律,总体回归函数是客观存在的,但在实际的经济研究中总体回归函数通常是未知的,只能根据经济理论和实践经验去设定。计量经济学研究中“计量”的根本目的就是要寻求总体回归函数。我们所设定的计量模型实际就是在设定总体回归函数的具体形式。总体回归函数中 Y 与 X 的关系可以是线性的,也可以是非线性的。,15,3.如何理解总体回归函数,16,计量经济学中,线性回归模型的“线性”有两种解释:就变量而言是线性的 Y的条件期望(均值)是X的线性函数 就参数而言是线性的 Y的条件期望
8、(均值)是参数的线性函数例如:对变量、参数均为“线性”对参数“线性”,对变量”非线性”对变量“线性”,对参数”非线性”注意:在计量经济学中,线性回归模型主要指就参数而言是“线性”的,因为只要对参数而言是线性的,都可以用类似的方法去估计其参数,都可以归于线性回归。,“线性”的判断,概念 在总体回归函数中,各个 的值与其条件期望 的偏差 有很重要的意义。若只有 的影响,与 不应有偏差。若偏差 存在,说明还有其他影响因素。实际代表了排除在模型以外的所有因素对 Y 的影响。性质 是其期望为 0 有一定分布的随机变量重要性:随机扰动项的性质决定着计量经济分析结 果的性质和计量经济方法的选择,17,三、随
9、机扰动项,是未知影响因素的代表(理论的模糊性)是无法取得数据的已知影响因素的代表(数据欠缺)是众多细小影响因素的综合代表(非系统性影响)模型可能存在设定误差(变量、函数形式的设定)模型中变量可能存在观测误差(变量数据不符合实际)变量可能有内在随机性(人类经济行为的内在随机性),18,引入随机扰动项 的原因,样本回归线:对于X的一定值,取得Y的样本观测值,可计算其条件均值,样本观测值条件均值的轨迹,称为样本回归线。样本回归函数:如果把被解释变量Y的样本条件均值 表示为解释变量X的某种函数,这个函数称为样本回归函数(SRF),19,X,Y,SRF,四、样本回归函数(SRF),20,样本回归函数如果
10、为线性函数,可表示为 其中:是与 相对应的 Y 的样本条件均值 和 分别是样本回归函数的参数 个别值(实际值)形式:被解释变量Y的实际观测值 不完全等于样本条件均值,二者之差用 表示,称为剩余项或残差项:则 或,样本回归函数的函数形式,条件均值形式:,样本回归线随抽样波动而变化:每次抽样都能获得一个样本,就可以拟合一条样本回归线,(SRF不唯一)样本回归函数的函数形式应与设定的总体回归函数的函数形式一致。样本回归线只是样本条件均值的轨迹,还不是总体回归线,它至多只是未知的总体回归线的近似表现。,21,样本回归函数的特点,SRF1,SRF2,Y,X,A X,22,PRF,SRF,样本回归函数与总
11、体回归函数的关系,如果能够通过某种方式获得 和 的数值,显然:和 是对总体回归函数参数 和 的估计 是对总体条件期望 的估计 在概念上类似总体回归函数中的,可视 为对 的估计。,23,对比:总体回归函数 样本回归函数,对样本回归的理解,24,目的:计量经济分析的目标是寻求总体回归函数。即用样本回归函数SRF去估计总体回归函数PRF。由于样本对总体总是存在代表性误差,SRF 总会过高或过低估计PRF。要解决的问题:寻求一种规则和方法,使其得到的SRF的参数 和 尽可能“接近”总体回归函数中的参数 和 的真实值。这样的“规则和方法”有多种,如矩估计、极大似然估计、最小二乘估计等。其中最常用的是最小
12、二乘法。,回归分析的目的,用样本去估计总体回归函数,总要使用特定的方法,而任何估计参数的方法都需要有一定的前提条件假定条件 一、简单线性回归的基本假定 为什么要作基本假定?只有具备一定的假定条件,所作出的估计才具有良好的统计性质。模型中有随机扰动项,估计的参数是随机变量,显然参数估计值的分布与扰动项的分布有关,只有对随机扰动的分布作出假定,才能比较方便地确定所估计参数的分布性质,也才可能进行假设检验和区间估计等统计推断。假定分为:对模型和变量的假定对随机扰动项的假定,25,第二节 简单线性回归模型的最小二乘估计,例如对于 假定模型设定是正确的(变量和模型无设定误差)假定解释变量X在重复抽样中取
13、固定值。假定解释变量X是非随机的,或者虽然X是随机的,但与扰动项u是不相关的。(从变量X角度看是外生的)注意:解释变量非随机在自然科学的实验研究中相对容易满足,经济领域中变量的观测是被动不可控的,X非随机的假定并不一定都满足。,26,1.对模型和变量的假定,假定1:零均值假定:在给定X的条件下,的条件期望为零 假定2:同方差假定:在给定X的条件下,的条件方差为某个常数,27,X,Y,2.对随机扰动项u的假定,28,假定3:无自相关假定:随机扰动项 的逐次值互不相关 假定4:解释变量 是非随机的,或者虽然 是随机的但与扰动项 不相关(从随机扰动 角度看),假定5:对随机扰动项分布的正态性假定,即
14、假定 服从均值为零、方差为 的正态分布(说明:正态性假定并不影响对参数的点估计,所以有时不列入基本假定,但这对确定所估计参数的分布性质是需要的。且根据中心极限定理,当样本容量趋于无穷大时,的分布会趋近于正态分布。所以正态性假定有合理性),29,由于其中的 和 是非随机的,是随机变量,因此Y是随机变量,的分布性质决定了 的分布性质。对 的一些假定可以等价地表示为对 的假定:假定1:零均值假定 假定2:同方差假定 假定3:无自相关假定 假定5:正态性假定,30,在对 的基本假定下 Y 的分布性质,1.OLS的基本思想 对于,不同的估计方法可以得到不同的样本回归参数 和,所估计的 也就不同。理想的估
15、计结果应使估计的 与真实的 的差(即剩余)总的来说越小越好 因 可正可负,总有,所以可以取 最小,即在观测值Y和X确定时,的大小决定于 和。要解决的问题::如何寻求能使 最小的 和。,31,二、普通最小二乘法(OLS)(rdinary Least Squares),用克莱姆法则求解得以观测值表现的OLS估计量:,32,取偏导数并令其为0,可得正规方程,或整理得,即,2.正规方程和估计量,33,为表达得更简洁,或者用离差形式的OLS估计量:容易证明由正规方程:注意:其中:本课程中:大写的 和 均表示观测值;小写的 和 均表示观测值的离差而且由样本回归函数可用离差形式写为,用离差表现的OLS估计量



- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 经济学 第二 简单 线性 回归 模型

链接地址:https://www.31ppt.com/p-6202955.html