面板数据模型讲义.ppt
《面板数据模型讲义.ppt》由会员分享,可在线阅读,更多相关《面板数据模型讲义.ppt(80页珍藏版)》请在三一办公上搜索。
1、第九章 面板数据模型,第一节 面板数据与面板数据模型第二节 固定影响模型第三节 随机影响模型第四节 SUR模型*第五节 随机系数模型*第六节 动态面板数据模型,第一节 面板数据与面板数据模型,一、面板数据 混合数据(pooled data)是指将横截面数据和时间序列数据结合在一起的数据。混合数据包含不同横截面个体不同时期的数据,或者说,混合数据包含既跨越时间又跨越空间的数据。如果混合数据包含的观测值来自同一批地区、公司、人员或其它横截面个体的不同时期数据,则此类混合数据称为面板数据(panel data)。,如果混合数据包含的观测值来自从一个大总体中随机抽样的主体不同时期的数据,则此类混合数据
2、称为非面板混合数据。例如,我们每年对北京市固定的一万户家庭消费的观测记录所得到的数据集就是面板数据;而我们每年对北京市居民家庭随机抽样一万户家庭消费的观测记录所得到的数据集就是非面板混合数据。在实践中,面板数据通常比非面板混合数据更有用,这是因为面板数据中的地区、公司、人员等横截面个体在各时期中一直保持不变,这使得我们更易于对这类个体随着时间的推移所发生的变动进行比较和分析。,相应地,我们将基于面板数据的回归模型称为面板数据模型(panel data model)。面板数据模型可以分为单方程面板数据模型和联立方程面板数据模型;也可以分为线性面板数据模型和非线性面板数据模型(如离散被解释变量面板
3、数据模型、受限被解释变量面板数据模型)。,相应地,我们将基于面板数据的回归模型称为面板数据模型(panel data model)。面板数据模型可以分为单方程面板数据模型和联立方程面板数据模型;也可以分为线性面板数据模型和非线性面板数据模型(如离散被解释变量面板数据模型、受限被解释变量面板数据模型)。二、面板数据模型的优点1利用面板数据进行的经济分析更全面2利用面板数据能够改进估计的有效性,三、分析面板数据的一般模型框架 分析面板数据的基本框架是形如下式的回归模型:,其中,中有k个解释变量,不包括常数项。异质性或个体影响 由表示,其中包含一个常数项和一组体现横截面个体影响但不随时间变化的变量,
4、例如可观测的种族、性别等,或无法观测的家庭特征、偏好等,所有这些变量都只体现横截面个体特征,而不随时间变化。如果所有横截面个体的 都可以观测到,那么整个模型可被视为一个普通线性模型,并可用最小二乘法来拟合。但在大多数应用中,不可观测,处理起来就要复杂得多。,分析的主要目标是偏效应(partial effects)的一致和有效估计:,是否能达到这个目标取决于有关不可观测的影响的假设。我们以自变量的严格外生性假设作为起点,该假设为:,即当期扰动项与过去、现在和未来的每一期中的自变量都无关。,模型关注的重要方面是异质性,这方面特别方便的一个假设是所谓的均值独立(mean independence):
5、,如果该假设成立,即不可观测的变量与包括在模型中的变量无关,那么下面将看到,可以将它们包括在模型的扰动项中,这正是随机影响模型的基础假设。可是,这是一个很强的假设,很多情况下无法满足。弱一些的假设是:,假设条件放宽了,模型的适应面也宽了,但复杂性也大大增加了,因为需要有关函数性质的假设。,四、模型结构 我们将研究分析面板数据的各类模型,它们大致可分为如下几种类型:1混合回归(pooled regression)若中仅包含常数项,则模型形式如下:,这类模型假设所有的横截面个体在各个不同时期的斜率和截距都是相同的,这样就可以直接把面板数据混合在一起,用OLS估计参数,得到一致和有效估计量。由于混合
6、回归模型假设解释变量对被解释变量的影响与横截面个体无关,这在现实中是很难成立的,所以应用不广。,2固定影响(fixed effects),如果 不可观测,但与 相关,则由于遗漏了有关变量,的OLS估计量是有偏和不一致的。可是在这种情况下,模型,包含了所有可观测的影响,并且设定了一个可估计的条件均值。这就是固定影响模型。其中。固定影响模型将 视为回归模型中每一个体各自不同的常数项。注意,这里使用的“固定”一词是表明 和 的相关,并不表明 是非随机的。,固定影响模型可分为三类,即个体固定影响模型(Entity fixed effects model)、时点固定影响模型(Time fixed eff
7、ects model)和个体时点固定影响模型(Entity and time fixed effects model)。在本章中,我们只介绍个体固定影响模型。,3随机影响(random effects)如果未观测到的个体异质性可以被假定与包括在模型中的变量无关,则模型可设定为,这是一个带复合扰动项的线性回归模型。可用OLS法估计,得到一致但非有效的估计量。(9.4)称为随机影响模型。这里 是一个反映横截面个体影响的随机元素。固定影响模型和随机影响模型的关键区别是未观测到的个体影响是否包含与模型中解释变量相关的元素,而不在于这些影响是否随机。,4.随机系数(random coefficients
8、),随机影响模型可看成是一个带有随机常数项的回归模型。如果数据集足够丰富,我们可以将此思路扩展到其它系数也随着个体随机变动的模型,从而得到随机系数模型:,其中 是一个引起参数跨个体变动的随机向量。,第二节 固定影响模型,一、固定影响模型的设定 上一节给出了分析面板数据的一般模型,固定影响模型源于一般模型中被遗漏的影响 与包括的变量 相关的假设,此假设的一般形式是:,(9.6),由于上式中的条件均值在所有时期中都相同,我们可将模型写成,括号项可通过构造使其与 不相关,因而可将其吸收到扰动项中,模型可写为,(9.7),这就是固定影响模型。从模型的设定可知,固定影响模型假设横截面个体之间的差异为截距
9、不同,而斜率系数相同,即允许不同的横截面个体的截距是不同的,但每一个体的截距在各个不同时期则保持不变。换句话说,固定影响模型假定不同横截面个体的差异可用不同的常数项 来描述,在此模型中,被作为要估计的未知参数。,如果进一步假设 为常数,则在此假设下,(9.7)变成经典线性回归模型。,二、固定影响模型的参数估计,固定影响模型参数的估计方法有两种,一种是最小二乘虚拟变量(LSDV)估计法,另一种是组内估计(Within Estimator)或称协方差估计(The Analysis of Covariance Estimation,ANCOVA)。下面介绍这两种参数估计方法。,1.LSDV估计法 设
10、 和 为第i个横截面单元的T个观测值,是一个元素全为1的 列向量,为相应的扰动项 列向量,则,(9.8),将全部i个单元汇集在一起,给出,或,(9.9),这里 是第i个单元为1其它单元为0的虚拟变量。设 矩阵,则将所有 行组合在一起,有,此模型通常称为最小二乘虚拟变量模型(least squares dummy variable model,LSDVM)。此模型是一个经典线性回归模型。如果n足够小,模型就可用OLS法估计,对中K个解释变量和D中的n列回归,共 个参数。,实际应用中,n 通常很大,数以千计,模型很可能超出任何计算机的存储容量。可考虑使用分块回归技术以减少计算量。有关分块回归技术的
11、详细讨论参见Greene(2008)。另一方面,运用LSDV估计固定影响模型,需要加入n个虚拟变量,当模型中的虚拟变量的个数n很大时,回归中会损失大量的自由度。解决这个问题的思路是对模型进行变换,消去常数项,再用变换后的模型回归。,为表达方便起见,不失一般性,我们用双变量模型来说明。在这种情况下,模型(9.7)简化成:,(9.10),我们对第i个横截面个体在时间上求均值,则有,(9.10)(9.11),得,这样在模型(9.12)中,常数项就被去掉了。令,则模型转换为,对模型(9.13)运用OLS进行回归,就得到 的OLS估计值。,2.组内估计法 为表达方便起见,先考虑双变量模型,,假定。,再令
12、,定义,称为组内均值。组内平方和及交叉乘积和为:,参数 和 的估计值由 关于和 最小化得到。我们有,不难看出,上式中1、3两项分别是;而2、4两项内层求和号中都是离差和,内层对t求和恒等于0。因此我们得到,被称为组内估计量,记为 或。,为了使组内估计量是一致估计量,必须满足,而满足此条件的充分条件是 与 不相关,则 与 也不相关。即满足,也就是说 是严格外生的。在多个解释变量的情况下,前面的结果变为,三、检验个体影响的显著性,如果我们对不同横截面个体的差异感兴趣,我们可以用F检验来检验每个横截面个体的常数项是否都相等。即假设,检验的F统计量为:,F(n-1,nT-n-K),或,F(n-1,nT
13、-n-K),式中,为最小二乘虚拟变量模型的决定系数,为受约束模型(即混合回归模型)的决定系数;受约束模型的残差平方和,为最小二乘虚拟变量模型的残差平方和。,在给定的显著性水平下,如果拒绝了原假设,则将模型设定为固定影响模型;如果接受原假设,则模型设定为混合回归模型。,例9.1 我们搜集我国20012007年我国内地31个省市自治区城镇居民家庭人均年可支配收入、城镇居民家庭人均年消费支出和各地区城镇居民消费价格指数的数据,建立消费收入模型,以研究城镇居民的消费行为。模型中用到的变量是:,Cit=i省市第t年城镇居民人均消费,单位:元Yit=i省市第t年城镇居民人均收入,单位:元Pit=i省市第t
14、年城镇居民消费价格指数(1985100),事实上,对于这3个变量中的每一个,都有217个观测值(31个省市乘以7年)。由于在每个时期(每一年)都是这31个省市,因此这些混合数据是面板数据。现实中,即使每个时期中每个省市的消费与收入之间的关系都相同,但经济发达的省市与经济落后的省市的城镇居民的消费模式、消费理念肯定是有差别的。因此,为简单起见,我们假定采用固定影响模型,模型形式如下:,此模型的回归我们不采用LSDV法,这会损失很多的自由度,因而采用组内估计法。应用EViews6,估计模型参数,结果为:31个省市自治区城镇居民家庭人均年边际消费倾向均为0.552,自主性消费(截距项)有很大差异,见
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 面板 数据模型 讲义
链接地址:https://www.31ppt.com/p-2239721.html