面板数据分析方法.ppt
《面板数据分析方法.ppt》由会员分享,可在线阅读,更多相关《面板数据分析方法.ppt(85页珍藏版)》请在三一办公上搜索。
1、面板数据分析方法,Baltagi,Baltagi著 白仲林主译,第一节 面板数据的基本问题第二节 面板数据的模型形式第三节 面板数据模型的估计方法,第一节 面板数据的基本问题,一、面板数据的定义二、面板数据的分类三、面板数据的特点,一、面板数据的定义,面板数据(panel data)是指由变量y关于N个不同对象的T个观测期所得到的二维结构数据,记为yit,其中,i表示N个不同对象(如国家、地区、行业、企业或消费者等,一般称之为第i个个体),t表示T个观测期。,面板数据是二维结构数据,时间序列数据或截面数据都是一维数据。时间序列数据是变量按时间得到的数据;截面数据是变量在固定时点的一组数据。面板
2、数据是同时在时间和截面上取得的二维数据。所以,面板数据(panel data)也称作时间序列与截面混合数据(pooled time series and cross section data)。面板数据是截面上个体在不同时点的重复观测数据。,面板数据是二维结构数据,Panel原指对一组固定调查对象的多次观测,近年来panel data已经成为专业术语。面板数据从横截面看(cross section),是由若干个体(entity,unit,individual)在某一时点构成的截面观测值,从纵剖面(longitudinal section)看每个个体都是一个时间序列。,数据结构的二维性,时间序列
3、数据,横截面数据,变量X的面板数据结构,面板数据是二维结构数据,第一节 面板数据的基本问题,一、面板数据的定义二、面板数据的分类三、面板数据的特点,二、面板数据的分类,1.短面板与长面板 短面板(short panel):时间T较小,而个体数N较大。长面板(long panel):时间T较大,而个体数N较小。,二、面板数据的分类,2.微观面板数据与宏观面板数据 微观面板数据一般指一段时期内不同个体或者家庭的调查数据,其数据中往往个体单位较多,即N较大(通常均为几百或上千)而时期数T较短(最短为两个时期,最长一般不超过20个时期)。,二、面板数据的分类,2.微观面板数据与宏观面板数据 宏观面板数
4、据通常为一段时间内不同国家或地区的数据集合,其个体单位数量N不大(一般为7-200)而时期数T较长(一般为20-60年)。,二、面板数据的分类,3.动态面板与静态面板 在面板模型中,如果解释变量包含被解释变量的滞后值,则称为“动态面板”(dynamic panel);反之,则称为“静态面板”(static panel)。,二、面板数据的分类,4.平衡面板数据与非平衡面板数据 如果在面板数据中,每个时期在样本中的个体完全一样,则称为“平衡面板数据”(balanced panel);然而,有时某些个体的数据可能缺失,或者新的个体后来才加入到调查中来,在这种情况下,每个时期观测到的个体不完全相同,则
5、称为“非平衡面板数据”(unbalanced panel)。,第一节 面板数据的基本问题,一、面板数据的定义二、面板数据的分类三、面板数据的特点,三、面板数据的特点,1.由于观测值的增多,可以增加估计量的抽样精度。由于同时有截面维度与时间维度,通常面板数据的样本容量更大,从而可以提高估计的精确度。面板数据提供“更加有信息价值的数据,变量增加变异性,变量之间的共线性削弱了,并且提高了自由度和有效性。,三、面板数据的特点,2.提供更多个体动态行为的信息。由于面板数据同时有横截面与时间两个维度,有时可以解决单独的截面数据或时间序列数据所不能解决的问题,对面板数据进行回归既可以像回归分析截面数据一样捕
6、获个体间的差异变化,又可以研究个体随时间的变化情况。,三、面板数据的特点,2.提供更多个体动态行为的信息。案例:考虑如何区分规模效应与技术进步对企业生产效率的影响。对于截面数据来说,由于没有时间维度,故无法观测到技术进步。然而,对于单个企业的时间序列数据来说,我们无法区分其生产效率的提高究竟有多少是由于规模扩大,有多少是由于技术进步。,三、面板数据的特点,3.可以解决遗漏变量问题。遗漏变量偏差是一个普遍存在的问题。虽然可以用工具变量法解决,但有效的工具变量常常很难找。遗漏变量常常是由于不可观测的个体差异或“异质性”造成的,如果这种个体差异“不随时间而改变”,则面板数据提供了解决遗漏变量问题的又
7、一利器。,三、面板数据的特点,4.带来一些问题。(1)由于综合了两种数据类型,面板数据分析方法相对更加复杂。(2)由于同一个体不同时期的数据一般存在自相关,样本数据通常不满足独立同分布的假定。(3)面板数据的收集成本通常较高,不易获得。,图6 图7,File:5panel02a,用原变量建模还是用对数变量建模?,人均消费对收入的面板数据散点图 对数的人均消费对收入的面板数据散点图,本例用对数数据研究更合理,图8 图9,尽管两个地区的水平值差异很大,但消费结构并没有太大的变化。,第一节 面板数据的基本问题第二节 面板数据的模型形式第三节 面板数据模型的估计方法,其中:和 分别表示居民的消费与收入
8、。反映不随时间变化的个体上的差异性(个体效应)反映不随个体变化的时间上的差异性(时间效应),例1:居民消费行为与收入的关系,例2.农村居民收入分析,(14.1.3),面板数据:多个观测对象的时间序列数据所组成的样本数据。,反映不随个体变化的时间上的差异性,被称为时间效应。,反映不随时间变化的个体上的差异性,被称为个体效应,第二节 面板数据的模型形式,一、个体效应模型二、固定效应模型三、随机效应模型四、双向效应模型,其中:为 的矩阵,为k个解释变量的第i个个体在 第t时期的观测值,为 的矩阵。zi为不随时间 而变的个体特征,即。扰动项由 两部分构成,被称为“复合扰动项”。,个体效应模型(indi
9、vidual-specific effects model)假定样本中每个个体的回归方程斜率相同,但截距项不同。,一、个体效应模型,复合扰动项:不可观测的随机变量 是代表个体异质性的截距项。为随个体与时间而变的扰动项。假定 为独立同分布的,且与 不相关。,个体效应模型,1.它表示不可观测的个体特殊效应、潜在变量、不可观测 的异质性等。考虑到个人或者任一家庭、企业都具有很 难被调查者观察到的独有的特征,这种特殊效应在整个 时间范围内 是保持不变的。2.某些场合下将其视为常数,但这也是随机变量的特例,即退化的随机变量。,对于个体效应:,取对数后,模型变为:在这里,代表着企业不随时间变化并且不可观测
10、到的特殊效应,它表示一个企业的管理才能、员工素质等。,例:一个企业的柯布-道格拉斯生产函数,1.如果 与所有解释变量 均不相关,则进一步称之 为“随机效应模型”(Random Effects Model,RE)。2.如果 与某个解释变量相关,则进一步称之为“固定效 应模型(Fixed Effects Model,FE)。,个体效应 与解释变量 的相关性:,第二节 面板数据的模型形式,一、个体效应模型二、固定效应模型三、随机效应模型四、双向效应模型,固定效应模型形式同样与个体效应模型相同,但是在固定效应模型中假定 为需要估计的固定参数,它可以与解释变量之间存在相关性。固定效应模型意味着存在内生解
11、释变量。在 随时间变化的情况下,固定效应模型所得到的第j个解释变量的边际效应估计量同样是一致的。然而,同随机效应模型相比,固定效应 模型中存在参数过多和自由度损失过多等问题。,二、固定效应模型,第二节 面板数据的模型形式,一、个体效应模型二、固定效应模型三、随机效应模型四、双向效应模型,对于随机效应模型,一般采用可行的广义最小二乘法(FGLS)对其进行估计,由于 被假定为随机的,无须估计,因此使用随机效应模型可以一次得到所有系数的估计值从而进行边际分析。但是,如果随机效应模型选取不恰当所得到的参数估计值将是不一致的。,随机效应模型形式与个体效应模型相同,在随机效应模型中假定 是完全随机的,即
12、与解释变量无关。,三、随机效应模型,第二节 面板数据的模型形式,一、个体效应模型二、固定效应模型三、随机效应模型四、双向效应模型,双向效应模型(two-way-effects model)也可称为双因素误差模型,它将未观测到的个体效应和时间效应引入模型,是个体效应模型的标准延伸。这里t仅随时间变化而不随个体变化,表示所有未包含在回归模型中的发生在特定时期的影响,如地震对某一时期企业生产的影响。,四、双向效应模型,双向固定效应模型(Two-way FE),对于短面板数据,通常将时间效应看做固定效应,如果个体效应模型中含有时间趋势项或包含时间虚拟变量,则称之为双向固定效应模型。(1)在固定效应模型
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 面板 数据 分析 方法
链接地址:https://www.31ppt.com/p-6613961.html