《面板数据模型经典》PPT课件.ppt

资源ID：4879368 资源大小：3.56MB 全文页数：159页
资源格式： PPT 下载积分：15金币

快捷下载

会员登录下载

三方登录下载：

下载资源需要15金币

邮箱/手机：
温馨提示：	用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）
支付方式：
验证码：	换一换

加入VIP免费专享

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

《面板数据模型经典》PPT课件.ppt

第11章面板数据模型 11.1面板数据模型概述 11.1.1 面板数据的含义,面板数据（panel data）也称也称平行数据，或时间序列截面数据（time series and cross section data）或混合数据（pool data），是指在时间序列上取多个截面，在这些截面上同时选取样本观测值所构成的样本数据。面板数据从横截面上看，是由若干个体在某一时刻构成的截面观测值，从纵剖面上看是一个时间序列。面板数据用双下标变量表示。例如 yi t i=1,2,N;t=1,2,TN表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变，yi.(i=1,2,N)是横截面上的N个随机变量；若固定i不变，y.t(t=1,2,T)是纵剖面上的一个时间序列（个体），如图所示。,图11.1.1 面板数据示意图,例如1990-2000年30个省份的农业总产值数据。固定在某一年份上，它是由30个农业总产值数字组成的截面数据；固定在某一省份上，它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。对于面板数据yi t,i=1,2,N;t=1,2,T来说，如果从横截面上看，每个变量都有观测值，从纵剖面上看，每一期都有观测值，则称此面板数据为平衡面板数据（balanced panel data）。若在面板数据中丢失若干个观测值，则称此面板数据为非平衡面板数据（unbalanced panel data）。,例 1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费和人均收入（不变价格）数据见表和表。数据是7年的，每一年都有15个数据，共105组观测值。表11.1.1 1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费数据（不变价格）,表11.1.2 1996-2002年中国15个省级地区的居民家庭人均收入数据（不变价格）,人均消费和收入的面板数据从纵剖面观察分别见图和图。从横截面观察分别见图和图。用CP表示消费，IP表示收入。AH,BJ,FJ,HB,HLJ,JL,JS,JX,LN,NMG,SD,SH,SX,TJ,ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。,图11.1.2 15个省市人均消费序列（纵剖面）,图11.1.3 15个省市人均收入序列,图11.1.4 15个省市人均消费散点图(每条连线表示同一年度15个地区的消费值),图11.1.5 15个省市人均收入散点图(7个横截面叠加)(每条连线表示同一年度15个地区的收入值),15个地区7年人均消费对收入的面板数据散点图见图和图。图中每一种符号代表一个省级地区的7个观测点组成的时间序列。相当于观察15个时间序列。图中每一种符号代表一个年度的截面散点图（共7个截面）。相当于观察7个截面散点图的叠加。,图11.1.6 用15个时间序列表示的人均消费对收入的面板数据,图11.1.7 用7个截面表示的人均消费对收入的面板数据（7个截面叠加）,图给出北京和内蒙古1996-2002年消费对收入散点图。图给出15个省级地区1996和2002年的消费对收入散点图。,图11.1.8 北京和内蒙古1996-2002年消费对收入时序图,图11.1.9 1996和2002年地区消费对收入散点图,11.1.2 面板数据模型的基本类型设yit为被解释变量在横截面i和时间t上的数值，xjit为第j个解释变量在横截面i和时间t上的数值，uit为横截面i和时间t上的随机误差项；bji为第i截面上的第j个解释变量的模型参数；ai为常数项或截距项，代表第i横截面(第i个体的影响)；解释变量数为j=l，2，k；截面数为i=1，2，N；时间长度为t=1，2，T。其中,N表示个体截面成员的个数，T表示每个截面成员的观测时期总数，k表示解释变量的个数。则单方程面板数据模型一般形式可写成：,对于平衡的面板数据，即在每一个截面单元上具有相同个数的观测值，模型样本观测数据的总数等于NT。当N=1且T很大时，就是所熟悉的时间序列数据；当T=1而N很大时，就只有截面数据。面板数据模型划分为3种类型：(1)无个体影响的不变系数模型：ai=aj=a，bi=bj=b,这种情形意味着模型在横截面上无个体影响、无结构变化，可将模型简单地视为是横截面数据堆积的模型。这种模型与一般的回归模型无本质区别，只要随机扰动项服从经典基本假设条件，就可以采用OLS法进行估计（共有k+1个参数需要估计），该模型也被称为联合回归模型(pooled regression model)。(2)变截距模型：aiaj，bi=bj=b,这种情形意味着模型在横截面上存在个体影响，不存在结构性的变化，即解释变量的结构参数在不同横截面上是相同的，不同的只是截距项，个体影响可以用截距项ai(i1，2，N)的差别来说明，故通常把它称为变截距模型。,(3)变系数模型：aiaj，bibj,这种情形意味着模型在横截面上存在个体影响，又存在结构变化，即在允许个体影响由变化的截距项ai(i1，2，N)来说明的同时还允许系数向量bi(i1，2，N)依个体成员的不同而变化，用以说明个体成员之间的结构变化。我们称该模型为变系数模型。,11.1.3 面板数据模型的优点 1利用面板数据模型可以解决样本容量不足的问题 2有助于正确地分析经济变量之间的关系 3可以估计某些难以度量的因素对被解释变量的影响11.2 模型形式设定检验,建立面板数据模型首先要检验被解释变量yit的参数ai和bi是否对所有个体样本点和时间都是常数，即检验样本数据究竟属于上述3种情况的哪一种面板数据模型形式，从而避免模型设定的偏差，改进参数估计的有效性。主要检验如下两个假设：,如果接受假设H2，则可以认为样本数据符合不变截距、不变系数模型。如果拒绝假设H2，则需检验假设H1。如果接受H1，则认为样本数据符合变截距、不变系数模型；反之，则认为样本数据符合变系数模型。,下面介绍假设检验的F统计量的计算方法。首先计算变截距、变系数模型(11.1.6)的残差平方和S1。如果记,11.3 变截距模型该模型允许个体成员上存在个体影响，并用截距项的差别来说明。模型的回归方程形式如下：,11.3.1 固定影响变截距模型 1最小二乘虚拟变量模型(LSDV)及其参数估计,其中,例利用1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费和人均收入数据(见表11.1和表11.2)，试研究这些地区的居民家庭消费行为。（1）建立合成数据库（pool）对象或混合数据库对象；（2）定义序列名并输入数据；（3）估计无个体影响的不变系数模型；（4）估计变截距模型。（1）建立合成数据库（pool）对象在打开工作文件窗口的基础上，点击主功能菜单中的Objects键，选New Object功能，从而打开New Object（新对象）选择窗（见图）。,图11.3.1 Pool对象定义对话框,在Type of Object选择区选择Pool（混合数据库），在Name of Object选择区命名CS（初始显示为Untitled），点击OK，从而打开Pool对象说明窗口。在窗口中输入15个地区标识AH（安徽）、BJ（北京）、ZJ（浙江）。如图所示。,图11.3.2 Pool对象说明窗口,（2）定义序列名并输入数据在新建立的Pool（混合数据）窗口的工具栏中点击Sheet键，从而打开Series List（列出序列名）窗口，定义时间序列变量CP?和IP?，如图。点击OK键，从而打开Pool（混合数据库）窗口，输入数据，输入完成后的情形见图。,图11.3.3 序列列表对话框,图11.3.4 序列的堆栈形式数据表,（3）估计无个体影响的不变系数模型模型形式为,其中：a为15个省市的平均自发消费倾向，b为边际消费倾向。在Pool窗口的工具栏中点击Estimate键，打开Pooled Estimation（混合估计）窗口如图。,图11.3.5 合成数据模型定义对话框,在对话框左上部的Dependent Variable选择窗填入被解释变量CP?；在中部的Common coefficients（系数相同）选择窗填入解释变量IP?；Cross section specific coefficients（截面系数不同）选择窗保持空白；Intercept选项代表截距的处理方式。None代表模型不包含截距，Common指所有截面单元具有相同截距，Fixed effects与Random effects分别表示截距变动的固定效应和随机效应。本例选择窗点击Common。对话框Weighting（权数）选项是模型的估计方法。本例选择不加权，点击No weighting。完成合成数据模型定义对话框后，点击OK键，得输出结果如表。表11.3.1 无个体影响的不变系数模型估计结果,表结果表明，回归系数显著不为0，调整后的样本决定系数达0.98，说明模型的拟合优度较高。从结果看，平均消费倾向为0.76，表明15个省级地区的人均消费支出平均占收入的76%。（4）变截距模型模型形式为,其中：ai为15个省市的自发消费倾向，用来反映省市间的消费结构差异，b为边际消费倾向。EViews估计方法：在EViews的Pooled Estimation对话框中Intercept选项中选Fixed effects。其余选项同上。得输出结果如表。表11.3.2 变截距模型估计结果,表中给出了变截距模型估计结果，表中的系数0.697561为边际消费倾向，后面三项是估计标准误、检验统计量值和相伴概率。表中下半部是各地区截距估计值。输出结果的方程形式是安徽：CP_AH=479.3076014+0.6975614547*IP_AH北京：CP_BJ=1053.179629+0.6975614547*IP_BJ福建：CP_FJ=467.9678362+0.6975614547*IP_FJ河北：CP_HB=361.3764747+0.6975614547*IP_HB黑龙江：CP_HLJ=345.9120278+0.6975614547*IP_HLJ吉林：CP_JL=540.1174754+0.6975614547*IP_JL江苏：CP_JS=480.417445+0.6975614547*IP_JS江西：CP_JX=195.9175812+0.6975614547*IP_JX辽宁：CP_LN=622.0405359+0.6975614547*IP_LN内蒙古：CP_NMG=306.0650134+0.6975614547*IP_NMG,山东：CP_SD=381.4986769+0.6975614547*IP_SD上海：CP_SH=782.5988793+0.6975614547*IP_SH陕西：CP_SX=440.7243659+0.6975614547*IP_SX天津：CP_TJ=562.8424811+0.6975614547*IP_TJ浙江：CP_ZJ=714.233227+0.6975614547*IP_ZJ,表结果表明，回归系数显著不为0，调整后的样本决定系数达0.99，说明模型的拟合优度较高。从估计结果可以看出，对于本例中的15个省市来说，虽然居民边际消费倾向相同，但是其居民的自发消费存在显著的差异，其中北京、上海、浙江是居民自发消费最高的3个地区，而居民自发消费最低的是江西，其次是内蒙古。,对于随机效应模型或者变系数模型，用EViews建模过程大同小异，只是结果输出窗口中的参数估计格式有所区别。EViews 5.1版本的面板数据模型估计(Pool Estimation)窗口分成了两个模块：Specification(设定)和Option(选择)，但基本功能与早期版本无本质区别，主要选择都集中在Specification(设定)模块中，见图。熟悉了图中选择方法对图对话框不难理解。,图11.3.6 EViews5.1合成数据模型定义对话框,在Estimation Method(估计方法)选项区内有三个选项框：(1)Crosssection(横跨个体)中包括None(不选)、Fixed(固定)、Random(随机)，分别用来做非个体效应、个体固定效应和个体随机效应的设定(见图11.3.6)。(2)Period(时点)中也包括None(不选)、Fixed(固定)、Random(随机)三项选择，分别用来进行非时点效应、时点固定效应或时点随机效应设定。(3)Weight(权数)可以在5种加权方法中做选择。在Estimation Settings(估计方法设定)区包括两种估计方法：一种为LS(最小二乘)方法；一种为TSLS(两阶段最小二乘)方法。EViews5.1估计结果如表所示。表11.3.3 各地区自发消费对平均自发消费偏离的估计结果,从表可知，515.6133为15个省市的平均自发消费水平，表中的系数0.697561为边际消费倾向，后面第3行至第17行数据为各地区自发消费对平均自发消费的偏离，用来反映省市间的消费结构差异。平均自发消费水平与各地区自发消费对平均自发消费的偏离之和为各地区自发消费。表回归结果与表回归结果本质上是相同的。2非平衡数据的固定影响模型在所获得的面板数据中，一些个体成员的数据较多而另一些个体成员的数据较少。这种情况下的面板数据被称为非平衡数据。,3固定影响变截距模型的广义最小二乘估计在固定影响变截距模型中，如果随机误差项不满足等方差或相互独立的假设，则需要使用广义最小二乘法(GLS)对模型进行估计。下面只介绍个体成员截面异方差和同期相关协方差两种情形。(1)个体成员截面异方差情形的GLS估计个体成员截面异方差是指各个体成员方程的随机误差项之间存在异方差，但个体成员之间和时期之间的协方差为零，对应的假设为：,(2)同期相关协方差情形的SUR估计同期相关协方差是指不同的个体成员i和j的同时期的随机误差项是相关的，但其在不同时期之间是不相关的，相应的假设为,需要指出的是同期相关协方差是允许同一时期即t不变时，不同个体成员之间存在协方差。如果把假设式(11.3.14)中的第一个表达式写成向量和矩阵的形式：,此时这种个体成员之间存在协方差的方差结构有些类似于个体成员方程框架下的近似不相关回归(seemingly unrelated regression，SUR)，因此将这种结构称为个体成员截面SUR(cross-section SUR)。,4固定影响变截距模型的二阶段最小二乘估计,11.3.2 随机影响变截距模型 1随机影响变截距模型的形式与固定影响模型不同，随机影响变截距模型把变截距模型中用来反映个体差异的截距项分为常数项和随机变量项两部分，并用其中的随机变量项来表示模型中被忽略的、反映个体差异的变量的影响。模型的基本形式为：,为了分析方便，可以将模型(11.3.19)写成如下形式：,可见，随机影响变截距模型的误差项为两种随机误差之和，方差为各随机误差的方差之和。2随机影响变截距模型的估计在式(11.3.21)中可以看出NT个观测值的扰动协方差矩阵为,在实际分析中，成分方差几乎都是未知的。因此，需要采用可行广义最小二乘估计法(feasible generalized least squared，FGLS)对模型进行估计，即先利用数据求出未知成分方差的无偏估计，然后再进行广义最小二乘估计。,例利用1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费和人均收入数据(见表11.1和表11.2)，试建立随机影响变截距模型，研究这些地区的居民家庭消费行为。模型形式为,EViews估计方法：在EViews的Pooled Estimation对话框中Intercept选项中选Random effects（随机效应截距项，见图），其余选项同上。,图11.3.6 合成数据模型定义对话框,随机影响变截距模型输出结果如表。表11.3.4 随机影响变截距模型估计结果,表11.3.5 各地区随机影响的变截距模型估计结果,从表给出的估计结果可以看出，在15个省市中，自发消费最高的为北京，其次为上海，最低的是江西，其次是内蒙古，该结果与例中所得到的结果基本一致。11.3.3 随机效应模型的检验在实际应用中，究竟是采用固定效应模型还是采用随机效应模型，这需要进行模型设定检验。1.LM检验。Breush和Pagan于1980年提出R 检验方法。其检验原假设和备择假设：,如果不否定原假设，就意味着没有随机效应，应当采用固定效应模型。对于原假设，检验的统计量是：,2.豪斯曼（Hausman）检验。William H Greene于1997年提出了一种检验方法，称为豪斯曼（Hausman）检验。检验的统计量是：,例利用1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费（不变价格）和人均收入数据(见表11.1和表11.2)。（1）利用豪斯曼检验选择面板模型，研究居民家庭消费行为。（2）面板单位根检验。（1）利用豪斯曼检验选择面板模型：由个体固定效应回归结果(表11.3.3)式知：,EViews 5.1可以直接进行Hausman检验。在表输出结果窗口中点击View键，选FixedRandom Effects TestingCorrelated Random Effect-Hausman Test功能，如图，可以直接获得如表的Hausman检验结果(主要结果)。,图11.3.7 Hausman检验,表11.3.6 Hausman检验结果,表中第1部分给出的是Hausman检验结果。Hausman统计量的值是14.7875，相对应的概率是0.0001，说明检验结果拒绝了随机效应模型原假设，应该建立个体固定效应模型。14.79与上面计算的21.22有差别，是由于两种计算的误差不同所致。表中第2部分给出的是Hausman检验中间结果比较。0.697561是个体固定效应模型对参数的估计，0.724569是随机效应模型对参数的估计。0.000049是相应两个参数估计量的分布方差的差(Var(Diff)。综上分析，19962002年中国东北、华北、华东15个省级地区的居民家庭人均消费和人均收入问题应该建立个体固定效应回归模型。人均消费平均占人均收入的69.76。随地区不同，自发消费(截距项)存在显著性差异。,（2）面板单位根检验在工作文件窗El中打开CP变量的15个数据组，点击View键，选Unit Root Test功能(如图11.3.8)，打开Group Unit Root Test对话框如图，共有6个选项区。,图,图,Test type选项区共包括6种检验方法，分别是LLC，Breitung，IPS，Fisher ADF，Fisher PP，Hadri检验。默认的状态是6种检验结果综合(Summary)。检验方法的下拉菜单见图。,图,Test for unit root in选项区包括3个选项，可以对水平序列(Level)、一次差分序列(1st difference)、二次差分序列(2nd difference)进行检验，默认的选择是对水平序列检验单位根。Include in test equation选项区有3个选项。检验式中包括截距项、截距项与趋势项，不包括确定性项。Option(选择)选项区对是否使用平衡面板做出选择。Lag length选项区指单位根检验式中差分项的滞后长度。可以给出6种评价准则。Spectral estimation选项区中核(Kernel)估计给出3种选择。选择默认值，点击图窗口中的OK键，得15个地区的CP序列的单位根检验综合结果如表。5种检验方法的结论都认为15个CP序列存在单位根。,表11.3.7 面板单位根检验结果,11.4 变系数模型变系数模型的基本形式如下：,11.4.1 固定影响变系数模型 1不同个体之间随机误差项不相关的固定影响变系数模型,截面个体的N个单方程，利用各横截面个体的时间序列数据采用经典的单方程模型估计方法分别估计各单方程中的参数。2不同个体之间随机误差项相关的固定影响变系数模型,例利用1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费和人均收入数据(见表11.1和表11.2)，试建立固定影响变系数模型，研究这些地区的居民家庭消费行为。模型形式为,其中：ai为15个省市的自发消费倾向，bi为边际消费倾向，两者用来反映省市间的消费结构差异。EViews估计方法：在Pooled Estimation（混合估计）窗口中的Dependent Variable（相依变量）选择窗填入CP?；在Common coefficients（系数相同）选择窗保持空白；在Cross section specific coefficients（截面系数不同）选择窗填入IP?；在Intercept（截距项）选择窗中选Fixed effects（也可以做其他选择）；在Weighting（权数）选择窗点击No weighting。点击Pooled Estimation（混合估计）窗口中的OK键。固定影响变系数模型输出结果如表。,表11.4.1 固定影响变系数模型估计结果,表中给出了变系数模型估计结果，表上部第2列是各地区的边际消费倾向估计值，后面3列是估计标准误、检验统计量值和相伴概率。表中部是各地区截距估计值。表下部是整个回归方程的拟合优度、F统计量、DW统计量等指标。输出结果的方程形式是,安徽：CP_AH=161.6170366+0.7600529617*IP_AH北京：CP_BJ=36.21736713+0.8065556921*IP_BJ福建：CP_FJ=1274.326672+0.5830460912*IP_FJ河北：CP_HB=319.354881+0.705311265*IP_HB黑龙江：CP_HLJ=595.8939202+0.6444699411*IP_HLJ吉林：CP_JL=117.7833817+0.7875706843*IP_JL江苏：CP_JS=708.9157069+0.6623656882*IP_JS,江西：CP_JX=652.3219323+0.6019851277*IP_JX辽宁：CP_LN=195.599025+0.7812790991*IP_LN内蒙古：CP_NMG=-106.6406618+0.7858190681*IP_NMG山东：CP_SD=502.169392+0.677398964*IP_SD上海：CP_SH=1051.031432+0.6717297747*IP_SH陕西：CP_SX=568.1459927+0.669777312*IP_SX天津：CP_TJ=197.1228368+0.7457127261*IP_TJ浙江：CP_ZJ=1328.261149+0.6276611695*IP_ZJ,在计算变系数模型中的个体影响时，不同的软件给出的个体影响形式不同。Eviews5.0软件，给出的个体影响反映的是各个体成员对总体平均状态的偏离。EViews5.0估计结果如表所示。表11.4.2 各地区自发消费对平均自发消费偏离的固定影响变系数模型估计结果,从表结果表明，回归系数显著不为0，F统计量较大（p值显著），调整后的样本决定系数达0.99，说明模型的拟合优度较高。从估计结果可以看出，15个省级地区的居民家庭消费需求结构具有明显的差异。在15个省市中，边际消费倾向最高是北京，其次是吉林、内蒙古两省区，而边际消费倾向较低的是江西，最低的是福建。,从表可知，回归系数与表中相同。表上半部第1行中的常数项506.808为15个省市的平均自发消费水平，表下半部数据为各地区自发消费对平均自发消费的偏离，用来反映省市间的消费结构差异。平均自发消费水平与各地区自发消费对平均自发消费的偏离之和为各地区自发消费。表回归结果与表回归结果本质上是相同的。2不同个体之间随机误差项相关的固定影响变系数模型,相对于混合估计模型来说，是否有必要建立变截距、变系数模型，可以通过F检验来完成。即检验样本数据究竟属于哪一种面板数据模型形式。主要检验如下两个假设：,3含有AR(p)项的固定影响变系数模型对于含有AR(p)项的固定影响变系数模型，经过适当的变换，可以将其转换成基本的固定影响变系数模型进行估计。例如，含有AR(1)项的固定影响变系数模型的基本形式如下：,利用前面所介绍的固定影响变系数模型的估计方法，能够实现对于变形后的模型(11.4.8)的估计。类似，对于含有AR(p)项的固定影响变截距模型，也可以经适当变换转变为基本的固定影响变截距模型进行估计。11.4.2 随机影响变系数模型 1随机影响模型的形式考虑如下形式的变系数模型：,2随机影响模型的估计,在实际分析中，这两项方差几乎都是未知的，因此需要采用可行广义最小二乘估计法(FGLS)对模型进行估计，即先利用数据求出未知方差的无偏估计，然后再进行广义最小二乘估计。,11.5 案例分析根据凯恩斯的绝对收入假说，利用我国29个省市（不包括重庆和西藏）的城镇居民可支配收入、消费数据(见表、表11.5.2)建立城镇居民消费函数，对各省市的居民消费结构进行对比分析。模型中的被解释变量CS为城镇居民人均全年消费支出，解释变量YD为城镇居民人均全年可支配收入（单位：元/人），变量均为年度数据，样本区间为1991-2004年。表11.5.1 29个省市地区的城镇居民家庭平均消费支出数据（单位：元/人）,利用19912004年29个省级地区城镇居民家庭年人均消费性支出和年人均可支配收入数据，用EViews建立面板数据估计模型步骤如下。11.5.1 建立合成数据库（Pool）对象首先建立工作文件。在打开工作文件窗口的基础上，点击EViews主功能菜单上的Objects键，选New Object功能，从而打开New Object（新对象）选择窗。在Type of Object选择区选择Pool（合并数据库），并在Name of Object选择区为混合数据库起名CS（初始显示为Untitled）。如图，点击OK键，从而打开混合数据库（Pool）窗口。在窗口中输入29个地区的标识AH（安徽）、BJ（北京）、ZJ（浙江），如图。,图11.5.1 Pool对象定义对话框,图11.5.2 Pool对象说明窗口,定义序列名并输入数据在新建的混合数据库（Pool）窗口的工具栏中点击Sheet键（第2种路径是，点击View键，选Spreadsheet(stacked data)功能），从而打开Series List（列出序列名）窗口，定义时间序列变量CS?和YD?（？符号表示与CS和YD相连的29个地区标识名）如图。点击OK键，从而打开混合数据库（Pool）窗口，（点击Edit+-键，使EViews处于可编辑状态）输入数据。输入完成后的情形见图。图所示为以截面为序的阵列式排列（stacked data）。点击Order+-键，还可以变换为以时间为序的阵列式排列。,图11.5.3 序列列表对话框,图11.5.4 序列的堆栈形式数据表,估计模型点击Estimation键，随后弹出Pooled Estimation（混合估计）对话窗（见图）。,图11.5.5 合成数据模型定义对话框,先对Pooled Estimation（混合估计）对话窗中各选项功能给以解释。Dependent Variable（被解释变量）选择窗：用于填写被解释变量。Sample（样本范围）选择窗：用于填写样本区间。Balanced Sample（平衡样本）选择块：点击打勾后表示用平衡数据估计。Common coefficients（系数相同）选择窗：用于填写对于不同横截面斜率相同的解释变量和虚拟变量。Cross section specific coefficients（截面系数不同）选择窗：用于填写对于不同横截面斜率不同的解释变量。,Intercept（截距项）选择窗：从中可以选None（无截距项）、Common（个体相同截距项）、Fixed effects（固定效应个体不同截距项）、Random effects（随机效应截距项）。Weighting（权数）选择窗：从中可以选No weighting（等权估计）、Cross section weights（按截面取权数）、SUR（似不相关回归）、iterate to convergence（迭代至收敛）。“等权估计”的方法是所有的观测值都给以相等的权数；“按截面取权数”的方法是以横截面模型残差的方差为权数，属于广义最小二乘法估计。“似不相关回归”的方法是利用横截面模型残差的协方差进行广义最小二乘法估计，该法将自动修正横截面中出现的异方差和短期自相关；“迭代至收敛”方法当选择广义最小二乘法估计时，点击此键将保证参数估计一直到收敛为止。,用EViews可以估计固定效应模型、随机效应模型、带有AR(1)参数的模型、截距不同回归系数也不同的面板数据模型。用EViews可以选择普通最小二乘法、加权最小二乘法（以截面模型的方差为权）、似不相关回归法估计模型参数。可以在Common coefficients选择窗和Cross section specific coefficients选择窗中填入AR(1)项。估计过程中的缺省方法是等权（No weighting）估计。还可以选择Cross section weights（按截面取权数）和SUR（似不相关回归）。,下面分别建立无个体影响的不变系数模型、变截距模型和变系数模型等，然后从中选择一个比较理想的模型作为我国的城镇居民消费函数，并对各省市的居民消费结构进行对比分析。1.无个体影响的不变系数模型模型形式为,其中：a为29个省市的平均自发消费倾向，b为边际消费倾向。EViews估计方法：在图合成数据模型定义对话框左上部的Dependent Variable选择窗填入被解释变量CS?，在中部的Common coefficients（系数相同）选择窗填入解释变量YD?，Cross section specific coefficients（截面系数不同）选择窗保持空白；Intercept选项选择窗点击Common，对话框Weighting（权数）选项点击No weighting。完成合成数据模型定义对话框后，点击OK键，得输出结果如表。,表11.5.3 无个体影响的不变系数模型估计结果,从表结果看，回归系数显著不为0，调整后的样本决定系数达0.99，说明模型的拟合优度较高。从结果看，平均消费倾向为0.76。2.固定效应变截距模型模型形式为,其中：ai为29个省市的自发消费倾向，用来反映省市间的消费结构差异，b为边际消费倾向。EViews估计方法：在EViews的Pooled Estimation对话框中Intercept选项中选Fixed effects。其余选项同上。得输出结果如表。表11.5.4 固定效应变截距模型估计结果,表中给出了变截距模型估计结果，表中的系数0.741232为边际消费倾向，后面三项是估计标准误、检验统计量值和相伴概率。表中下半部是各地区截距估计值。输出结果的方程形式见表。表11.5.5 我国城镇居民消费函数（固定效应变截距模型）,表结果表明，回归系数显著不为0，调整后的样本决定系数达0.99，说明模型的拟合优度较高。从估计结果可以看出，对于本例中的29个省市来说，虽然它们的居民消费倾向相同，但是其居民的自发消费存在显著的差异，其中北京、广东是居民自发消费最高的2个地区，而居民自发消费最低的是江西。3.随机效应变截距模型模型形式为,其中：a为29个省市的平均自发消费倾向，b为边际消费倾向，vi为随机变量，代表i地区的随机影响，用来反映省市间的消费结构差异。EViews估计方法：在EViews的Pooled Estimation对话框中Intercept选项中选Random effects（随机效应截距项），其余选项同上。随机影响变截距模型输出结果如表。,表11.5.6 随机影响变截距模型估计结果,回归结果如下：,表11.5.7 各地区随机影响的变截距模型估计结果,从表给出的估计结果可以看出，在29个省市中，自发消费最高的为北京，其次为广东，最低的是江西，该结果与表中所得到的结果基本相一致。4.Hausman检验与面板数据单位根检验在表输出结果窗口中点击View键，选FixedRandom Effects TestingCorrelated Random Effect-Hausman Test功能，可以直接获得如表的Hausman检验结果(主要结果)。,表11.5.8 Hausman检验结果,表中第1部分给出的是Hausman检验结果。Hausman统计量的值是4.264457，相对应的概率是0.0389，说明检验结果拒绝了随机效应模型原假设，应该建立个体固定效应模型。图中第2部分给出的是Hausman检验中间结果比较。0.741232是个体固定效应模型对参数的估计，0.742728是随机效应模型对参数的估计。0.000001是相应两个参数估计量的分布方差的差(Var(Diff)。综上分析，19912004年中国29个省级地区城镇居民人均消费和人均可支配收入问题应该建立个体固定效应回归模型。人均消费平均占人均收入的74.12。随地区不同，自发消费(截距项)存在显著性差异。,面板数据是单位根检验:以变量CP为例。在工作文件窗口中打开CP变量的29个数据组，点击View键，选Unit Root Test功能，打开面板数据单位根检验(Group Unit Root Test)对话框如图，共有6个选项区。,图11.5.6 单位根检验定义对话框,选择默认值，点击图窗口中的OK键，得29个地区的CP序列的单位根检验综合结果如表。5种检验方法的结论都认为29个CP序列存在单位根。,表11.5.9 面板单位根检验结果,5.固定效应变系数模型（OLS法）模型形式为,其中：ai为29个省市的自发消费倾向，bi为边际消费倾向，两者用来反映省市间的消费结构差异。EViews估计方法：在Common coefficients（系数相同）选择窗保持空白；在Cross section specific coefficients（截面系数不同）选择窗填入YD?；在Intercept（截距项）选择窗中选Fixed effects；其余选项同上。固定影响变系数模型输出结果如表。表11.5.10 固定影响变系数模型估计结果,表中给出了变系数模型估计结果，表上部第2列是各地区的边际消费倾向估计值，后面3列是估计标准误、检验统计量值和相伴概率。表中部是各地区截距估计值。表下部是整个回归方程的拟合优度、F统计量、DW统计量等指标。输出结果的方程形式见表。表11.5.11 我国城镇居民消费函数（固定影响变系数模型）,表结果表明，回归系数显著不为0，F统计量较大（p值显著），调整后的样本决定系数达0.996，说明模型的拟合优度较高。从估计结果可以看出，29个省级地区的居民家庭消费需求结构具有明显的差异。在29个省市中，边际消费倾向最高是陕西，其次是四川、宁夏、湖南，而边际消费倾向较低的是江西，最低的是河南。以上建立了无个体影响的不变系数模型、变截距模型和变系数模型，样本数据究竟属于哪一种面板数据模型形式，需要通过F检验来完成。,型拟合样本。6.固定影响变系数模型（GLS法）以上建立的消费函数模型使用的是普通最小二乘法，由于各省市的城镇居民消费结构存在一定程度上的差异，所以可以使用广义最小二乘法GLS(Cross section weights)，即以横截面模型残差的方差为权数对模型进行估计。EViews估计方法：在Cross section specific coefficients（截面系数不同）选择窗填入YD?，在Intercept（截距项）选择窗中选Fixed effects，在Weighting（权数）选择窗选择C

注意事项

本文（《面板数据模型经典》PPT课件.ppt）为本站会员（牧羊曲112）主动上传，三一办公仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三一办公（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。