[经管营销]EVIEWS用面板数据模型预测.doc
《[经管营销]EVIEWS用面板数据模型预测.doc》由会员分享,可在线阅读,更多相关《[经管营销]EVIEWS用面板数据模型预测.doc(50页珍藏版)》请在三一办公上搜索。
1、第8讲 用面板数据模型预测1面板数据定义时间序列数据或截面数据都是一维数据。时间序列数据是变量按时间得到的数据;截面数据是变量在固定时点的一组数据。面板数据是同时在时间和截面上取得的二维数据。面板数据也可以定义为相同截面上的个体在不同时点的重复观测数据或者称为纵向变量序列(个体)的多次测量。所以,面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据示意图见图1。面板数据从横截面(cross section)看,是由若干个体(entity, unit, individual)在某一时
2、点构成的截面观测值,从纵剖面(longitudinal section)看每个个体都是一个时间序列。图1 N=15,T=50的面板数据示意图图2是19782005年中国各省级地区消费性支出占可支配收入比率序列图。图2 1978-2005年中国各省级地区消费性支出占可支配收入比率序列图(价格平减过)面板数据用双下标变量表示。例如yi t, i = 1, 2, , N; t = 1, 2, , Ti对应面板数据中不同个体。N表示面板数据中含有N个个体。t对应面板数据中不同时点。T表示时间序列的最大长度。若固定t不变,yi ., ( i = 1, 2, , N)是横截面上的N个随机变量;若固定i不变
3、,y. t, (t = 1, 2, , T)是纵剖面上的一个时间序列(个体)。这里所讨论的面板数据主要指时期短而截面上包括的个体多的面板数据。利用面板数据建立模型的好处是:(1)由于观测值的增多,可以增加估计量的抽样精度。(2)对于固定效应回归模型能得到参数的一致估计量,甚至有效估计量。(3)面板数据建模比单截面数据建模可以获得更多的动态信息。例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。对于面板数据yi t, i =
4、1, 2, , N; t = 1, 2, , T,如果每个个体在相同的时期内都有观测值记录,则称此面板数据为平衡面板数据(balanced panel data)。若面板数据中的个体在相同时期内缺失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。案例1:1996-2002年中国东北、华北、华东15个省级地区的居民家庭固定价格的人均消费(CP)和人均收入(IP)关系研究(file:5panel02)1996-2002年中国东北、华北、华东15个省级地区的居民家庭固定价格的人均消费(CP)和人均收入(IP)数据见file:panel02。数据是7年的,每
5、一年都有15个数据,共105组观测值。人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消费面板数据按个体连线见图3,按截面连线见图4。人均收入面板数据按个体连线见图5,按截面连线见图6。图3 15个省级地区的人均消费序列(个体)(file:5panel02)图4 7个人均消费横截面数据(含15个地区) (每条连线表示同一年度15个地区的消费值) 图5 15个省级地区的人均收入序列(个体)(file:5panel02)图6 7个人均收入横截面数据(含15个地区) (每条连线表示同一年度15个地区的收入值)用CP表示消费,IP表示收入。AH, BJ, FJ, HB, HLJ, JL
6、, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。图7 人均消费对收入的面板数据散点图(15个时间序列叠加)图8 人均消费对收入的面板数据散点图(7个截面叠加)15个地区7年人均消费对收入的面板数据散点图见图7和图8。图7中每一种符号代表一个省级地区的7个观测点组成的时间序列。相当于观察15个时间序列。图8中每一种符号代表一个年度的截面散点图(共7个截面)。相当于观察7个截面散点图的叠加。 为了观察得更清楚,图9给出北京和内蒙古1996
7、-2002年消费对收入散点图。从图中可以看出,无论是从收入还是从消费看内蒙古的水平都低于北京市。内蒙古2002年的收入与消费规模还不如北京市1996年的大。图10给出该15个省级地区1996和2002年的消费对收入散点图。6年之后15个地区的消费和收入都有了相应的提高。 图9 北京和内蒙古1996-2002年消费对收入散点图 图10 1996和2002年15个地区的消费对收入散点图2面板数据模型分类用面板数据建立的模型通常有3种,即混合回归模型、固定效应回归模型和随机效应回归模型。2.1 混合回归模型(Pooled model)。如果一个面板数据模型定义为, yit = a + Xit b +
8、eit, i = 1, 2, , N; t = 1, 2, , T (1)其中yit为被回归变量(标量),a表示截距项,Xit为k 1阶回归变量列向量(包括k个回归量),b为k 1阶回归系数列向量,eit为误差项(标量)。则称此模型为混合回归模型。混合回归模型的特点是无论对任何个体和截面,回归系数a和b都相同。如果模型是正确设定的,解释变量与误差项不相关,即Cov(Xit,eit) = 0。那么无论是N,还是T,模型参数的混合最小二乘估计量(Pooled OLS)都是一致估计量。2.2 固定效应回归模型(fixed effects regression model)。固定效应模型分为3种类型,
9、即个体固定效应回归模型、时点固定效应回归模型和个体时点双固定效应回归模型。下面分别介绍。2.2.1个体固定效应回归模型(entity fixed effects regression model)如果一个面板数据模型定义为, yit = ai + Xit b +eit, i = 1, 2, , N; t = 1, 2, , T (3)其中ai是随机变量,表示对于i个个体有i个不同的截距项,且其变化与Xit有关系;Xit为k 1阶回归变量列向量(包括k个回归量),b为k 1阶回归系数列向量,对于不同个体回归系数相同,yit为被回归变量(标量),eit为误差项(标量),则称此模型为个体固定效应回归
10、模型。个体固定效应模型(3)的强假定条件是,E(eitai, Xit) = 0, i = 1, 2, , Nai作为随机变量描述不同个体建立的模型间的差异。因为ai是不可观测的,且与可观测的解释变量Xit的变化相联系,所以称(3)式为个体固定效应回归模型。个体固定效应回归模型也可以表示为 yit = a1 D1 + a2 D2 + +aN DN + Xit b +eit, t = 1, 2, , T (4)其中Di =注意:(1)在EViews5.0输出结果中ai是以一个不变的常数部分和随个体变化的部分相加而成。(2)在EViews 5.0以上版本个体固定效应对话框中的回归因子选项中填不填c输
11、出结果都会有固定常数项。个体固定效应回归模型的估计方法有多种,首先设法除去ai的影响,从而保证b估计量的一致性。(详见第3节,面板数据模型估计方法。)下面解释设定个体固定效应回归模型的原因。假定有面板数据模型 yit = b0 + b1 xit +b2 zi +eit, i = 1, 2, , N; t = 1, 2, , T (5)其中b0为常数,不随时间、截面变化;zi表示随个体变化,但不随时间变化的难以观测的变量。以案例1为例,省家庭平均人口数就是这样的一个变量。对于短期面板来说,这是一个基本不随时间变化的量,但是对于不同的省份,这个变量的值是不同的。上述模型可以被解释为含有N个截距,即
12、每个个体都对应一个不同截距的模型。令ai = b0 +b2 zi,于是(5)式变为 yit = ai + b1 xit +eit, i = 1, 2, , N; t = 1, 2, , T (6)这正是个体固定效应回归模型形式。对于每个个体回归函数的斜率相同(都是b1),截距ai却因个体不同而变化。可见个体固定效应回归模型中的截距项ai中包括了那些随个体变化,但不随时间变化的难以观测的变量的影响。ai是一个随机变量。因为zi是不随时间变化的量,所以当对个体固定效应回归模型中的变量进行差分时,可以剔除那些随个体变化,但不随时间变化的难以观测变量的影响,即剔出ai的影响。以案例1(file:5pa
13、nel02)为例得到的个体固定效应模型估计结果如下:输出结果的方程形式是 = 安徽+ x1t = (515.6 - 36.3) + 0.70 x1t (55.0) = 北京+x2t = (515.6 + 537.6) + 0.70 x2t 。 (55.0) = 浙江+x15t = (515.6 + 198.6) + 0.70 x15t (55.0) R2 = 0.99, SSEr = 2270386, t0.05 (88) = 1.98从结果看,北京、上海、浙江是自发消费(消费函数截距)最大的3个地区。图11 EViwes5.1个体固定效应回归模型的估计结果2.2.2 时点固定效应回归模型(t
14、ime fixed effects regression model)如果一个面板数据模型定义为, yit = gt + Xit b +eit, i = 1, 2, , N (7)其中gt是模型截距项,随机变量,表示对于T个截面有T个不同的截距项,且其变化与Xit有关系;yit为被回归变量(标量),eit为误差项(标量),满足通常假定条件。Xit为k 1阶回归变量列向量(包括k个回归变量),b为k 1阶回归系数列向量,则称此模型为时点固定效应回归模型。时点固定效应回归模型也可以加入虚拟变量表示为 yit =g0 + g1 W1 + g2 W2 + +g T WT + Xit b +eit, i
15、 = 1, 2, , N; t = 1, 2, , T (8)其中Wt =设定时点固定效应回归模型的原因。假定有面板数据模型 yit = g0 + b1 xit +g2 zt +eit, i = 1, 2, , N; t = 1, 2, , T (9)其中b0为常数,不随时间、截面变化;zt表示随不同截面(时点)变化,但不随个体变化的难以观测的变量。以案例1为例,“全国零售物价指数”就是这样的一个变量。对于不同时点,这是一个变化的量,但是对于不同省份(个体),这是一个不变化的量。上述模型可以被解释为含有T个截距,即每个截面都对应一个不同截距的模型。令gt = g0 +g2 zt,于是(9)式变
16、为 yit = gt + b1 xit +eit, i = 1, 2, , N; t = 1, 2, , T (10)这正是时点固定效应回归模型形式。对于每个截面,回归函数的斜率相同(都是b1),gt却因截面(时点)不同而异。可见时点固定效应回归模型中的截距项gt包括了那些随不同截面(时点)变化,但不随个体变化的难以观测的变量的影响。gt是一个随机变量。以例1为例得到的时点固定效应模型估计结果见图11,代数式如下: =0 +1996 +xi1 = (2.6 + 105.9) + 0.7789 xi1 , t = 1996 (0.04) (74.6)=0 +1997 +xi2 = (2.6 +
17、134.1) + 0.7789 xi2 , t = 1997 (0.04) (74.6) =0 +2002 +xi7 = (2.6 - 93.9) + 0.7789 xi7 , t = 2002 (0.04) (74.6) R2 = 0.9867, SSEr = 4028843, t0.05 (97) = 1.982.2.3 个体时点固定效应回归模型(time and entity fixed effects regression model)如果一个面板数据模型定义为, yit = a0 +ai +gt + Xit b +eit, i = 1, 2, , N; t = 1, 2, , T (
18、11)其中yit为被回归变量(标量);ai是随机变量,表示对于N个个体有N个不同的截距项,且其变化与Xit有关系;gt是随机变量,表示对于T个截面(时点)有T个不同的截距项,且其变化与Xit有关系;Xit为k 1阶回归变量列向量(包括k个回归量);b为k 1阶回归系数列向量;eit为误差项(标量)满足通常假定(eit Xit, ai, gt) = 0;则称此模型为个体时点固定效应回归模型。个体时点固定效应回归模型还可以表示为, yit = a0 +a1 D1+a2 D2 +aN DN + g1W1+ g2W2 +g TWT + Xit b +eit, (12)其中 Di = (13)Wt =
19、(14)如果模型形式是正确设定的,并且满足模型通常的假定条件,对模型(12)进行混合OLS估计,全部参数估计量都是不一致的。正如个体固定效应回归模型可以得到一致的、甚至有效的估计量一样,一些计算方法也可以使个体时点双固定效应回归模型得到更有效的参数估计量。以例1为例得到的截面、时点固定效应模型估计结果如下:图12 EViwes 5.1截面、时点双固定效应模型估计结果注意:对于第1个截面(t=1)EViwes输出结果中把(a +ai +g1), (i = 1, 2, , N)合在一起。第2, , T个截面以此类推。输出结果如下: =0 +1+1996 + x1,1996 = 681.9 - 68
20、.6 - 75.3 + 0.67 x1,1996 (安徽省) =0 +2+1996 + x2,1996 = 681.9 + 617.2 - 75.3 + 0.67x2,1996(北京市) =0 +1+1997 +x1,1997 = 681.9 - 68.6 +23.6 + 0.67 x1,1997 (安徽省) =0 +2+1997 + x2,1997 = 681.9 + 617.2 + 0.67x2,1997,(北京市) =0 +15 +2002+x15,2002 =183.39 +870.42+23.6 + 0.67x15,2002(浙江省)R2 = 0.9932, SSEr = 20456
21、70, t0.05 (83) = 1.98回归系数为0.67,这与个体固定效应回归模型给出的估计结果0.70基本一致。在上述三种固定效应回归模型中,个体固定效应回归模型最为常用。2.3 随机效应模型对于面板数据模型 yit = ai + Xitb +eit, i = 1, 2, , N; t = 1, 2, , T (15)如果ai为随机变量,其分布与Xit无关; Xit为k 1阶回归变量列向量(包括k个回归量),b为k 1阶回归系数列向量,对于不同个体回归系数相同,yit为被回归变量(标量),eit为误差项(标量),这种模型称为个体随机效应回归模型(随机截距模型、随机分量模型)。其假定条件是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 经管营销 经管 营销 EVIEWS 面板 数据模型 预测
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-4560352.html