[经济学]Chapter16 面板数据.doc
《[经济学]Chapter16 面板数据.doc》由会员分享,可在线阅读,更多相关《[经济学]Chapter16 面板数据.doc(31页珍藏版)》请在三一办公上搜索。
1、面板数据I变截距模型1.1 Pooled Cross Section 数据Pooled cross section数据是指不同时点(可能)不同截面的数据。而面板数据是指不同时点相同截面的数据。在面板数据中,同一截面不同时点的观测值不会是独立的。因为,这些数值可能受到共同因素的影响。Panel data也叫做longitudinal data。混合数据增加了样本容量,因此提高了估计的精度和检验功效。同时,混合数据也被用于考察变量分布随着时间的变化,或者变量之间的关系随着时间的变化规律。考察的方法是加入时间虚拟变量。例:National Opinion Research Centers Gener
2、al Social Survey搜集了19721984年妇女就业、家庭等相关数据。利用数据分析家庭小孩个数的变化规律。控制变量包括:教育程度、年龄、种族、地区、生活环境(农村、城镇、小城市等)。(数据文件:fertil1.raw)kids = b0 + b1 educ + b2 age + b3 age2+ b4 race + b5 farm+ b6 town + b7 D74 + b8 D76 + b9 D78 + b10 D80 + b11 D82 +b12 D84 + ut 例:接受教育程度对工资的影响以及工资的性别差异 (File:cps.wfl;data file: cps78_85
3、.raw)模型设定:log(wage) = b0 + b1 y85 + b2 educ + b3 y85educ + b4 exper + b5 union + b6 female+ b7 y85 female + ut 模型估计:结论分析:例:废物焚化厂对周边房屋价格的影响 (File:kielmc.wfl;data file: kielmc.raw)Kiel and McClain (1995)研究了废物焚化厂对周边(North Andover, Massachusetts)房屋价格的影响。1978年有消息流传要在North Andover建立废物焚化厂,1981年正式动工(1985年正式
4、运营)。利用1978年、1981年的房屋价格数据检验:废物焚化厂周边的房屋价格低于远处的房屋价格。房屋价格为实际价格(排除物价指数的影响)。要分析废物焚化厂对周边房屋价格的影响,不能简单回归如下模型:rprice = b0 + b1 nearinc + u, 比如利用1981年的数据进行回归,那么b1体现了81年近处价格与远处价格的差异,但b1没有体现焚化厂对近处房屋价格的影响。因此,要分析焚化厂对近处房屋价格的影响,应该观察近处与远处的房屋价格在1981的差异年是否比1978年的差异有了明显的变化。方程设定如下:rprice =b0 + b1 y81 + b2 nearinc + b3 (y
5、81nearinc) + u,其中,nearinc为0-1虚拟变量。y81=0,nearinc =0,rprice =b0 + u。因此,b0体现了1978年远处的房屋平均价格。y81=0,nearinc =1,rprice =b0 +b2 + u。因此,(b0 +b2)体现了1978年近处的房屋价格,b2体现了1978年近处房屋价格与远处房屋价格的差异。y81=1,nearinc =0,rprice =b0 + b1 + u。(b0 +b1)体现了1981年远处的房屋价格,b1体现了远处房屋价格在81年与78年的差异。y81=1,nearinc =1,rprice =b0 + b1 + b2
6、 + b3 + u。(b0 + b1 +b2+ b3)体现了1981年近处的房屋价格,(b2+ b3)体现了1981年近处与远处的房屋价格差异。这样可以清晰地看出,b3体现了近处与远处的房屋价格在1981的差异年是否比1978年的差异。问题就归结于检验b3的显著性。练习题: 1 回归方程,进行检验并解释其含义。Log(rprice) =b0 + b1 y81 + b2 nearinc + b3 (y81nearinc) + u2 加入其它控制变量(房龄、距市中心距离、卧室数目等)重新回归方程进行检验。1.2 面板数据定义时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据
7、;截面数据是变量在截面空间上的数据。面板数据是同时在时间和截面上取得的二维数据。所以,面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据示意图见图1。面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时期构成的截面观测值,从纵剖面(longitudinal section)上看每个个体都是一个时间序列。面板数据用双下标变量表示。例如yi t, i = 1, 2, , N; t = 1, 2, , TN表示面板
8、数据中含有N个个体。T表示时间序列的最大长度。若固定t不变,yi ., ( i = 1, 2, , N)是横截面上的N个随机变量;若固定i不变,y. t, (t = 1, 2, , T)是纵剖面上的一个时间序列(个体)。例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。对于面板数据yi t, i = 1, 2, , N; t = 1, 2, , T,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,或者
9、每个个体的观测值个数是相同的,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中缺失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。例1:1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1和表2。数据是7年的,每一年都有15个数据,共105组观测值。人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消费和收入的面板数据从纵剖面观察分别见图2和图3。从横截面观察分别见图4和图5。横截面数据散点图的表现与观测值顺序有关。图4和图5中人均消费和收入观测值
10、顺序是按地区名的汉语拼音字母顺序排序的。表1 1999-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费数据(不变价格)地区人均消费1996199719981999200020012002CP-AH(安徽) 3282.466 3646.150 3777.410 3989.581 4203.555 4495.174 4784.364CP-BJ(北京) 5133.978 6203.048 6807.451 7453.757 8206.271 8654.433 10473.12CP-FJ(福建) 4011.775 4853.441 5197.041 5314.521 5522.762
11、6094.336 6665.005CP-HB(河北) 3197.339 3868.319 3896.778 4104.281 4361.555 4457.463 5120.485CP-HLJ(黑龙江) 2904.687 3077.989 3289.990 3596.839 3890.580 4159.087 4493.535CP-JL(吉林) 2833.321 3286.432 3477.560 3736.408 4077.961 4281.560 4998.874CP-JS(江苏) 3712.260 4457.788 4918.944 5076.910 5317.862 5488.829 6
12、091.331CP-JX(江西) 2714.124 3136.873 3234.465 3531.775 3612.722 3914.080 4544.775CP-LN(辽宁) 3237.275 3608.060 3918.167 4046.582 4360.420 4654.420 5402.063CP-NMG(内蒙古) 2572.342 2901.722 3127.633 3475.942 3877.345 4170.596 4850.180CP-SD(山东) 3440.684 3930.574 4168.974 4546.878 5011.976 5159.538 5635.770CP-
13、SH(上海) 6193.333 6634.183 6866.410 8125.803 8651.893 9336.100 10411.94CP-SX(山西) 2813.336 3131.629 3314.097 3507.008 3793.908 4131.273 4787.561CP-TJ(天津) 4293.220 5047.672 5498.503 5916.613 6145.622 6904.368 7220.843CP-ZJ(浙江) 5342.234 6002.082 6236.640 6600.749 6950.713 7968.327 8792.210资料来源:中国统计年鉴1997
14、-2003。表2 1999-2002年中国东北、华北、华东15个省级地区的居民家庭人均收入数据(不变价格)地区人均收入1996199719981999200020012002IP-AH(安徽) 4106.251 4540.247 4770.470 5178.528 5256.753 5640.597 6093.333IP-BJ(北京) 6569.901 7419.905 8273.418 9127.992 9999.700 11229.66 12692.38IP-FJ(福建) 4884.731 6040.944 6505.145 6922.109 7279.393 8422.573 9235.
15、538IP-HB(河北) 4148.282 4790.986 5167.317 5468.940 5678.195 5955.045 6747.152IP-HLJ(黑龙江) 3518.497 3918.314 4251.494 4747.045 4997.843 5382.808 6143.565IP-JL(吉林) 3549.935 4041.061 4240.565 4571.439 4878.296 5271.925 6291.618IP-JS(江苏) 4744.547 5668.830 6054.175 6624.316 6793.437 7316.567 8243.589IP-JX(江
16、西) 3487.269 3991.490 4209.327 4787.606 5088.315 5533.688 6329.311IP-LN(辽宁) 3899.194 4382.250 4649.789 4968.164 5363.153 5797.010 6597.088IP-NMG(内蒙古) 3189.414 3774.804 4383.706 4780.090 5063.228 5502.873 6038.922IP-SD(山东) 4461.934 5049.407 5412.555 5849.909 6477.016 6975.521 7668.036IP-SH(上海) 7489.45
17、1 8209.037 8773.100 10770.09 11432.20 12883.46 13183.88IP-SX(山西) 3431.594 3869.952 4156.927 4360.050 4546.785 5401.854 6335.732IP-TJ(天津) 5474.963 6409.690 7146.271 7734.914 8173.193 8852.470 9375.060IP-ZJ(浙江) 6446.515 7158.288 7860.341 8530.314 9187.287 10485.64 11822.00资料来源:中国统计年鉴1997-2003。 图2 15个省
18、级地区的人均消费序列(纵剖面) 图3 15个省级地区的人均收入序列图4 15个地区的人均消费散点图(7个时期) 图5 15个地区的人均收入散点图(7个时期)(每条连线表示同一年度15个地区的消费值) (每条连线表示同一年度15个地区的收入值)用CP表示消费,IP表示收入。AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。15个地区7年人均消费对收入的面板数据散点图见图6和图7。图6中每一种符
19、号代表一个省级地区的7个观测点组成的时间序列,相当于观察15个截面上两个变量的时间序列数据的散点图。图7中每一种符号代表一个年度的截面散点图(共7个时期),相当于观察7个时期上两个变量的截面数据的散点图。图6 人均消费对收入的面板数据(15个时间序列叠加)图7 人均消费对收入的面板数据(7个时期叠加) 为了观察得更清楚一些,图8给出北京和内蒙古1996-2002年消费对收入散点图。从图中可以看出,无论是从收入还是从消费看内蒙古的水平都低于北京市。内蒙古2002年的收入与消费规模还不如北京市1996年的大。图9给出该15个省级地区1996和2002年的消费对收入散点图。可见6年之后15个地区的消
20、费和收入都有了相应的提高。 图8 北京和内蒙古1996-2002年消费对收入时序图 图9 1996和2002年15个地区的消费对收入散点图EViews文件说明(dataeviews-panel_cons.wfl)income_* :名义收入;consume_* :名义消费;ip_*:实际收入;cp_*:实际消费;p_*:价格指数。操作方法:建立工作文件(File)建立面板(Object)定义截面标示符(Define)定义变量名称(Sheet)拷贝数据(或通过Import导入数据)练习题:1 利用Consume.xls建立Eviews工作文件2 观察不同截面的cp(ip)的时间趋势图; (如果是
21、建立pool,需要将Stacked文件按照时间将原文件拆分,即新文件的结构是截面数据)3 观察不同截面的cp和ip的散点图;(需要建立stack文件,将不同时期的横轴变量罗列成一个变量;将不同时期的纵轴变量拆分成T个变量,然后用scatter观察:即第一个变量对所有其他变量的散点图)4 观察不同时期上cp(ip)的截面图;(如果是建立pool,需要将Stacked文件按照截面将原文件拆分,即新文件的结构是时间序列数据)5 观察不同时期上cp和ip的散点图;(需要建立stack文件,将不同截面的横轴变量罗列成一个变量;将不同截面的纵轴变量拆分成N个变量,然后用scatter观察:即第一个变量对所
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 经济学 经济学Chapter16 面板数据 Chapter16 面板 数据
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-4559905.html