第五章虚拟变量模型课件.ppt
《第五章虚拟变量模型课件.ppt》由会员分享,可在线阅读,更多相关《第五章虚拟变量模型课件.ppt(79页珍藏版)》请在三一办公上搜索。
1、第2节 虚拟解释变量模型,2,一 、截距变动模型和斜率变动模型,(一)包含一个虚拟变量的截距变动模型 假设只有一个定性因素影响被解释变量的变化,而且这个因素仅有两种特征,这时候只需要引入一个虚拟变量。,3,例5.1描述了一个包括正常年份和非正常年份(亚洲金融危机或SARS的影响)居民消费的样本,并建立了虚拟变量计量模型。,4,对 1 作t 检验,若 1 显著地不为0,我们就认为正常年份和非正常年份居民在消费行为上的差异是明显的。若 1 0,则正常年份的居民消费水平高于非正常年份的居民消费水平。,利用最小二乘法对式(5.1)进行估计,可得到,(5.6),5,(二)斜率变动模型 在实际问题中,斜率
2、单独变动出现的情形一般比较少,它指的是改变了变动的速率也就是弹性。 例如城镇居民家庭与农村居民家庭的消费函数, 在边际消费倾向(斜率)上可能会有所不同,假设它们的消费函数在截距项没有区别。,6,那么回归模型可记为,(5.7),其中,Yi=第个家庭的消费水平,Xi=第个家庭的收入水平,,7,式(5.7)可以表示为,(5.8)(5.9),8,(三)包含多个虚拟变量的截距变动模型 如果一个质的因素仅有两种特征,只需引入一个虚拟变量。但是,很多质的因素往往不只具有两个特征,例如全世界的国家可以分为发达国家、发展中国家、不发达国家。,9,我国少数民族在很多问题上有差异,所以当把民族作为虚拟变量时,不能简
3、单将其分为汉族和非汉族;季节因素是我们最常见的质的因素,它具有四个特征,按照前面的原则,我们要引入三个虚拟变量。,10,例如,我们用季度资料研究各种商品消费额在季节上有没有什么区别?可以建立模型如下:,(5.10),其中,Yt=季度的消费,Xt=季度的收入,对于四个季度,我们引入了三个虚拟变量:,11,这里,第四季度为基础类型,其截距项为0 。而其它三个季度的截距项分别为 0+ 1,0+ 2 ,0+ 3 。1,2 , 3 代表季节变动引起的消费差异。,12,四个季度的回归模型分别为,(5.11)(5.12)(5.13)(5.14),13,(四)截距和斜率同时变动模型 在多数情况下,质的因素不但
4、对回归模型的截距有影响,而且还会改变模型的斜率。,14,例如城镇居民和农村居民的消费函数不但在斜率上有差异,在截距上也是有可能不一致的,将两个问题同时考虑进来,我们可以得到回归方程,15,(5.15),式中,Yi=第个家庭的消费水平,Xi=第个家庭的收入水平,,16,1和 3 分别表示城镇居民家庭和农村居民家庭的消费函数在截距和斜率上的差异。,式(5.15)可以表示为,(5.16)(5.17),17,我们一般通过t 检验来判定它们之间是否有差异。 1.若10 ,30,则为截距和斜率同时变动模型; 2.若 10,3=0,则为截距变动模型; 3.若 1=0,3=0, 则表示城镇居民家庭和农村居 民
5、家庭有着完全相同的消费模式; 4.若 1=0,30,则为斜率变动模型,这种情况在现实中出现得不是很多。,18,下面,以我国城镇居民家庭储蓄模型为例,实际体会虚拟变量模型从建模到检验再到估计参数最后下结论的全过程。 【例5.2】已有数据资料为我国城镇居民家庭1955年至1985年人均收入和人均储蓄。根据经验,也就是先验信息,再通过某些检验,我们发现储蓄和收入有很强的相关关系而且收入的变化会引起储蓄的变化。,19,假定它们之间为线性关系,我们可以建立储蓄模型如下,式中,St=人均储蓄,Xt=人均收入,t=年份(t=1955,1956,1985)。,(5.18),20,把1955年作为基期并把该期的
6、价格水平定为100,再分别扣除包含在和中的物价上涨因素。用最小二乘法估计式(5.18),得到,R2 =0.833, DW=0.398,(5.19),21,模型(5.19)包含了这样一个假定,那就是在1955到1985年期间我国城镇居民家庭的储蓄行为大体保持不变。,22,这一假定实际上是行不通的,因为在十一届三中全会召开之后,居民的收入大大增加,而且与居民储蓄有关的许多重要因素在1979年以后发生了明显变化。在改革开放之前, 我国居民的收入水平仅仅能够维持温饱水平,根本不可能有多少储蓄。,23,1979年以后,我国居民的收入水平大幅度提高,同时,居民储蓄也在大幅度增长。从这些可以看出来,1979
7、年前后两个时期,我国居民的边际储蓄倾向有显著性差异。,24,在改革开放前的大多数年份, 我国的消费市场常常是供不应求, 许多商品要国家下达计划指标, 居民凭票证购买, 经常出现的问题是顾客即使有钱也难买到需要的商品, 就不得不把钱存起来。这时候的储蓄就带有非自愿的性质。,25,而在1979年以后, 物资逐渐丰富, 商品的买卖也取消了票证的限制, 消费者储蓄的主要目的之一是购买高档耐用消费品,储蓄不再具有“被迫”的性质。,26,为了验证城镇居民的储蓄行为是否有显著变化, 可以建立下面的截距和斜率同时变动模型。,(5.20),式中, St和Xt仍代表人均储蓄和人均收入, D为虚拟变量,,27,用最
8、小二乘法估计式(5.20), 可以得到,(5.21),28,其中, 参数估计值下面括号中的数字为统计值。显然, 在1979年前后储蓄模型的截距和斜率有明显差异。式(5.21)可以写为两个方程,(5.22)(5.23),29,由以上模型可知,我国城镇居民的边际储蓄倾向在1979年以前仅为0.004, 也就是收入增加1元, 储蓄平均增加4厘; 而从1979年到1985年这段时间, 城镇居民的边际储蓄倾向增至0.256。,30,然而, 在式(5.19)中得到的边际储蓄倾向却是0.17。很明显, 式(5.19)既不代表改革开放之前城镇居民的消费行为, 也不能正确描述1979年以后城镇居民储蓄与收入之间
9、的关系。,31,我们单从模型的拟合也可以看出引进虚拟变量可以改善估计效果。式(5.19)中的随机误差项存在正自相关(DW=0.398), 拟合优度效果也不太好(R2=0.833)。引入虚拟变量后的模型消除了自相关(DW=1.67), 判定系数也上升到0.967。所以, 虚拟变量的引入很有必要。,32,二、多个质的因素的虚拟变量模型,我们讨论的回归模型只包括一个质的因素,但是在很多情形下,往往有两个以上的质的因素影响回归模型的被解释变量。例如, 在考察居民的食品消费行为时, 可以考虑的质的因素有居民的性别、民族、受教育程度、地理区域等等。,33,再如, 除收入水平外, 冰琪凌消费量还会受到季节和
10、地区等质的因素影响。这些质的因素可能不仅仅改变模型的截距和斜率, 质的因素之间也往往有相互影响。例如, 高收入水平和低收入水平的居民在家电消费量上的差异会随着季节不同而改变的。 为了方便, 我们建立以下简单的食品消费模型 。,34,(5.24),35,式(5.24)中, Ct和At分别表示居民的食品消费和居民的收入, D1 , D2 , D3 , D4 , D5是虚拟变量,分别表示性别因素、年龄因素和学历因素。性别因素只有两个特征男和女,设一个虚拟变量D1 。,36,年龄分为三个层次,25岁以下、25到50岁和50岁以上,设二个虚拟变量D2和D3 。受教育程度分为三个层次,初中以下、高中和高中
11、以上,设二个虚拟变量D4 和D5 。模型中还有虚拟变量之间的乘积,考虑了截距项的各种变化可能。,37,Di取值不同,截距不同,如:,其余的依次类推。 6 和 7 为性别和年龄层次的相互影响系数。采用通常的统计检验方法对各种可能的情况进行检验。,38,例如,如果 1 在统计上显著说明性别这个质的因素会明显影响食品的消费量。同时, 2 在统计上显著,就表明25岁以下居民在食品消费上和别的层次的居民是有显著差异的,那么年龄也会是个很重要的影响因素。,39,上述假定虚拟变量仅仅影响回归模型的截距,由此可以推广到更一般的情形,也就是虚拟变量同时改变回归模型的截距和斜率,那样考虑得更周全,但是也会更复杂,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 虚拟 变量 模型 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-1862161.html