欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    《虚拟变量模型》PPT课件.ppt

    • 资源ID:5601114       资源大小:657.50KB        全文页数:56页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    《虚拟变量模型》PPT课件.ppt

    计量经济学理论方法EViews应用 郭存芝 杜延军 李春吉 编著,电子教案,本章将主要介绍经典单方程计量经济学模型中引入虚拟变量的问题。,第八章 虚拟变量模型,在前面几章中,主要介绍了经典线性回归模型及其在若干基本假定下的估计问题,并分析了一个或多个假定不满足时所产生的后果及其可能的改进措施。然而上述方法还不能解决经济生活中遇到的全部问题。,如何考察某一突发事件、性别、季节、受教育程度等对经济行为带来的影响?,例如:,第八章 虚拟变量模型,学习目的,了解虚拟变量、虚拟变量模型的概念,掌握虚拟变量设置的原则和引入模型的方法。,基本要求,1)认识到虚拟变量是建立计量经济学模型经常会遇到的问题;2)了解虚拟变量、虚拟变量模型的概念;3)掌握虚拟变量设置的原则、虚拟变量模型的建模方法及应用。,虚拟变量,虚拟变量模型,第八章 虚拟变量模型,第一节 虚拟变量,虚拟变量的引入,虚拟变量的设置原则,一、虚拟变量,为什么要引入“虚拟变量”?,如商品需求量、价格、收入、产量等,许多经济变量是可以定量度量的或者说是可以直接观测的,但是也有一些影响经济变量的因素无法定量度量或者说无法直接观测,如职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等。,为了能够在模型中反映这些因素的影响,并提高模型的精度,需要将它们人为地“量化”,这种“量化”通常是通过引入“虚拟变量”来完成的。,这种用两个相异数字来表示对被解释变量有重要影响而自身又没有观测数值的一类变量,称为虚拟变量(dummy variables)。,虚拟变量也称为哑变量或定性变量。,虚拟变量的特点是:,1虚拟变量是对经济变化有重要影响的不可测变量。,2虚拟变量是赋值变量,一般根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量,记为D。这是为了便于计算而把定性因素这样数量化的,所以虚拟变量的数值只表示变量的性质而不表示变量的数值。,基础类型和肯定类型取值为1;,一般地,在虚拟变量的设置中,,比较类型和否定类型取值为0。,例如:,1)表示性别的虚拟变量可取为,2)表示文化程度的虚拟变量可取为,3)表示地区的虚拟变量可取为,4)表示消费心理的虚拟变量可取为,5)表示天气变化的虚拟变量可取为,二、虚拟变量模型,同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型。,在模型中,虚拟变量可作为解释变量,也可作为被解释变量,但主要是用作解释变量。,其中,例如:,三、虚拟变量的引入,虚拟变量作为解释变量引入模型有两种基本方式:加法方式和乘法方式。,1.加法方式,上述职工薪金模型(8-1)中性别虚拟变量的引入就采取了加法方式,,女职工的平均薪金为:,男职工的平均薪金为:,从几何意义上看(图8-1),,图8-1 男女职工平均薪金示意图,则两个函数有相同的斜率,但有不同的截距。,例如:,在截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。,教育水平考虑三个层次:高中以下,高中,大学及其以上,这时需要引入两个虚拟变量:,模型可设定如下:,(8-2),高中以下:,E(Yi|Xi,D1i=0,D2i=0)=0+1Xi,高中:,大学及其以上:,E(Yi|Xi,D1i=1,D2i=0)=(0+2)+1Xi,E(Yi|Xi,D1i=0,D2i=1)=(0+3)+1Xi,图8-2 不同教育程度人员保健支出示意图,还可将多个虚拟变量引入模型中以考察多种“定性”因素的影响。,例如:,在职工薪金模型(8-1)的例子中,再引入学历的虚拟变量,则职工薪金的回归模型可设计如下:,于是,不同性别、不同学历职工的平均薪金分别由下面各式给出:,女职工本科以下学历的平均薪金:,男职工本科以下学历的平均薪金:,女职工本科以上学历的平均薪金:,男职工本科以上学历的平均薪金:,E(Yi|Xi,D1i=0,D2i=0)=0+1Xi,E(Yi|Xi,D1i=1,D2i=0)=(0+2)+1Xi,E(Yi|Xi,D1i=0,D2i=1)=(0+3)+1Xi,E(Yi|Xi,D1i=1,D2i=1)=(0+2+3)+1Xi,2.乘法方式,斜率的变化,例如:,根据消费理论,消费水平C主要取决于收入水平X。但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。,则消费模型可建立如下:,(8-4),这里,虚拟变量 Dt 以与 Xt 相乘的方式引入了模型中,从而可用来考察消费倾向的变化。,在E(t)=0的假定下,上述模型所表示的函数可化为:,正常年份:,反常年份:,图8-3 不同年份消费倾向示意图,如果在模型中同时使用加法和乘法两种方式引入虚拟变量,则回归线的截距和斜率都会改变。,例如:,显然在式(8-5)中,同时使用加法和乘法两种方式引入了虚拟变量。,在E(t)=0的假定下,上述模型所表示的函数可化为:,改革开放以前:,E(Yt|Xt,Dt=0)=0+1Xt,改革开放以后:,则其几何图形如图8-4所示。,E(Yt|Xt,Dt=1)=(0+1)+(1 2)Xt,3临界指标的虚拟变量的引入,在经济发生转折时,可通过建立临界指标的虚拟变量模型来反映。,例如:,进口消费品数量Y主要取决于国民收入X的多少,中国在改革开放前后,Y对X的回归关系明显不同。,则进口消费品的回归模型可建立如下:,(8-6),如果用OLS法得到该模型的回归方程为,(8-7),则两个时期进口消费品函数分别为,当tt*=1979时,当tt*=1979时,几何图形如图8-5所示,图8-5 转折期回归示意图,4数值变量作为虚拟变量引入,有些变量虽然是数量变量,即可以获得实际观测值,但在某些特定情况下把它选取为虚拟变量则是方便的,以虚变量引入计量经济学模型更加合理。,譬如年龄因素虽然可以用数字计量,但如果将年龄作为资料分组的特征,则可将年龄选作虚拟变量。,例如:,家庭教育经费支出不仅取决于其收入,而且与年龄因素有关。,按年龄划分为三个年龄组:618岁年龄组(中小学教育);1922岁年龄组(大学教育);其它年龄组。于是设定虚拟变量,则家庭教育经费支出模型可设定为,(8-8),其中,Yi是第i个家庭的教育经费支出;Xi是第i个家庭的收人;虚拟变量D1i、D2i分别表示第i家庭中是否有618岁和1922岁的成员。,5.虚拟变量交互效应分析,当分析解释变量对变量的影响时,大多数情形只是分析了解释变量自身变动对被解释变量的影响作用,而没有深入分析解释变量间的相互作用对被解释变量影响。,前面讨论的分析两个定性变量对被解释变量影响的虚拟变量模型中,暗含着一个假定:,两个定性变量是分别独立地影响被解释变量的,但是在实际经济活动中,两个定性变量对被解释变量的影响可能存在一定的交互作用,即一个解释变量的边际效应有时可能要依赖于另一个解释变量。,为描述这种交互作用,可以把两个虚拟变量的乘积以加法形式引入模型。,考虑下列模型,其中,Yi为农副产品生产总收益,Xi为农副产品生产投入,D1i为油菜籽生产虚拟变量,D2i为养蜂生产虚拟变量。这里,例如:,显然,(8-9)式描述了是否发展油菜籽生产与是否发展养蜂生产的差异对农副产品总收益的影响。,虚拟解释变量D1i和D2i是以加法形式引入的,那么暗含着假定:,油菜籽生产和养蜂生产是分别独立地影响农副产品生产总收益。,但是,在发展油菜籽生产时,同时也发展养蜂生产,所取得的农副产品生产总收益可能会高于不发展养蜂生产的情况。即在是否发展油菜籽生产与养蜂生产的虚拟变量D1i和D2i之间,很可能存在着一定的交互作用,且这种交互影响对被解释变量农副产品生产总收益会有影响。,为描述虚拟变量交互作用对被解释变量的效应,在(8-9)式中以加法形式引入两个虚拟解释变量的乘积,即,(1)基础类型:不发展油菜籽生产,也不发展养蜂生产时农副产品生产平均总收益,(2)比较类型:同时发展油菜籽生产和养蜂生产时,农副产品生产平均总收益,1为是否发展油菜籽生产对农副产品生产总收益的截距差异系数;2为是否发展养蜂生产对农副产品生产总收益的截距差异系数;3为同时发展油菜籽生产和养蜂生产时对农副产品生产总收益的交互效应系数。0 3组成截距水平。,其中,关于交互效应是否存在,可借助于交互效应虚拟解释变量系数的显著性检验来加以判断。如果t 检验表明交互效应D1iD2i在统计意义上显著时,说明交互效应对Yi存在显著影响。,四、虚拟变量的设置原则,每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1,即如果定性变量有m个类别,则只在模型中引入m-1个虚拟变量。,例如:,已知冷饮的销售量Y除受k个定量变量Xi的影响外,还受一个定性变量季节即春、夏、秋、冬四季变化的影响。要考察该四季的影响,只需引入三个虚拟变量即可:,则冷饮销售量的模型为,(8-13),在上述模型中,若再引入第四个虚拟变量,则冷饮销售模型变量为,(8-14),其矩阵形式为,(8-15),如果只取六个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则其中,所谓的“虚拟变量陷阱”,第二节 虚拟被解释变量,当虚拟变量作为被解释变量时,其作用是对某一经济现象或活动进行“是”与“否”的判断或决策。,研究是否购买商品住房、是否参加人寿或财产保险、是否能按期偿还贷款、新产品在市场上是否畅销、对某一改革措施所持的态度等。,例如:,例如:,假定我们要从一个截面样本度量汽车所有权的决定因素。,某些人有汽车,而其他人没有。假定这种所有权函数的决定因素是收入和职业,则可设定模型为:,(8-16),其中,Xi表示收入,,显然,这个模型中被解释变量是一个虚拟变量。,特征:,被研究的对象(即被解释变量)在受到多种因素影响时,其取值只有两种状态:“是”与“否”。,“二元型响应”现象,如何处理二元型响应被解释变量模型的估计、推断问题?,一、线性概率模型(LPM),二、Logit模型,一、线性概率模型(LPM),1什么是线性概率模型,其中,Xi为住户的收入;Yi为一虚拟变量,表示住户购买商品住房的情况,问题:,我们前面讨论的回归分析主要是研究E(Yi|Xi)=0+1 Xi的问题,即研究条件均值轨迹的问题,而在上述模型中,被解释变量是某种属性发生与否的状况,怎样把被解释变量某种属性发生与否的概率问题同条件均值的轨迹研究联系起来?,另外,若概率问题与条件均值轨迹能够联系起来的话,那么,我们所讨论的线性回归分析会出现什么问题?,由于E(i)=0,由(8-17),,另外,设Y有下列分布:,P(Yi=1)=pi,P(Yi=0)=1-pi,根据数学期望的定义,注意到事件Y=1是在给定收入X的条件下发生的,因此E(Yi)=E(Yi|Xi),于是有,表明购买商品用房的概率是收入的线性函数。,像(8-17)式那样,以虚拟变量作为被解释变量的模型的条件期望实际上等于随机变量Yi取值为1的条件概率。,即当住户的收入水平为X时,其购买商品住房的概率可表示成X的线性函数,故(8-17)式也被称为线性概率模型(LPM)。,显然,只要得到(8-17)式中0和1的估计量后,就可以估计出不同收入水平住户购买商品住房的概率。,2线性概率模型的估计,从形式上看,(8-17)式与普通的线性计量经济模型相似,是否能够运用OLS法直接对其进行估计呢?,答案是否定的。,因为直接采用OLS法对(8-17)式那样的模型进行估计,将会遇到一些特殊的问题,使得估计结果失去了合理的经济解释,因而需要寻求相应的处理方法。,问题:,(1)随机扰动项i的非正态性,在线性概率模型中,因为,显然,关于i的正态性假设不再成立。,直接运用OLS法对线性概率模型进行估计,对参数的估计不会产生太大影响。,说明:,(2)随机扰动项i的异方差性,Var(i)=Ei-E(i)2=E(i 2)=(1-0-1 Xi)2pi+(-0-1 Xi)2(1-pi)=(1-0-1 Xi)2(0+1 Xi)+(-0-1 Xi)2(1-0-1 Xi)=(0+1 Xi)(1-0-1 Xi)=pi(1-pi)(8-22),Yi=1时,P(i=1-0-1Xi)=pi;Yi=0时,P(i=-0-1 Xi)=1-pi,,根据方差的定义得,根据Yi的概率分布,有:,这里利用了式(8-20)。,Var(i)=pi(1-pi)(8-22),(8-22)式表明,当i满足E(i)=0和E(ij)=0(ij)时,i是异方差的。,这时利用OLS法所得的LPM的估计量不再具有最小方差的特性,且各参数估计量的标准差也不可信。,也就是说,LPM参数的OLS法估计量虽仍为线性无偏估计量,但不是最佳估计量。,怎样消除异方差性的影响?,思考:,可利用第六章中有关修正异方差的方法,可用加权最小二乘法修正异方差。,提示:,根据前面的讨论,已知LPM中i的方差是Yi条件期望的函数,故选择权重i的一种方法为,(8-23),对(8-17)式作变换,有,(8-24),在实践中为了估计i,进而估计LPM模型,可采取以下步骤:,(3)不满足0E(Yi|Xi)1的约束,在线性概率模型中,E(Yi|Xi)表示在给定X的条件下,事件Y发生的概率。,解决这一问题的二类方法是:,3非线性概率模型,应当指出的是,虽然我们可以采用WLS解决异方差性问题、增大样本容量减轻非正态性问题,通过约束迫使所估计的事件Y发生的概率落入01,但LPM与经济意义的要求不符:随着X的变化,X对pi的“边际效应”保持不变。,因此,表现概率平均变化比较理想的模型应当具有这样的特征:,(1)概率pi=P(Yi=1|Xi)随X的变化而变化,但永远不超出01区间。,(2)随着Xi-,pi0;Xi+,pi1。,符合这些特征的函数可用图8-6形象地刻画。,图8-6的模型满足0E(Yi|Xi)1以及pi是Xi非线性函数的假设,呈现出S型的曲线特征。因此可以设法找到符合这种S型曲线特征的函数形式来作为二元型响应计量经济模型的设定形式。,原则上,任何适当的、连续的、定义在实轴上的概率分布都将满足上述两个条件。对于连续随机变量来说,密度函数的积分代表概率的大小,也就是说,连续随机变量的(累积)分布函数(CDF)可以满足上述两个要求。通常选择逻辑斯蒂和正态分布的累积分布函数去设定非线性概率模型。当选用逻辑斯蒂分布时,就生成了Logit模型。,二、Logit模型,1Logit模型(对数单位模型)的基本概念,当选择用逻辑斯蒂分布函数(logistic distribution)去设定二元型响应计量经济模型时,有,其特征:,(1)zi+时,pi 1;zi-时,pi 0;zi=0时,pi=0.5。,(2)它有一个拐点,在拐点之前,随zi或Xi增大,pi的增长速度越来越快;在拐点之后,随zi或Xi增大,pi的增长速度越来越慢,逐渐趋近于1。,考虑到在估计中便利,我们采用以下变换:,(8-26),式中,比率pi/(1pi)通常称为机会比率,即所研究的事件(或属性)“发生”的概率与“没发生”的概率之比。机会比率的对数Li=lnpi/(1pi)称为对数单位,这里的对数单位Li不仅是 Xi的线性函数,而且也是的线性函数,所以,(8-26)式也称为Logit模型。,由于pi不仅对Xi是非线性关系,而且对0和1也是非线性关系,不能直接运用OLS法估计参数。必须设法把非线性关系转换为可以运用OLS法估计的线性形式。,2Logit模型的估计,上式表明,Xi变动一个单位,机会比率的对数平均变化1个单位。,Logit模型的以下特点:,随着pi从0变化到1,或zi从-变化到+,对数单位Li从-变化到+,即概率pi在0与1之间,但对数单位Li并不一定在0与1之间。,(2)虽然对数单位Li对Xi是线性的,但概率pi对Xi并不是线性的;,(3)注意Logit模型中参数的意义:1是Xi每变动一个单位时,对数单位Li(机会比率的对数)的平均变化,然而我们研究的目的并不是对数单位Li而是概率pi。,(4)如果设法估计出参数0和1,给定某一水平Xi=X0,若欲估计pi,可从(8-28)式设法计算出要估计的概率。,从计量经济学的角度引入随机扰动项,将(8-29)式改记为,(8-30),如何得到0和1的估计量呢?,(8-29),问题:,对(8-30)式直接估计会遇到以下困难:,(1)当事件发生时,pi=1,L i=ln(1/0);当事件没有发生时,pi=0,Li=ln(0/1),机会比率pi/(1pi)的对数都无意义,不能直接用OLS法估计模型,而只能采 用极大似然法(ML)估计参数。当样本容量n较大,可选用加权最小二乘法进 行估计。,(2)估计参数需要的机会比率的对数Li的数据无法观测。解决办法是对应于每 个 Xi,样本观测值个数n较大时,可利用整理汇总的数据,用相对频率作 为对pi的估计,并估计机会比率对数Li。,对(8-30)式直接估计会遇到以下困难:,(8-32),估计出i的方差以后,可用加权最小二乘法去估计参数,权数i为,(8-33),

    注意事项

    本文(《虚拟变量模型》PPT课件.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开