计量经济学庞浩-第三版-课件.ppt
1,第八章虚拟变量回归,计量经济学,引子:定性因素对房地产价格有显著影响吗,不断走高的房地产价格已经成为人们关注的重点。很多研究认为,影响商品房价格的因素有多个方面。有关研究表明1,影响商品房价格的因素可分为两类:一类是比较容易量化的定量因素。例如:成本费用因素、房地产供求因素、经济因素、人口因素等。另一类则是不易量化的定性因素。例如:社会因素、区域因素、个别因素、房地产投机因素、自然因素等。这些因素的基本特征则是不易量化的定性因素。,2,1.徐静;武乐杰,房地产价格影响因素的解释结构模型分析,金融经济,2009年10期,显然,在研究房地产价格影响机理时,需要分析那些不易量化的定性因素对房地产价格是否真的有显著影响。能否把定性的因素也引入计量经济模型中呢?怎样才能在模型中有效地表示这些定性因素的作用呢?,3,4,问题的一般性描述,在前面各章的分析中,被解释变量主要是受可以直接度量的定量因素的影响,如收入、产出、商品需求量、价格、成本、资金、人数等。但现实经济生活中,影响被解释变量变动的因素,除了可以直接观测数据的定量变量外,可能还包括一些本质上为定性因素的影响,例如性别、种族、职业、季节、文化程度、战争、自然灾害、政府经济政策的变动等。,在实际的经济分析中,这些定性因素有时具有不可忽视的重要作用。例如,研究居民收入水平时,职业、性别、文化程度、就业的地域等因素,通常是值得考虑的影响因素。因此,在计量经济学的建模中有必要将定量因素和定性因素同时纳入回归模型之内。,5,本章要研究的主要问题是:1.如何将作为解释变量的定性因素引入回归模型?2.这些定性解释变量在回归模型中有何特殊的作用?,6,7,第八章 虚拟变量回归,本章主要讨论:虚拟变量 虚拟解释变量的回归 虚拟被解释变量的回归(选讲,不包括),8,第一节 虚拟变量,本节基本内容:基本概念 虚拟变量设置规则,9,一、基本概念,定量因素:可直接测度、数值性的因素。定性因素:属性因素,表征某种属性存在与否的 非数值性的因素。基本思想:直接在回归模型中加入定性因素存在诸多的困难(那些困难?),是否可将这些定性因素进行量化,以达到定性因素能与定量因素有着相同作用之目的。,10,计量经济学中,将取值为0和1的人工变量称为虚拟变量。虚拟变量也称:哑元变量、定性变量等等。通常用字母D或DUM加以表示(英文中虚拟或者哑元Dummy的缩写)。对定性变量的量化可采用虚拟变量的方式实现。,虚拟变量的定义,11,虚拟变量的设置规则涉及三个方面:1.“0”和“1”选取原则 2.属性(状态、水平)因素与设置虚拟变量数量的关系 3.虚拟变量在回归分析中的角色以及作用等方面的问题,二、虚拟变量设置规则,12,“0”和“1”选取原则,虚拟变量取“1”或“0”的原则,应从分析问题的目的出发予以界定。从理论上讲,虚拟变量取“0”值通常代表比较的基础类型;而虚拟变量取“1”值通常代表被比较的类型。“0”代表基期(比较的基础,参照物);“1”代表报告期(被比较的效应)。,13,14,15,16,研究居民住房消费支出 和居民可支配收入 之间的数量关系。回归模型的设定为:现在要考虑城镇居民和农村居民之间的差异,如何办?为了对“城镇居民”、“农村居民”进行区分,分析各自在住房消费支出 上的差异,设 为城镇;为农村,则模型为(模型有截距,“居民属性”定性变量只有两个相互排斥的属性状态(),故只设定一个虚拟变量。),一个例子(虚拟变量陷阱),17,综上可知:1.引入虚拟变量的个数与两个因素有关;一是定性变量的属性多少,一是有无截距项;2.对虚拟变量的运用要谨慎,虚拟变量的使用得当常能发挥积极的作用,但在模型中引入虚拟变量的数量要适当,引入的虚拟变量的数量过度,则可能带来负面的影响。,18,19,虚拟变量既可作为被解释变量,也可作为解释变量,分别称其为虚拟被解释变量和虚拟解释变量。虚拟被解释变量的研究是当前计量经济学研究的前沿领域,如MacFadden、Heckmen等人的微观计量经济学研究,大量涉及到虚拟被解释变量的分析。本课程只是讨论虚拟解释变量的问题,虚拟变量在回归模型中的角色,20,第二节 虚拟解释变量的回归,本节基本内容:加法类型 乘法类型 虚拟解释变量综合应用,21,22,以加法方式引入虚拟变量时,主要考虑的问 题是定性因素的属性和引入虚拟变量的个数。分为四种情形讨论:(1)解释变量只有一个定性变量而无定量变量,而且定性变量为两种相互排斥的属性;(2)解释变量分别为一个定性变量(两种属性)和一个定量解释变量;,一、加法类型,23,(3)解释变量分别为一个定性变量(两种以上属性)和一个定量解释变量;(4)解释变量分别为两个定性变量(各自分别是两种属性)和一个定量解释变量;思考:四种加法方式引入虚拟变量会产生什么效应?,24,(1)一个两种属性定性解释变量而无定量变量的情形,25,(2)一个定性解释变量(两种属性)和一个定量解释变量的情形,26,共同的特征:截距发生改变(?),27,(3)一个定性解释变量(两种以上属性)和一个定量解释变量的情形,28,29,(4)两个定性解释变量(均为两种属性)和一个定量解释变量的情形,30,31,32,运用OLS得到回归结果,再用t检验讨论因素 是否对模型有影响。,33,加法方式引入虚拟变量的主要作用为:1.在有定量解释变量的情形下,主要改变方程 截距;2.在没有定量解释变量的情形下,主要用于方 差分析。,34,基本思想以乘法方式引入虚拟变量时,是在所设立的模型中,将虚拟解释变量与其它解释变量的乘积,作为新的解释变量出现在模型中,以达到其调整设定模型斜率系数的目的。或者将模型斜率系数表示为虚拟变量的函数,以达到相同的目的。乘法引入方式:(1)截距不变;(2)截距和斜率均发生变化;分析手段:仍然是条件期望。,二、乘法类型,35,模型形式:例:研究消费支出 受收入、年份状况 的影响,(1)截距不变的情形,36,(2)截距和斜率均发生变化,37,不同截距、斜率的组合图形,38,三、虚拟解释变量综合应用,所谓综合应用是指将引入虚拟解释变量的加法方式、乘法方式进行综合使用。基本分析方式仍然是条件期望分析。本节主要讨论(1)结构变化分析;(2)交互效应分析;(3)分段回归分析,39,(1)结构变化分析,结构变化的实质是检验所设定的模型在样本期内是否为同一模型。显然,平行回归、共点回归、不同的回归三个模型均不是同一模型。平行回归模型的假定是斜率保持不变(加法类型,包括方差分析);共点回归模型的假定是截距保持不变(乘法类型,又被称为协方差分析);不同的回归的模型的假定是截距、斜率均为变动的(加法、乘法类型的组合)。,40,例:比较改革开放前、后我国居民(平均)“储 蓄收入”总量关系是否发生了变化?模型的设定形式为:,41,显然,只要、不同时为零,上述模型就能刻画改革开放前后我国居民储蓄收入模型结构是否发生变化。,回归方程:,42,问题:1.本例中,平行、共点回归、不同的回归三模型的经济学背景解释是什么?2.如何进行结构变化判断?3.是否可对(2)、(3)分别进行 OLS 估计?为什么?4.若分别对(2)、(3)进行 OLS 估计应注意什么?,43,(2)交互效应分析,交互作用:一个解释变量的边际效应有时可能要依赖于另一个解释变量。为此,Klein和Morgen(1951)提出了有关收入和财产在决定消费模式上相互作用的假设。他们认为消费的边际倾向不仅依赖于收入,而且也依赖于财产的多少 较富有的人可能会有不同的消费倾向。,44,为了捕获该影响,设。假设边际消费倾向 依赖于财产。一个简单的表示方法就是。代入消费函数,有:由于 捕获了收入和财产之间的相互作用而被称为交互作用项。显然,刻画交互作用的方法,在变量为数量(定量)变量时,是以乘法方式引入虚拟变量的。,45,例:是否发展油菜籽生产与是否发展养蜂生产的差异对农副产品总收益的影响研究。模型设定为:(1)式中,以加法形式引入虚拟变量暗含何假设?,46,(1)式以加法形式引入,暗含的假设为:菜籽生产和养蜂生产是分别独立地影响农副品生产总收益。但是,在发展油菜籽生产时,同时也发展养蜂生产,所取得的农副产品生产总收益,可能会高于不发展养蜂生产的情况。即在是否发展油菜籽生产与养蜂生产的虚拟变量 和 间,很可能存在着一定的交互作用,且这种交互影响对被解释变量农副产品生产收益会有影响。,47,问题:如何刻画同时发展油菜籽生产和养蜂生产的交互作用?基本思想:在模型中引入相关的两个变量的乘积。区别之处在于,上页定义中的交互效应是针对数量变量,而现在是定性变量,又应当如何处理?,48,为了反映交互效应,将(1)变为:同时发展油菜籽和养蜂生产:发展油菜籽生产:发展养蜂生产:基础类型:,49,如何检验交互效应是否存在?若拒绝原假设,即交互效应对 产生了影响(应该引入模型)。,50,作用:提高模型的描述精度。虚拟变量也可以用来代表数量因素的不同阶段。分段线性回归就是类似情形中常见的一种。一个例子:研究不同时段我国居民的消费行为。实际数据表明,1979年以前,我国居民的消费支出 呈缓慢上升的趋势;从1979年开始,居民消费支出为快速上升趋势。如何刻画我国居民在不同时段的消费行为?,(3)分段回归分析,51,基本思路:采用乘法方式引入虚拟变量的手段。显然,1979年是一个转折点,可考虑在这个转折点作为虚拟变量设定的依据。若设 1979,当 时可引入虚拟变量。(为什么选择1979作为转折点?),52,(t1955,1956,2004),53,54,第三节 案例分析,为了考察改革开放以来中国居民的储蓄存款与收入的关系是否已发生变化,以城乡居民人民币储蓄存款年底余额代表居民储蓄(),以国民总收入GNI代表城乡居民收入,分析居民收入对储蓄存款影响的数量关系,并建立相应的计量经济学模型。,55,表8.1 国民总收入与居民储蓄存款 单位:亿元,数据来源:根据中国统计年鉴和中经网统计数据库数据整理。,56,为了研究19782011年期间城乡居民储蓄存款随收入的变化规律是否有变化,考证城乡居民储蓄存款、国民总收入随时间的变化情况,如图所示:,57,从上图中,尚无法得到居民的储蓄行为发生明显改变的详尽信息。若取居民储蓄的增量(YY),并作时序图如下。从图中可以看出,城乡居民的储蓄行为表现出了明显的阶段特征:在1996年、2000年、2005年、2007年和2009年有五个明显的转折点。,58,再从城乡居民储蓄存款增量与国民总收入之间关系的散布图看(下图),也呈现出了相同的阶段性特征。,为了分析居民储蓄行为在1996年2011年不同时期的数量关系,以1996、2000、2005、2007、2009年度的五个转折点作为依据,分别引入虚拟变量D1、D2、D3、D4、D5,这五个年度所对应的GNI分别为70142.5,98000.5,184088.6,251483.2和340320亿元。据此,我们设定了如下以加法和乘法两种方式同时引入虚拟变量的的模型:,59,60,对上式进行回归后,有:,61,R2=0.975981,F=176.0794 DW=2.8659,由于各虚拟变量前的参数估计量的t值均大于临界值,表明各解释变量的斜率系数在显著性水平 或 下显著地不等于0。于是,居民人民币储蓄存款年增加额的回归模型分别为:,62,63,表明六个时期居民储蓄增加额的回归方程在统计意义上确实有很大不同。1996年以前国民总收入每增加1亿元,平均说来居民储蓄存款的增加额为0.1327亿元,居民储蓄增加额随国民总收入增长的变动相对稳定。1996年以后随着国民总收入的增长居民储蓄存款的增加额在不同年份有增有减,呈现出明显的周期性变化。上述模型同城乡居民储蓄存款与国民总收入之间的散布图吻合,与这一时段中国的实际经济运行状况也是相符的。,64,需要指出的是,在上述建模过程中,主要是从教学的目的出发,说明运用虚拟变量的规则和方法,没有考虑通货膨胀等因素,也没有考虑时间序列数据的特殊问题。而在实证分析中,储蓄函数还应当考虑如通货膨胀、消费行为变动等其他因素以及平稳性问题。,65,1.虚拟变量是人工构造的取值为0和1的作为属性变量代表的变量。2.虚拟变量个数的设置有一定规则:在有截距项的模型中,若定性因素有 个相互排斥的类型,只能引入 个虚拟变量,否则会陷入所谓“虚拟变量陷阱”,产生完全的多重共线性。,第八章 小 结,66,3.在计量经济模型中,加入虚拟解释变量的途径有两种基本类型:一是加法类型;二是乘法类型。以加法方式引入虚拟变量改变的是模型的截距;以乘法方式引入虚拟变量改变的是模型的斜率。4.解释变量只有一个分为两种相互排斥类型的定性变量而无定量变量的回归,称为方差分析模型。,67,5.解释变量包含一个分为两种类型定性变量的回归时,只使用了一个虚拟变量;解释变量包含一个两种以上类型的定性变量的回归时,定性变量有 种类型,依据虚拟变量设置规则引入了 个虚拟变量。6.解释变量包含两个(或 个)定性变量的回归中,可选用了两个(或 个)虚拟变量去表示,这并不会出现“虚拟变量陷阱”。,68,7.以乘法形式引入虚拟解释变量的主要作用在于:对回归模型结构变化的检验;定性因素间交互作用的影响分析;分段线性回归等。,69,THANKS,第八章 结 束 了!,