虚拟变量回归模型:计量经济学.ppt
《虚拟变量回归模型:计量经济学.ppt》由会员分享,可在线阅读,更多相关《虚拟变量回归模型:计量经济学.ppt(303页珍藏版)》请在三一办公上搜索。
1、计量经济学专题:,虚拟变量的回归与Probit模型、Logit模型,1、虚拟变量的性质,与有明确尺度量化了的变量(GDP、产量、价格、成本、汇率等)不同,虚拟变量是一种定性性质的变量,如性别、种族、国籍等只涉及“是”与“非”两种状态的变量。虚拟变量的取值只取0或1。1表示某种性质出现,0表示某种性质不出现。,例:研究性别差异对工资的影响。可以建立如下模型:其中:为工资水平,为虚拟变量:,如果影响工资的其他因素保持不变,由上述模型很容易得到:女性的平均工资水平:男性的平均工资水平:斜率反映了男性与女性的平均工资差别。,虚拟变量模型:,事例:Y表示工资收入,D1表示性别,Estimation Eq
2、uation:=Y=C(1)+C(2)*D1,则女性的平均工资为18单位、男性的平均工资为18+3.28=21.28单位,男性与女性的工资差别为3.28单位。,2、虚拟变量应用的扩展,同时含有一般变量与虚拟变量的模型(1)对一个普通变量与一个两分虚拟变量的回归,把工资差异模型扩展,工资收入还取决于工作年限,则上述模型可以变为:其中:为工作年限,为一个普通变量。,女性的平均工资水平:男性的平均工资水平:,男性与女性的工资与工作年限之间有相同的斜率,但有不同的截距,两者之间的平均工资相差 单位。如果模型中 通过显著性检验,则可以认为男性与女性之间存在工资差异。,注意:区分两种类别,只需要一个虚拟变
3、量,如果引入两个虚拟变量,则会造成多重共线性。一般来说,如果一个定性变量有m个类别,则只需要引入m1个虚拟变量就可以了。,(2)对一个普通变量与一个多分虚拟变量的回归,如:研究一个企业员工教育程度对工资的影响。假设教育程度分为3类:中学及以下教育程度、大学教育程度、研究生及以上教育程度。则模型可以设立为:,则模型可以设立为:其中,为某人的工资水平,为工作年限。,为虚拟变量:,中学及以下教育水平的员工平均工资水平:大学教育水平的员工平均工资水平:研究生及以上教育水平的员工平均工资水平:,模型含义:通过 的显著性检验判断教育水平是否对工资差异有显著的影响。,(3)对一个普通变量与两个两分虚拟变量的
4、回归,例:种族及性别差异对薪金的影响。假定薪金除了受工作年限、性别的影响之外,还受种族的影响。为某人的工资水平,为工作年限。,虚拟变量:,虚拟变量模型:,虚拟变量模型:,白人男性的工资水平:白人女性的工资水平:,其他人种男性的平均工资:其他人种女性的平均工资:,虚拟变量模型:,3、虚拟变量的实际应用,(1)虚拟变量可以用于研究制度变迁的影响,如:研究2001年中国加入WTO事件对中国进出口贸易的影响,可以建立如下方程:其中 的构造如下:2001年前的值设为0,2001年以后的值设为1,即:,衡量了中国加入WTO这一制度变化对中国进出口贸易的影响,虚拟变量也可以用来描绘一个外部冲击对被解释变量的
5、影响,如研究1998东亚金融危机对中国进出口贸易的影响,则可以在一个普通模型中引入一个虚拟变量D1998,D1998 1,如果t1998 0,如果t其他年份则D1998度量了1998年当年中国进出口贸易的异常变动。,(2)虚拟变量与普通变量相乘,可以分离普通变量的某些特征,如使用截面数据研究不同产业的FDI对中国就业增进的影响,可以建立如下方程:上式中,FDI为当年27个行业的截面数据,虚拟变量的设置如下,则上述回归就可以把FDI分解为三个不同产业的FDI并分别估算了这些产业FDI对就业增进的影响。,(3)虚拟变量可以用来对一些结构变化方程进行估计,检验方程的稳定性,如:检验1994年人民币汇
6、率并轨事件对人民币汇率与中国出口贸易的关系是否产生了根本的影响人民币汇率与出口贸易的关系可以建立一个如下简单模型:如果1994年人民币汇率并轨事件对人民币汇率与中国出口贸易的关系产生了根本的影响,则上述方程是不稳定的(1994年以前与1994年以后的关系不能用同一个方程来描述),如下:,1994年以前它们之间的关系为1994年以后它们之间的关系为分为两个方程估计将导致自由度的下降,设置一个虚拟变量则汇率的影响方程可以重新设置为:如果 任意一个通过了显著型检验,则说明在1994年前后汇率方程发生了结构型的变化,回归后,1994年以前的方程为:1994年以后的方程为:,数字实例:英国1946196
7、3年的个人储蓄与个人收入的数据。,检验重建时期(19461955)与重建后时期(19561963)英国的居民储蓄行为是否有结构性的变化。,即检验是否在重建时期(19461955)储蓄模型为:而重建后时期(19561963)储蓄模型为:,可以用虚拟变量建立一个模型:其中 为虚拟变量:,则重建时期的消费模型为:重建后时期的消费模型为:为截距差异,为斜率差异。,模型:,Estimation Equation:S=C(1)+C(2)*D1+C(3)*Y+C(4)*(D1*Y),截距差异、斜率差异,在统计上都通过了1的显著性检验,表明两个时期的回归结构是相异的。,相对于chow检验的优越性:(1)可以清
8、楚的知道两个时期的差异究竟是截距差异、斜率差异,还是截距差异与斜率差异共存。(2)由于合并而增加了自由度,提高了参数估计的精度。,注意:如果虚拟变量回归涉及到异方差问题,可以用前面提过的方法进行异方差调整。,二、虚拟变量作为被解释变量的回归,1、线性概率模型如研究家庭收入对住房拥有的影响,可以建立如下模型:其中X家庭收入 Y1,如果该家庭拥有住房 0,如果该家庭不拥有住房,上述模型等价于:线性概率模型存在的问题:1、残差非正态分布(为二项分布)2、残差异方差3、X越大(小),P越大(小),不能确保,一个好的概率模型要求(1)随着X的增加,P也增加,但永远不会超出0-1区间(2)P与X之间应该为
9、非线性关系,随着X增大,P趋向于1的速度应该越来越慢,随着X的缩小,P趋向于0的速度也应该越来越慢。,0,1,p,2、Probit模型,假定住房所有权回归中,第 个家庭对是否拥有住房的决定,依赖于一种不可观测的效用指数,而后者又按照某种方式取决于解释变量,比如说取决于收入:而且指数 的值越大,家庭拥有住房的概率就越高,拥有住房的决定如何与 发生关系呢?一个合理的假定就是对每一个家庭都有一个门槛值,当 时,该家庭拥有住房,否则不拥有,有:,概率模型,累积分布函数,3、Logit模型,如果累积分布函数取逻辑斯蒂函数形式,则可以建立一Logit模型,Probit模型与Logit模型分布函数的比较,0
10、,1,Probit分布函数,Logit分布函数,三种概率模型的比较:1、LPM具有常值的边际效应;而Probit与Logit模型边际效应减少2、Probit与Logit模型的解释变量的估计是使用累积分布函数来估计的,因此解释变量对被接受变量的边际效应不能按普通模型的字面含义解释3、一个经验的判断是:当解释变量的值不太大又不太小的时候,Probit模型的系数值除以2.5,Logit模型的参数值除以4,可以大致把他们的值与LPM的系数值相比较,更精确的比较应该使用他们的分布函数并计算其中F(x)为累积分布函数,g(x)为密度函数,4、Probit/Tobit模型报告McFadden R-squar
11、ed.,Tobit模型,受限因变量模型应用:住房所有权研究,我们想知道什么样的人在买房。问题:如果一个消费者不买房子,那么我们就得不到此类消费者住房支出的数据。我们只有买了房的消费者的数据。类似:社会保险的购买,只有保险者的数据,缺乏未购买保险者的数据。,4、概率模型的Eviews实现,计数模型,适用于被解释变量为大于0的整数离散型变量。在计数模型中,一般假定被解释变量的离散取值服从某种泊松分布(Poisson distribute),其分布函数为:其中,即随机变量y的均值与方差均为,若以表示影响的m个自变量,泊松回归模型就是描述服从泊松分布的目标变量y的均值与解释变量之间关系的回归模型,可以
12、表示为:,如果随机变量y的均值等于方差,那么泊松最大似然估计就是一致和有效的,但是,如果随机变量Y过度发散,方差大于均值,那么,一个可以替代的方法就是使用负二项回归模型(Negative Binomial Regression)来代替泊松回归模型进行估计。负二项回归模型在条件均值中 引入了一个独立的随机效应,从而扩展了泊松回归模型,即:,则负二项回归模型的回归形式为:,计数模型的Eviews实现,虚拟变量的应用实例:,论文:外商直接投资、产业结构与中国的出口竞争力,1、问题的提出相当多的研究文献认为,外商直接投资对东道国经济起着一种有利的促进作用。对东道国来说,特别是对作为发展中国家的东道国来
13、说,他们之所以愿意吸引跨国公司到本国来投资,一个重要的目的就是想通过这些外商直接投资来提升本国的工业及技术水平,促进本国的工业化进程。,二、中国出口产品的竞争力及FDI关系检验1、数据来源及说明,2、中国出口产品的竞争力及FDI关系的一般性检验Grubel-Lloiyd指数:,令则t1到t2中国出口比较优势的相对变化可以表示为:,3、中国产品的出口竞争力与FDI关系的模型检验A、首先以1994年为基年,检验1994年中国产品的出口竞争力在某种程度是否构成1997年跨国公司对中国FDI的直接原因,检验模型为:,其次,检验FDI与中国产品的出口竞争力之间是否与检验1具有相反的因果关系,即1997年
14、FDI是否1999年中国出口竞争力的部分原因,检验模型为:,第三个检验以1999年中国分行业的出口竞争力指数为被解释变量,以1997年分行业FDI及1994年中国分行业的出口竞争力指数为解释变量进行回归。检验模型为:,第四,用代表不同产品类型及不同要素密集类型的虚拟变量分别乘以FD I,把FDI分解为在不同产业(产品)部门的投资,来检验FDI对这些不同产业(产品)部门出口竞争力的影响,检验模型为:在上式中,为代表产品类型的虚拟变量,当等于1时表示产品类型为初级产品,等于0时表示产品类型为工业制成品。同样定义,当等于1时表示产品类型为工业制成品,等于0时表示产品类型为初级产品。,然后,检验在不同
15、要素密集类型产业的FDI对这些不同产业出口竞争力的影响,检验模型为:,三、结果分析及讨论(略),计量经济学专题(2),非平稳时间序列、虚假回归与ADF检验,1、非平稳的时间序列,定义:当时间序列的均值与方差随时间变化而变化时,这种时间序列称为非平稳的时间序列。大多数的经济时间序列时非平稳的时间序列,如GDP、物价水平、出口总额等时间序列,它们的均值与方差随时间的变化而变化。,非平稳的时间序列:19521993中国的不变价格的GDP与居民消费水平:,随机游走过程:随机游走过程的方差为无穷大:则,平稳的时间序列举例:,白噪声随机过程(均值为0,方差不随时间改变,随机变量之间非自相关),非平稳的时间
16、序列可以通过差分的方法变为平稳的时间序列。,2、非平稳时间序列的单整性,单整性:对于时间序列(随机过程),如果必须经过d次差分才能变换成为一个平稳的时间序列,而当进行d-1次差分仍是一个非平稳的随机过程,则称此时间序列具有d阶单整性。,如:一个时间序列经过一次差分之后变为平稳的随机过程,则称此过程为一阶的单整过程,记为,如果差分一次仍不平稳,第二次差分后才是一个平稳过程,则称此过程为二阶单整过程,用 表示。,注意平稳的随机过程不需要差分就已经是平稳的,因此平稳的时间序列的单整阶数为0,用 表示平稳的时间序列。单整过程指的是单整阶数大于0的过程,即非平稳的随机过程。,3、非平稳的时间序列与虚假回
17、归问题,当求两个相互独立非平稳时间序列的相关系数时,常常得到一个相关系数不为0的结论,当对几个相互独立的非平稳时间序列进行多元回归时,常常能得到一个具有统计显著性的回归函数,Granger-Newbold把这种现象称为虚假回归。,虚假回归的后果:传统的参数检验不再有效,参数估计值也不再具有渐近无偏特征。用常规的办法对非平稳时间序列进行统计推断时存在严重的问题。,4、非平稳时间序列的单位根(ADF)检验,(1)根据相关图的平稳性检验自相关函数自相关函数定义为:把 对k描点,所得出的图形叫相关图。,由于我们研究的仅仅是随机过程的一个样本,我们只能计算样本自相关函数,首先计算滞后k的样本协方差与样本
18、方差:,定义:其中n为样本容量,为样本均值。,如果一个时间序列为平稳的随机过程,那么,它的自相关系数近似的遵循均值为0,方差为的正态分布。,检验:伯克斯-皮尔斯Q检验。Q统计量:其中:n为样本容量,m为滞后长度。,Q统计量遵循自由度为m的 分布,检验标准为,当Q统计量大于临界的值时,拒绝全部为0的原假设,即拒绝时间序列平稳的原假设。(或P值小余临界的p值时,拒绝时间序列平稳的原假设),例:19521993中国的不变价格的GDP相关图,A、原始序列检验,非平稳,B、差分一次后的相关图,非平稳,C、差分两次后的相关图,平稳,(2)单位根检验(DF与ADF检验),DF检验的思想检验原始序列是否存在如
19、下关系:其中 为一白噪声误差项。如果 的系数为1,说明序列存在单位根,序列为非平稳的时间序列。,则检验的形式为:检验的假设为:,实际的检验方程为:相对应的检验假设为:,检验判断标准为:如果,则原假设不能拒绝,认为序列非平稳如果,则拒绝原假设,认为序列平稳,在实际检验中如不能拒绝原假设,说明序列 的单整阶数大于0,接着应该进一步检验序列 的单整阶数是否为1,即检验差分序列 的单整阶数是否为0。,DF检验的三种形式无截距项与趋势项:有截距项无趋势项:有截距项与趋势项:,由于DF检验只适合一阶的自回归 过程,对于 过程,使用ADF检验:,实例:19521993中国的不变价格的GDP:ADF检验,A、
20、原始序列ADF检验,检验结果,序列非平稳。,B、原始序列一阶差分ADF检验,B、原始序列二阶差分ADF检验,结论:检验结果,序列平稳,说明序列为一 过程。,计量经济学专题(3),非平稳时间序列回归与协整检验,1、协整的引入由于用非平稳的时间序列建立回归模型会带来虚假回归问题,导致用非平稳的时间序列建立的回归模型的估计结果毫无意义,因此在用非平稳的时间序列回归前必须对回归的序列做进一步的检验。,2、协整检验的思想在实际中,大多数时间序列时是平稳的,然而某些非平稳的时间序列的线性组合却有可能是平稳的。,经济理论认为,某些经济时间序列存在长期的均衡关系。如:收入与支出、工资与价格、进口与出口、货币发
21、行量与物价水平等。由于这些序列都是非平稳的时间序列,其方差与均值随时间的变化而变化,看起来这些非平稳的序列不会存在任何均衡的关系,但事实上若干个非平稳的时间序列的线性组合却有可能是平稳的序列,称具有这种性质的序列具有协整性,如果某些时间序列存在协整关系,这认为这些经济变量之间存在长期的均衡关系。,协整关系的另一种理解:如果两个或两个以上的非平稳变量存在长期均衡的关系,则长期均衡关系得到的误差序列是平稳的。,3、协整的定义用 表示N1阶的时间序列向量,如果:(1)所含有的所有变量都是 阶的;(2)如果存在一个N1阶向量,使得,则称的各分量存在b阶协整关系。称协整向量,的各元素称协整参数。,例如:
22、假定 均为一阶非平稳的时间序列,即:I(1),如果 具有如下关系:其中 I(0),则 表示长期均衡关系,表示非均衡误差,两个非平稳的时间序列 的线性组合为一平稳的时间序列,所以 具有协整关系。,4、协整的若干性质(1)一般来说,两个I(1)变量的线性组合也是I(1)的,但是对于两个具有协整关系的I(1)变量来说,以协整向量为参数的线性组合具有平稳性。,(2)当 为不同阶数的单整变量时,如:I(0),I(1),那么将不存在一个合适的 使得 成立,因为 不能解释 的变化。因此如果两个变量具有协整关系,那么他们必须具有相同的阶数;反过来,只有具有相同阶数的两个变量才有可能存在协整关系。,(3)对于两
23、变量的情形,其均衡关系是唯一的。如果三个或更多的变量存在长期均衡关系,情况要相对复杂。由不同阶数单整变量的组合,则最高阶的单整变量之间必须存在协整关系。其误差项的阶数与较低阶的单整序列的阶数相同。,以三变量为例:其中 的单整阶数可以不同,但 却有可能是平稳的。,比如:I(0),I(1),I(1),则 之间必须存在协整关系,且协整序列的单整阶数为0,即 I(0),由于 I(0),所以 I(0),这样模型才是合理的。,协整概念的提出对用非平稳的时间序列建立模型以及检验这些变量的长期均衡关系非常重要:,(1)当且仅当若干个非平稳变量具有协整关系时,有这些变量建立的模型才有意义,所以协整检验是检验虚假
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 虚拟 变量 回归 模型 计量 经济学
链接地址:https://www.31ppt.com/p-6360466.html