欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    《经济计量学》陈胜荣(计统系).ppt

    • 资源ID:5903676       资源大小:1.07MB        全文页数:249页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    《经济计量学》陈胜荣(计统系).ppt

    第三部分:经济计量学高级专题,Chp 12 单方程回归模型的几个专题,主要内容,动态经济模型伪回归:非平稳时间序列平衡性检验协整时间序列随机游走模型分对数模型小结,一、动态经济模型自回归和分布滞后模型,在前面所研究的Y与X的关系中,Y与X之间可能存在滞后关系,而不是同时期的考虑模型:Yt=A+B0Xt+B1Xt-1+B2Xt-2+ut形如上式的模型称为动态模型,或分布滞后模型。,滞后的原因:心理上的原因技术上的原因制度上的原因,对于一般的分布滞后模型:Yt=A+B0Xt+B1Xt-1+B2Xt-2+BkXt-k+ut(12-4)B0:短期冲击乘数B0+B1(+B2):中期或中间乘数B0+B1+Bk:长期乘数或总乘数。一般而言,预期B0B1B2,分布滞后模型的估计:几个问题:如何确定引入多少解释变量的滞后值?引入的滞后值越多,自由度就会损失随着自由度的减少,统计推断将变得越来越不可靠大样本情形下,虽无需考虑自由度,但可能会遇到多重共线性问题。,例12-1:圣路易斯模型考虑国民生产总值和货币供给、政府支出的关系。,问题:并非所有的滞后系数都显著,但却无法判断这些系数确实是不显著,还是受多重共线性的影响;M、E的有教学法滞后变量系数符号为负,在经济学上很难解释;M变化对GNP的短期影响(0.4)和长期影响(1.06)E变化对GNP的短期影响(0.08)和长期影响(0.01),分布滞后模型的估计方法:夸克模型(适应性预期和存货调整模型)将形如12-4的分布滞后模型转化为:Yt=C1+C2Xt+C3Yt-1+vt(12-7)其中,系数C2给出了单位Xt变化对Yt的均值值的短期影响;C2/(1-C3)则给出了单位Xt的持续变化对Yt均值的长期影响。,Yt=C1+C2Xt+C3Yt-1+vt=C1+C2Xt+C3(C1+C2Xt-1+C3Yt-2+vt-1)+vt=(C1+C1C3)+C2Xt+C2C3Xt-1+C3C3Yt-2+(C3vt-1+vt)=(C1+C1C3)+C2Xt+C2C3Xt-1+C3C3(C1+C2Xt-2+C3Yt-3)+(C3vt-1+vt)=(C1+C1C3+C1C3C3)+C2Xt+C2C3Xt-1+C2C3C3Xt-2+C3C3C3Yt-3+(C3vt-1+vt)=C1+(C2Xt+C2C3Xt-1+C2C3C3Xt-2+)+vt其中,Xt-i的系数之和正好为:C2/(1-C3),夸克模型减少了待估参数的个数,但也产生相应的问题:自变量非随机;若误差项vt序列相关,将导致估计量有偏且不一致;自回归模型中,传统的DW检验不再适用。,例12-2:调整后的基础货币增长率对名义GNP增长率的影响,美国,19601988例12-3:保证金与股票市场波动率,二、伪回归现象:非平稳时间序列,有些时候,包含时间序列数据的回归模型给出的结果是虚假的,或是可疑的,即表现上看结果很好,但进一步研究就值得怀疑。例:P284经验的判断方法:若R2d,则可能存在伪回归现象(Granger&Newbold)。,平稳时间序列:如果随机过程的均值和方差为常数,且两个时间的协方差仅与时间“距离”或时滞有关,而与计算协方差的时点无关,则称该随机过程是平稳的。均值:E(Yt)=方差:E(Yt-)2=2(自)协方差:k=E(Yt-)(Yt+k-),如果回归式是以一个非平稳的时间序列拟合另一个非平稳时间序列,就会产生伪回归现象。,三、平稳性检验单位根检验,设Yt代表某个随机时间序列:Yt=A1+A2t+CYt-1+ut:两边都减去Yt-1,得:Yt-Yt-1=A1+A2t+CYt-1-Yt-1+ut Yt=A1+A2t+A3Yt-1+ut,其中:A3=C-1因此,C=1A3=0;C1A30所提假设往往是:H0:C=1,H1:C1,实践中,上述假设意味着:01很少考虑,因为它意味着yt是发散的。实际上,若A10,在C1时,yt的均值就有一个指数上升趋势。,三、平稳性检验单位根检验,设Yt代表某个随机时间序列,检验步骤如下:估计如下回归方程:Yt=A1+A2t+A3Yt-1+ut(12-14)H0:A3=0,H1:A30A3=0等价于时间序列是非平稳的单位根假设进行DF检验单侧:如果估计得到的A3的t()值的绝对值大于临界的DF()值,则拒绝单位根假设,说明时间序列平稳,否则,不能拒绝单位根假设,从而时间序列是非平稳的。说明:由于t值经常是小于0的,所以也可以这么判定:若所得t值大于临界值,则不能拒绝H0,反之,则拒绝H0,例:P286,式12-15这也表明了式12-10所给出的OLS回归结果可能是虚假的,四、协整时间序列,上述分析表明式12-10的时间序列回归是虚假的。但两个变量之间可能存在着一种长期或均衡的关系时间序列的协整关系在回归方程12-10中,得到方程残差:et=PCEt-(-470.52+1.0006PDIt)把看作一个时间序列,利用单位根检验,得到如下结果(式12-17):t=0.209et-1表明,尽管PCE和PDI不是平稳的,但它们的线性组合却是平稳的,即两个时间序列是协整的,结论:在处理时间序列时,必须确保每个时间序列是平稳的,或者它们是协整的,否则,就可能陷入伪回归(无意义的回归),五、随机游走模型(Random walk model),考虑如下简单模型:Yt=Yt-1+ut利用递归关系,得到:从而E(Yt)=Y0,Var(Yt)=T2表明:Yt的方差不固定,而是随着T的增加不断变大。故依据前面给出的平稳时间序列定义,Yt是非平稳时间序列。,但我们也看到,Y的一阶差分却是平稳的,因为:E(Yt)=E(ut)=0Var(Yt)=Var(ut)=2故随机游走模型可以修改为如下形式:Yt=d+Yt-1+ut其中,d是一常数,此即为带漂移项的随机游走模型,d为漂移参数。,可以证明:E(Yt)=Y0+Td,Var(Yt)=T2因此有:带漂移项的随机游走模型,其均值和方差都随着时间不断增加。d为正,则Y的均值会随着时间不断增加;d为负,则Y的均值会随着时间不断减少。两种情形下Y的方差都随时间不断增大如果随机变量的均值和方差与时间有关,则它服从一个随机趋势(区别于确定性趋势5-23)。,图12-3 利用随机游走模型进行预测图启示:如果应变量Y和解释变量X是非平稳的,则较高的R2和较高的t值会让人误以为找到了两者之间的某种关系。事实上,较高的R2仅反映了二者具有相同的趋势,它们之间可能没有任何真正关系。这就是伪回归现象格兰杰和纽博尔德的观点:R2远大于DW值,则很可能存在伪回归现象。,六、分对数模型Logit Model,线性概率模型LPM进行OLS估计存在的问题:Y可以取0或1,但不能保证估计的Y值介于01之间;由于Y是二分变量,误差项也是二分的,因此,严格地说,不能假设这类模型的误差项服从正态分布;误差项存在异方差;模型假设Y发生的概率随解释变量线性增加。,六、分对数模型Logit Model,在应变量是二分变量的模型中,除了LPM外,目前讨论较多的还有两种Logit model分对数模型Probit model概率单位模型。,六、分对数模型Logit Model,考虑如下模型:其中,Pi代表概率上式可进一步改写成:,其中,Zi=B1+B2Xi,逻辑分布函数,六、分对数模型Logit Model,进一步地:其中,L称为分对数(Logit),形如上式的模型称为分对数模型。,(12-31),分对数模型的性质:随着P值在01之间变动(即Z在-+之间变动),分对数L在-+之间变动,即虽然概率在01之间,但是分对数却没有边界;虽然L对X是线性的,但它们的概率却不是线性的;模型12-31可纳入多个解释变量,包括虚拟变量;如果分对数L是正的,意味着Y等于1的几率随着解释变量的增加而增加,解释为:随着优势率从1减少到0,分对数为负,绝对值越来越大,随着优势率从1到无穷大,分对数为正,且越来越大。,对分对数模型正规的解释是:斜率B2度量X的单位变化引起的分对数L的改变量;LPM假定Pi与Xi线性相关,分对数模型假定概率的对数与Xi线性相关;给定具体的收入水平X*,如果想要估计拥有住房的概率而不是几率,一旦估计出B1和B2,则可以直接根据式(12-28)得到。下面介绍如何估计参数。,分对数模型的估计:关于数据的分类:个体数据:有时无法直接进行OLS估计,可考虑进行MLE。如:Li=ln(1/0)(有房)或Li=ln(0/1)(无房)分组或重复数据:,例12-4:预测银行倒闭,P293例12-5:吸烟与不吸烟,P294,七、小结,动态模型伪回归平稳性的检验协整随机游走分对数模型,16.1 动态经济模型,一、动态经济模型 二、分布滞后模型的参数估计 三、自回归模型的参数估计,在经济运行过程中,广泛存在时间滞后效应。某些经济变量不仅受到同期各种因素的影响,而且也受到过去某些时期的各种因素甚至自身的过去值的影响。,一、滞后变量模型,通常把这种过去时期的,具有滞后作用的变量叫做滞后变量(Lagged Variable),含有滞后变量的模型称为滞后变量模型。滞后变量模型考虑了时间因素的作用,使静态分析的问题有可能成为动态分析。含有滞后解释变量的模型,是动态模型(Dynamical Model)的一种。,1.滞后效应与与产生滞后效应的原因,因变量受到自身或另一解释变量的前几期值影响的现象称为滞后效应。表示前几期值的变量称为滞后变量。如:消费函数 通常认为,本期的消费除了受本期的收入影响之外,还受前1期,或前2期收入的影响:Ct=0+1Yt+2Yt-1+3Yt-2+tYt-1,Yt-2为滞后变量。,产生滞后效应的原因,1.心理因素:人们的心理定势,行为方式滞后于经济形势的变化,如中彩票的人不可能很快改变其生活方式。2.技术原因:如当年的产出在某种程度上依赖于过去若干期内投资形成的固定资产。3.制度原因:如定期存款到期才能提取,造成了它对社会购买力的影响具有滞后性。,2.动态经济模型,以滞后变量作为解释变量,就得到动态经济模型。它的一般形式为:,q,s:滞后时间间隔,自回归分布滞后模型(autoregressive distributed lag model,ADL):既含有Y对自身滞后变量的回归,还包括着X分布在不同时期的滞后变量。有限自回归分布滞后模型:滞后期长度有限 无限自回归分布滞后模型:滞后期无限,(1)分布滞后模型(distributed-lag model),分布滞后模型:模型中没有滞后被解释变量,仅有解释变量X的当期值及其若干期的滞后值:,0:短期(short-run)或即期乘数(impact multiplier),表示本期X变化一单位对Y平均值的影响程度。i(i=1,2,s):动态乘数或延迟系数,表示各滞后期X的变动对Y平均值影响的大小。,如果各期的X值保持不变,则X与Y间的长期或均衡关系即为:,称为长期(long-run)或总乘数(total multiplier),表示X变动一个单位,由于滞后效应而形成的对Y平均值总影响的大小。,2.自回归模型(autoregressive model),而,,称为一阶自回归模型(first-order autoregressive model)。,自回归模型:模型中的解释变量仅包含X的当期值与被解释变量Y的一个或多个滞后值,二、分布滞后模型的参数估计,无限期的分布滞后模型,由于样本观测值的有限性,使得无法直接对其进行估计。有限期的分布滞后模型,OLS会遇到如下问题:1.没有先验准则确定滞后期长度;,1.分布滞后模型估计的困难,2.如果滞后期较长,将缺乏足够的自由度进行估计和检验;3.同名变量滞后值之间可能存在高度线性相关,即模型存在高度的多重共线性。,2.分布滞后模型的修正估计方法,人们提出了一系列的修正估计方法,但并不很完善。,各种方法的基本思想大致相同:都是通过对各滞后变量加权,组成线性合成变量而有目的地减少滞后变量的数目,以缓解多重共线性,保证自由度。(1)经验加权法 根据实际问题的特点、实际经验给各滞后变量指定权数,滞后变量按权数线性组合,构成新的变量。权数据的类型有:,递减型:,即认为权数是递减的,X的近期值对Y的影响较远期值大。如消费函数中,收入的近期值对消费的影响作用显然大于远期值的影响。例如:滞后期为 3的一组权数可取值如下:1/2,1/4,1/6,1/8,即认为权数是相等的,X的逐期滞后值对值Y的影响相同。如滞后期为3,指定相等权数为1/4,则新的线性组合变量为:,矩型:,则新的线性组合变量为:,权数先递增后递减呈倒“V”型。例如:在一个较长建设周期的投资中,历年投资X为产出Y的影响,往往在周期期中投资对本期产出贡献最大。如滞后期为4,权数可取为 1/6,1/4,1/2,1/3,1/5则新变量为,倒V型,例 对一个分布滞后模型:,给定递减权数:1/2,1/4,1/6,1/8,令,原模型变为:,该模型可用OLS法估计。假如参数估计结果为:,=0.5,=0.8,则原模型的估计结果为:,经验权数法的优点是:简单易行;缺点是:设置权数的随意性较大,通常的做法是:多选几组权数,分别估计出几个模型,然后根据常用的统计检验(平方检验,检验,t检验,-检验),从中选择最佳估计式。,(2)阿尔蒙(lmon)多项式法,主要思想:针对有限滞后期模型,通过阿尔蒙变换,定义新变量,以减少解释变量个数,然后用OLS法估计参数。主要步骤为:第一步,阿尔蒙变换 对于分布滞后模型:,假定其回归系数i可用一个关于滞后期i的适当阶数的多项式来表示,即:,i=0,1,s,其中,ms-1。阿尔蒙变换要求先验地确定适当阶数k,例如取k=2,得:,(*),将(*)代入分布滞后模型:,得:,定义新变量,将原模型转换为:,第二步,模型的OLS估计,对变换后的模型进行OLS估计,得:,再计算出:,求出滞后分布模型参数的估计值:,由于m+1s,可以认为原模型存在的自由度不足和多重共线性问题已得到改善。,需注意的是,在实际估计中,阿尔蒙多项式的阶数m一般取2或3,不超过4,否则达不到减少变量个数的目的。,例 表给出了中国电力基本建设投资X与发电量Y的相关资料,拟建立一多项式分布滞后模型来考察两者的关系。,由于无法预见知电力行业基本建设投资对发电量影响的时滞期,需取不同的滞后期试算。,(13.62)(1.86)(0.15)(-0.67),经过试算发现,在2阶阿尔蒙多项式变换下,滞后期数取到第6期,估计结果的经济意义比较合理。2阶阿尔蒙多项式估计结果如下:,求得的分布滞后模型参数估计值为:,最后得到分布滞后模型估计式为:,为了比较,下面给出直接对滞后6期的模型进行OLS估计的结果:,(3)科伊克(Koyck)方法,科伊克方法是将无限分布滞后模型转换为自回归模型,然后进行估计。对于无限分布滞后模型:,科伊克变换假设i随滞后期i按几何级数衰减:,其中,01,称为分布滞后衰减率,1-称为调整速率(Speed of adjustment)。,科伊克变换的具体做法:,将科伊克假定i=0i代入无限分布滞后模型,得:,滞后一期并乘以,得:,(*),(*),将(*)减去(*)得科伊克变换模型:,整理得科伊克模型的一般形式:,科伊克模型的特点:,(1)以一个滞后因变量Yt-1代替了大量的滞后解释变量Xt-i,最大限度地节省了自由度,解决了滞后期长度s难以确定的问题;(2)由于滞后一期的因变量Yt-1与Xt的线性相关程度可以肯定小于X的各期滞后值之间的相关程度,从而缓解了多重共线性。,但科伊克变换也同时产生了两个新问题:(1)模型存在随机干扰项vt的一阶自相关性;(2)滞后被解释变量Yt-1与随机项vt不独立。这些新问题需要进一步解决。,三、自回归模型的参数估计,一个无限期分布滞后模型可以通过科伊克变换转化为自回归模型。事实上,许多滞后变量模型都可以转化为自回归模型,自回归模型是经济生活中更常见的模型。以适应预期模型以及局部调整模型为例进行说明。,1.自回归模型的构造,(1)自适应预期(Adaptive expectation)模型,在某些实际问题中,因变量Yt并不取决于解释变量的当前实际值Xt,而取决于Xt的“预期水平”或“长期均衡水平”Xte。例如,家庭本期消费水平,取决于本期收入的预期值;市场上某种商品供求量,决定于本期该商品价格的均衡值。,因此,自适应预期模型最初表现形式是:,由于预期变量是不可实际观测的,往往作如下自适应预期假定:,其中:r为预期系数(coefficient of expectation),0r 1。,该式的经济含义为:“经济行为者将根据过去的经验修改他们的预期”,即本期预期值的形成是一个逐步调整过程,本期预期值的增量是本期实际值与前一期预期值之差的一部分,其比例为r。这个假定还可写成:,将,得:,代入,将初始模型滞后一期并乘以(1-r),得:,(*),以(*)减去(*),整理得:,其中,可见自适应预期模型转化为自回归模型。,(*),(2)局部调整(Partial Adjustment)模型,局部调整模型主要是用来研究物资储备问题的。例如,企业为了保证生产和销售,必须保持一定的原材料储备。对应于一定的产量或销售量Xt,存在着预期的最佳库存Yte。局部调整模型的最初形式为:,Yte不可观测。由于生产条件的波动,生产管理方面的原因,库存储备Yt的实际变化量只是预期变化的一部分。,或:,(*),储备按预定水平逐步进行调整,故有如下局部调整假设:,其中,为调整系数,0 1将原方程式,可见,局部调整模型转化为自回归模型,代入,得:,2.自回归模型的参数估计,考伊克模型:,对于自回归模型:,估计时的主要问题:滞后被解释变量的存在可能导致它与随机扰动项相关,以及随机扰动项出现序列相关性。,自适应预期模型:,局部调整模型:,存在:滞后被解释变量Yt-1与随机扰动项t的异期相关性。,因此,对自回归模型的估计主要需视滞后被解释变量与随机扰动项的不同关系进行估计。以一阶自回归模型为例说明:,显然存在:,(1)工具变量法,若Yt-1与t同期相关,则OLS估计是有偏的,并且不是一致估计。因此,对上述模型,通常采用工具变量法,即寻找一个新的经济变量Zt,用来代替Yt-1。参数估计量具有一致性。,对于一阶自回归模型:,在实际估计中,一般用X的若干滞后的线性组合作为Yt-1的工具变量:,由于原模型已假设随机扰动项t与解释变量X及其滞后项不存在相关性,因此上述工具变量与t不再线性相关。一个更简单的情形是直接用Xt-1作为Yt-1的工具变量。,(2)普通最小二乘法,若滞后被解释变量Yt-1与随机扰动项t同期无关(如局部调整模型),可直接使用OLS法进行估计,得到一致估计量。,上述工具变量法只解决了解释变量与t相关对参数估计所造成的影响,但没有解决t的自相关问题。,注意:,事实上,对于自回归模型,t项的自相关问题始终存在,对于此问题,至今没有完全有效的解决方法。唯一可做的,就是尽可能地建立“正确”的模型,以使序列相关性的程度减轻。,例5.2.3 建立中国长期货币流通量需求模型,经验表明:中国改革开放以来,对货币需求量(Y)的影响因素,主要有资金运用中的贷款额(X)以及反映价格变化的居民消费者价格指数(P)。,长期货币流通量模型可设定为:,由于长期货币流通需求量不可观测,作局部调整:,(*),(*),将(*)式代入(*)得短期货币流通量需求模型:,对局部调整模型:,运用OLS法估计结果如下:,(-2.93)(2.86)(3.10)(2.87),最后得到长期货币流通需求模型的估计式:,注意:,尽管D.W.=1.733,但不能据此判断自回归模型不存在自相关(Why?)。但LM=0.7855,=5%下,临界值2(1)=3.84,判断:模型已不存在一阶自相关。,如果直接对下式作OLS回归,(-4.81)(58.79)(5.05),得,,可见该模型随机扰动项具有序列相关性,,16.6 分对数模型(二元选择模型),一、二元离散选择模型的经济背景 二、二元离散选择模型 三、二元Probit离散选择模型及其参数估计 四、二元Logit离散选择模型及其参数估计 五、一个实例,14.3 二元离散选择模型 Binary Discrete Choice Model,说明,在经典计量经济学模型中,被解释变量通常被假定为连续变量。离散被解释变量数据计量经济学模型(Models with Discrete Dependent Variables)和离散选择模型(DCM,Discrete Choice Model)。二元选择模型(Binary Choice Model)和多元选择模型(Multiple Choice Model)。本节只介绍二元选择模型。,一、二元离散选择模型的经济背景,二、二元离散选择模型,1、原始模型,其中Y为观测值为1和0的决策被解释变量,X为解释变量,包括选择对象所具有的属性和选择主体所具有的属性。,对于,问题在于:该式右端并没有处于0,1范围内的限制,实际上很可能超出0,1的范围;而该式左端,则要求处于0,1范围内。于是产生了矛盾。,对于随机误差项,具有异方差性。因为:,所以原始模型不能作为实际研究二元选择问题的模型。,2、效用模型,作为研究对象的二元选择模型,第i个个体 选择1的效用,第i个个体 选择0的效用,3、最大似然估计,欲使得效用模型可以估计,就必须为随机误差项选择一种特定的概率分布。两种最常用的分布是标准正态分布和逻辑(logistic)分布,于是形成了两种最常用的二元选择模型Probit模型和Logit模型。最大似然函数及其估计过程如下:,标准正态分布或逻辑分布的对称性,在样本数据的支持下,如果知道概率分布函数和概率密度函数,求解该方程组,可以得到模型参数估计量。,三、二元Probit离散选择模型及其参数估计,1、标准正态分布的概率分布函数,2、重复观测值不可以得到情况下二元Probit离散选择模型的参数估计,关于参数的非线性函数,不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。应用计量经济学软件。这里所谓“重复观测值不可以得到”,是指对每个决策者只有一个观测值。即使有多个观测值,也将其看成为多个不同的决策者。,3、重复观测值可以得到情况下二元Probit离散选择模型的参数估计,对每个决策者有多个重复(例如10次左右)观测值。对第i个决策者重复观测ni次,选择yi=1的次数比例为pi,那么可以将pi作为真实概率Pi的一个估计量。,建立“概率单位模型”,采用加权最小二乘法估计。,*四、二元Logit离散选择模型及其参数估计,1、逻辑分布的概率分布函数,2、重复观测值不可以得到情况下二元logit离散选择模型的参数估计,关于参数的非线性函数,不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。应用计量经济学软件。,3、重复观测值可以得到情况下二元logit离散选择模型的参数估计,对每个决策者有多个重复(例如10次左右)观测值。对第i个决策者重复观测ni次,选择yi=1的次数比例为pi,那么可以将pi作为真实概率Pi的一个估计量。,建立“机会比率(odds ratio)模型”,采用加权最小二乘法估计。,五、例题,例贷款决策模型,分析与建模:某商业银行从历史贷款客户中随机抽取78个样本,根据设计的指标体系分别计算它们的“商业信用支持度”(XY)和“市场竞争地位等级”(SC),对它们贷款的结果(JG)采用二元离散变量,1表示贷款成功,0表示贷款失败。目的是研究JG与XY、SC之间的关系,并为正确贷款决策提供支持。,样本观测值,模型估计输出结果,回归方程表示如下:JGF=CNORM(8.797358375-0.2578816624*XY+5.061788664*SC)模拟:该方程表示,当XY和SC已知时,代入方程,可以计算贷款成功的概率JGF。例如,将表中第19个样本观测值XY=15、SC=1代入方程右边,计算括号内的值为0.1326552;,查标准正态分布表,对应于0.1326552的累积正态分布值为0.4483,即对应于该客户,贷款成功的概率为0.4483。,预测:如果有一个新客户,根据客户资料,计算的“商业信用支持度”(XY)和“市场竞争地位等级”(SC),代入模型,就可以得到贷款成功的概率,以此决定是否给予贷款。,16.3 平稳性检验,一、问题的引出:非平稳变量与经典回归模型二、时间序列数据的平稳性三、平稳性的图示判断四、平稳性的单位根检验五、单整、趋势平稳与差分平稳随机过程,引言、谬误回归(spurious regression)的成因,1、在横截面数据中,两个变量通过分别与第三个变量的相关关系建立起联系。但是,当我们控制第三个变量,比如Z时,X对Y的偏影响变成了零。2、在时间序列数据中:,确定性趋势(deterministic trend),随机趋势(stochastic trend),谬误回归,去除趋势(detrended),差分平稳过程(difference stationary process),趋势平稳过程(trend stationary process),若协整,不会造成谬误回归。,一、问题的引出:非平稳变量与经典回归模型,常见的数据类型,到目前为止,经典计量经济模型常用到的数据有:时间序列数据(time-series data)截面数据(cross-sectional data)平行/面板数据(panel data/time-series cross-section data)时间序列数据是最常见,也是最常用到的数据,表现在:两个本来没有任何因果关系的变量,却有很高的相关性(有较高的R2)。例如:如果有两列时间序列数据表现出一致的变化趋势(非平稳的),即使它们没有任何有意义的关系,但进行回归也可表现出较高的可决系数。,2 数据非平稳,往往导致出现“虚假回归”问题,在现实经济生活中,实际的时间序列数据往往是非平稳的,而且主要的经济变量如消费、收入、价格往往表现为一致的上升或下降。这样,仍然通过经典的因果关系模型进行分析,一般不会得到有意义的结果。,时间序列分析模型方法就是在这样的情况下,以通过揭示时间序列自身的变化规律为主线而发展起来的全新的计量经济学方法论。时间序列分析已组成现代计量经济学的重要内容,并广泛应用于经济分析与预测当中。,二、时间序列数据的平稳性,定义:,假定某个时间序列是由某一随机过程(stochastic process)生成的,即假定时间序列Xt(t=1,2,)的每一个数值都是从一个概率分布中随机得到,如果满足下列条件:1)均值E(Xt)=是与时间t 无关的常数;2)方差Var(Xt)=2是与时间t 无关的常数;,3)协方差Cov(Xt,Xt+k)=k 是只与时期间隔k有关,与时间t 无关的常数;则称该随机时间序列是平稳的(stationary),而该随机过程是一平稳随机过程(stationary stochastic process)。,例1、一个最简单的随机时间序列是一具有零均值同方差的独立分布序列:Xt=t,tN(0,2),该序列常被称为是一个白噪声(white noise)。由于Xt具有相同的均值与方差,且协方差为零,由定义,一个白噪声序列是平稳的。白噪声序列是平稳随机序列的特例。,例2、另一个简单的随机时间列序被称为随机游走(random walk),该序列由如下随机过程生成:X t=Xt-1+t 这里,t是一个白噪声。,容易知道该序列有相同的均值:E(Xt)=E(Xt-1)为了检验该序列是否具有相同的方差,可假设Xt的初值为X0,则易知:,X1=X0+1 X2=X1+2=X0+1+2 Xt=X0+1+2+t 由于X0为常数,t是一个白噪声,因此:Var(Xt)=t2即Xt的方差与时间t有关而非常数,它是一非平稳序列。,然而,对X取一阶差分(first difference):Xt=Xt-Xt-1=t由于t是一个白噪声,则序列Xt是平稳的。,后面将会看到:如果一个时间序列是非平稳的,它常常可通过取差分的方法而形成平稳序列。,事实上,随机游走过程是下面我们称之为1阶自回归AR(1)过程的特例:Xt=Xt-1+t 不难验证:1)|1时,该随机过程生成的时间序列是发散的,表现为持续上升(1)或持续下降(-1),因此是非平稳的;2)=1时,是一个随机游走过程,也是非平稳的。,容易证明:只有当-11时,该随机过程才是平稳的。,1阶自回归过程AR(1)又是如下k阶自回归AR(K)过程的特例:Xt=1Xt-1+2Xt-2+kXt-k该随机过程平稳性条件不再给出证明。,三、平稳性检验的图示判断,给出一个随机时间序列,首先可通过该序列的时间路径图来粗略地判断它是否是平稳的。一个平稳的时间序列在图形上往往表现出一种围绕其均值不断波动的过程。而非平稳序列则往往表现出在不同的时间段具有不同的均值(如持续上升或持续下降)。,进一步的判断:检验样本自相关函数及其图形,定义随机时间序列的自相关函数(autocorrelation function,ACF)如下:k=k/0 自相关函数是关于滞后期k的递减函数(Why?)。实际上,对一个随机过程只有一个实现(样本),因此,只能计算样本自相关函数(Sample autocorrelation function)。,一个时间序列的样本自相关函数定义为:,易知,随着k的增加,样本自相关函数下降且趋于零。但从下降速度来看,平稳序列要比非平稳序列快得多。,注意:,确定样本自相关函数rk某一数值是否足够接近于0是非常有用的,因为它可检验对应的自相关函数k的真值是否为0的假设。Bartlett曾证明:如果时间序列由白噪声过程生成,则对所有的k0,样本自相关系数近似地服从以0为均值,1/n 为方差的正态分布,其中n为样本数。,也可检验对所有k0,自相关系数都为0的联合假设,这可通过如下QLB统计量进行:,该统计量近似地服从自由度为m的2分布(m为滞后长度)。因此:如果计算的Q值大于显著性水平为的临界值,则有1-的把握拒绝所有k(k0)同时为0的假设。表9.1序列Random1是通过一平稳随机过程(随机函数)生成的有19个样本的随机时间序列。,表,1,一个纯随机序列与随机游走序列的检验,序号,R,andom1,自相关系数,(k=0,1,厎,17),R,andom2,自相关系数,(k=0,1,厎,17),16,0.244,K=15,-,0.094,26.036,-,0.162,0.037,24.004,17,-,0.215,K=16,0.039,26.240,-,0.377,0.105,25.483,18,0.141,K=17,0.027,26.381,-,0.236,0.093,27.198,19,0.236,0.000,容易验证:该样本序列的均值为0,方差为0.0789。,从图形看:它在其样本均值0附近上下波动,且样本自相关系数迅速下降到0,随后在0附近波动且逐渐收敛于0。,由于该序列由一平稳随机过程生成,可以认为不存在序列相关性,因此该序列为一白噪声。,根据Bartlett的理论:kN(0,1/19),因此任一rk(k0)的95%的置信区间都将是:,可以看出:k0时,rk的值确实落在了该区间内,因此可以接受 k(k0)为0的假设。同样地,从QLB统计量的计算值看,滞后17期的计算值为26.38,未超过5%显著性水平的临界值27.58,因此,可以接受所有的自相关系数k(k0)都为0的假设。因此,该随机过程是一个平稳过程。,序列Random2是由一随机游走过程 Xt=Xt-1+t生成的一随机游走时间序列样本。其中,第0项取值为0,t是由Random1表示的白噪声。,图形表示出:该序列具有相同的均值,但从样本自相关图看,虽然自相关系数迅速下降到0,但随着时间的推移,则在0附近波动且呈发散趋势。样本自相关系数显示:r1=0.48,落在了区间-0.4497,0.4497之外,因此在5%的显著性水平上拒绝1的真值为0的假设。该随机游走序列是非平稳的。,例 检验中国支出法GDP时间序列的平稳性。,表2 19782000年中国支出法GDP(单位:亿元),图形:表现出了一个持续上升的过程,可初步判断是非平稳的。样本自相关系数:缓慢下降,再次表明它的非平稳性。,就此来说,运用传统的回归方法建立它们的回归方程是无实际意义的。不过,稍后将看到,如果两个非平稳时间序列是协整的,则传统的回归结果却是有意义的,而这两时间序列恰是协整的。,四、平稳性的单位根检验(unit root test),1、DF检验 随机游走序列:Xt=Xt-1+t是非平稳的,其中t是白噪声。而该序列可看成是随机模型:Xt=Xt-1+t中参数=1时的情形。,(*)式可变形式成差分形式:Xt=(1-)Xt-1+t=Xt-1+t(*)检验(*)式是否存在单位根=1,也可通过(*)式判断是否有=0。,对式:Xt=Xt-1+t(*)进行回归,如果确实发现=1,就说随机变量Xt有一个单位根。,一般地:,检验一个时间序列Xt的平稳性,可通过检验带有截距项的一阶自回归模型:Xt=+Xt-1+t(*)中的参数是否小于1。,或者:检验其等价变形式:Xt=+Xt-1+t(*)中的参数是否小于0。,已经证明,(*)式中的参数1或=1时,时间序列是非平稳的;对应于(*)式,则是0或=0。,因此,针对式:Xt=+Xt-1+t 我们关心的检验为:零假设 H0:=0。备择假设 H1:0,上述检验可通过OLS法下的t检验完成。然而,在零假设(序列非平稳)下,即使在大样本下t统计量也是有偏误的(向下偏倚),通常的t 检验无法使用。Dicky和Fuller于1976年提出了这一情形下t统计量服从的分布(这时的t统计量称为统计量),即DF分布。由于t统计量的向下偏倚性,它呈现围绕小于零值的偏态分布。,因此,可通过OLS法估计:Xt=+Xt-1+t 并计算t统计量的值,与DF分布表中给定显著性水平下的临界值比较:,如果:t临界值,则拒绝零假设H0:=0,认为时间序列不存在单位根,是平稳的。注意:在不同的教科书上有不同的描述,但是结果是相同的。例如:“如果计算得到的t统计量的绝对值大于临界值的绝对值,则拒绝=0”的假设,原序列不存在单位根,为平稳序列。,问题的提出:在利用Xt=+Xt-1+t对时间序列进行平稳性检验中,实际上假定了时间序列是由具有白噪声随机误差项的一阶自回归过程AR(1)生成的。但在实际检验中,时间序列可能由更高阶的自回归过程生成的,或者随机误差项并非是白噪声,这样用OLS法进行估计均会表现出随机误差项出现自相关(autocorrelation),导致DF检验无效。,2、ADF检验,另外,如果时间序列包含有明显的随时间变化的某种趋势(如上升或下降),则也容易导致上述检验中的自相关随机误差项问题。为了保证DF检验中随机误差项的白噪声特性,Dicky和Fuller对DF检验进行了扩充,形成了ADF(Augment Dickey-Fuller)检验。,ADF检验是通过下面三个模型完成的:,模型3 中的t是时间变量,代表了时间序列随时间变化的某种趋势(如果有的话)。模型1与另两模型的差别在于是否包含有常数项和趋势项。检验的假设都是:针对H1:0,检验 H0:=0,即存在一单位根。,实际检验时从模型3开始,然后模型2、模型1。,何时检验拒绝零假设,即原序列不存在单位根,为平稳序列,何时检验停止。否则,就要继续检验,直到检验完模型1为止。检验原理与DF检验相同,只是对模型1、2、3进行检验时,有各自相应的临界值。下表给出了三个模型所使用的ADF分布临界值表。,2.202.182.172.162.162.16,2.612.562.542.532.522.52,2.972.892.862.842.832.83,3.413.283.223.193.183.18,2550100250500500,-2.62-2.60-2.58-2.57-2.57-2.57,-3.00-2.93-2.89-2.88-2.87-2.86,-3.33-3.22-3.17-3.14-3.13-3.12,-3.75-3.58-3.51-3.46-

    注意事项

    本文(《经济计量学》陈胜荣(计统系).ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开