计量经济学资料整理.docx
第1节 异方差性的概念异方差性的实质 同方差的含义同方差性:对所有的 有: 因为方差是度量被解释变量Y的观测值围绕回归线的分散程度,因此同方差性指的是所有观测值的分散程度相同。 异方差的含义 设模型为如果对于模型中随机误差项ui有: 则称具有异方差性。进一步,把异方差看成是由于某个解释变量的变化而引起的,则 异方差产生的原因(一)模型中省略了某些重要的解释变量假设正确的计量模型是:(5.5) 假如略去 ,而采用 当被略去的 与 有呈同方向或反方向变化的趋势时,随 的有规律变化会体现在 式的 中。(二)模型的设定误差模型的设定主要包括变量的选择和模型数学形式的确定。模型中略去了重要解释变量常常导致异方差,实际就是模型设定问题。除此而外,模型的函数形式不正确,如把变量间本来为非线性的关系设定为线性,也可能导致异方差。(三)数据的测量误差样本数据的观测误差有可能随研究范围的扩大而增加,或随时间的推移逐步积累,也可能随着观测技术的提高而逐步减小。 (四)截面数据中总体各单位的差异通常认为,截面数据较时间序列数据更容易产生异方差。这是因为同一时点不同对象的差异,一般说来会大于同一对象不同时间的差异。不过,在时间序列数据发生较大变化的情况下,也可能出现比截面数据更严重的异方差。第2节 异方差性的后果 对参数估计统计特性的影响(一)参数估计的无偏性仍然成立参数估计的无偏性仅依赖于基本假定中的零均值假定(即 )。所以异方差的存在对无偏性的成立没有影响。(二)参数估计的方差不再是最小的同方差假定是OLS估计方差最小的前提条件,所以随机误差项是异方差时,将不能再保证最小二乘估计的方差最小。对参数显著性检验的影响由于异方差的影响,使得无法正确估计参数的标准误差,导致参数估计的 t 统计量的值不能正确确定,所以,如果仍用 t 统计量进行参数的显著性检验将失去意义。对预测的影响尽管参数的OLS估计量仍然无偏,并且基于此的预测也是无偏的,但是由于参数估计量不是有效的,从而对Y的预测也将不是有效的。 第三节 异方差性的检验常用检验方法:图示检验法(一)相关图形分析 方差描述的是随机变量取值的(与其均值的)离散程度。因为被解释变量 与随机误差项 有相同的方差,所以利用分析 与 的相关图形,可以初略地看到 的离散程度与 之间是否有相关关系。 如果随着 的增加, 的离散程度为逐渐增大(或减小)的变化趋势,则认为存在递增型(或递减型)的异方差。(2) 残差图形分析设一元线性回归模型为: 运用OLS法估计,得样本回归模型为:由上两式得残差:绘制出 对 的散点图如果 不随 而变化,则表明不存在异方差;如果 随 而变化,则表明存在异方差。 Goldfeld-Quanadt检验作用:检验递增性(或递减性)异方差。基本思想:将样本分为两部分,然后分别对两个样 本进行回归,并计算两个子样的残差平方和所构成 的比,以此为统计量来判断是否存在异方差。(一) 检验的前提条件 1、要求检验使用的为大样本容量。 2、除了同方差假定不成立外,其它假定均满足(2) 检验的具体做法1.排序 将解释变量的取值按从小到大排序。2.数据分组 将排列在中间的约1/4的观察值删除掉,记为 ,再将剩余的分为两个部分,每部分观察值的个数为 。3.提出假设4.构造F统计量 分别对上述两个部分的观察值求回归模型,由此 得到的两个部分的残差平方为 和 。 为前一部分样本回归产生的残差平方和, 为后一部分样本回归产生的残差平方和。它们的自由度均为 ,为参数的个数。 (3) 检验的特点 要求大样本 异方差的表现既可为递增型,也可为递减型 检验结果与选择数据删除的个数 的大小有关 只能判断异方差是否存在,在多个解释变量的情下,对哪一个变量引起异方差的判断存在局限。 White检验(一)基本思想:不需要关于异方差的任何先验信息,只需要在大样本的情况下,将OLS估计后的残差平方对常数、解释变量、解释变量的平方及其交叉乘积等所构成一个辅助回归,利用辅助回归建立相应的检验统计量来判断异方差性。 (二)检验的特点 要求变量的取值为大样本不仅能够检验异方差的存在性,同时在多变量的情况下,还能判断出是哪一个变量引起的异方差。(4) 检验的特点变量的样本值为大样本数据是时间序列数据只能判断模型中是否存在异方差,而不能诊断出哪一个变量引起的异方差。 5、 Glejser检验(一)检验的基本思想 由OLS法得到残差,取得绝对值,然后将对某个解释变量回归,根据回归模型的显著性和拟合优度来判断是否存在异方差。(二)检验的特点 不仅能对异方差的存在进行判断,而且还能对异方差随某个解释变量变化的函数形式 进行诊断。该检验要求变量的观测值为大样本。第四节 异方差性的补救措施异方差性是指模型中随机误差项的方差不是常量,而且它的变化与解释变量的变动有关。2.产生异方差性的主要原因有:模型中略去的变量随解释变量的变化而呈规律性的变化、变量的设定问题、截面数据的使用,利用平均数作为样本数据等。3.存在异方差性时对模型的OLS估计仍然具有无偏性,但最小方差性不成立,从而导致参数的显著性检验失效和预测的精度降低。4.检验异方差性的方法有多种,常用的有图形法、Goldfeld-Qunandt检验、White检验、ARCH检验以及Glejser检验,运用这些检验方法时要注意它们的假设条件。5.异方差性的主要方法是加权最小二乘法,也可以用变量变换法和对数变换法。变量变换法与加权最小二乘法实际是等价的。 第一节 什么是多重共线性当 时,表明在数据矩阵X中,至少有一个列向量可以用其余的列向量线性表示,则说明存在完全的多重共线性。 二、产生多重共线性的背景多重共线性产生的经济背景主要有几种情形: 1.经济变量之间具有共同变化趋势。 2.模型中包含滞后变量。 3.利用截面数据建立模型也可能出现多重共线性。 4.样本数据自身的原因。 第二节 多重共线性产生的后果2.对参数区间估计时,置信区间趋于变大3.假设检验容易作出错误的判断4.可能造成可决系数较高,但对各个参数单独的 t 检验却可能不显著,甚至可能使估计的回归系数符号相反,得出完全错误的结论。 第三节 多重共线性的检验一、简单相关系数检验法含义:简单相关系数检验法是利用解释变量之间的线性相关程度去判断是否存在严重多重共线性的一种简便方法。 判断规则:一般而言,如果每两个解释变量的简单相关系数(零阶相关系数)比较高,例如大于0.8,则可认为存在着较严重的多重共线性。注意: 较高的简单相关系数只是多重共线性存在的充分条件,而不是必要条件。特别是在多于两个解释变量的回归模型中,有时较低的简单相关系数也可能存在多重共线性。因此并不能简单地依据相关系数进行多重共线性的准确判断。方差膨胀因子越大,表明解释变量之间的多重共性越严重。反过来,方差膨胀因子越接近于1,多重共线性越弱。经验表明,方差膨胀因子10时,说明解释变量与其余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计三、 直观判断法1. 当增加或剔除一个解释变量,或者改变一个观测值时,回归参数的估计值发生较大变化,回归方程可能存在严重的多重共线性。 2. 从定性分析认为,一些重要的解释变量的回归系数的标准误差较大,在回归方程中没有通过显著性检验时,可初步判断可能存在严重的多重共线性。3. 有些解释变量的回归系数所带正负号与定性分析结果违背时,很可能存在多重共线性。4. 解释变量的相关矩阵中,自变量之间的相关系数较大时,可能会存在多重共线性问题。四、逐步回归法逐步回归的基本思想 将变量逐个的引入模型,每引入一个解释变量后,都要进行检验,并对已经选入的解释变量逐个进行t 检验,当原来引入的解释变量由于后面解释变量的引入而变得不再显著时,则将其剔除。以确保每次引入新的变量之前回归方程中只包含显著的变量。 在逐步回归中,高度相关的解释变量,在引入时会被剔除。因而也是一种检测多重共线性的有效方法。第四节 多重共线性的补救措施1、 修正多重共线性的经验方法1. 剔除变量法把方差扩大因子最大者所对应的自变量首先剔除再重新建立回归方程,直至回归方程中不再存在严重的多重共线性。注意: 若剔除了重要变量,可能引起模型的设定误差。2. 增大样本容量如果样本容量增加,会减小回归参数的方差,标准误差也同样会减小。因此尽可能地收集足够多的样本数据可以改进模型参数的估计。问题:增加样本数据在实际计量分析中常面临许多困难。3. 变换模型形式一般而言,差分后变量之间的相关性要比差分前弱得多,所以差分后的模型可能降低出现共线性的可能性,此时可直接估计差分方程。问题:差分会丢失一些信息,差分模型的误差项可能存在序列相关,可能会违背经典线性回归模型的相关假设,在具体运用时要慎重。4. 利用非样本先验信息通过经济理论分析能够得到某些参数之间的关系,可以将这种关系作为约束条件,将此约束条件和样本信息结合起来进行约束最小二乘估计。5. 横截面数据与时序数据并用首先利用横截面数据估计出部分参数,再利用时序数据估计出另外的部分参数,最后得到整个方程参数的估计。 注意:这里包含着假设,即参数的横截面估计和从纯粹时间序列分析中得到的估计是一样的。6. 变量变换变量变换的主要方法:(1)计算相对指标 (2)将名义数据转换为实际数据 (3)将小类指标合并成大类指标 变量数据的变换有时可得到较好的结果,但无法保证一定可以得到很好的结果。2、 逐步回归法(1)用被解释变量对每一个所考虑的解释变量做简单回归。(2)以对被解释变量贡献最大的解释变量所对应的回归方程为基础,按对被解释变量贡献大小的顺序逐个引入其余的解释变量。若新变量的引入改进了R2 和 F 检验,且回归参数的t 检验在统计上也是显著的,则在模型中保留该变量。若新变量的引入未能改进R2和 F 检验,且对其他回归参数估计值的t 检验也未带来什么影响,则认为该变量是多余变量。若新变量的引入未能改进 R2 和 F 检验,且显著地影响了其他回归参数估计值的数值或符号,同时本身的回归参数也通不过t 检验,说明出现了严重的多重共线性。小结1.多重共线性是指各个解释变量之间有准确或近似准确的线性关系。2.多重共线性的后果: 如果各个解释变量之间有完全的共线性,则它们的 回归系数是不确定的,并且它们的方差会无穷大。 如果共线性是高度的但不完全的,回归系数可估计, 但有较大的标准误差。回归系数不能准确地估计。3.诊断共线性的经验方法: (1) 表现为可决系数异常高而回归系数的t 检验不显著。 (2) 变量之间的零阶或简单相关系数。多个解释变量时,较低的零阶相关也可能出现多重共线性,需要检查偏相关系数。 (4)如果 高而偏相关系数低,则多重共线性是可能的。(5) 用解释变量间辅助回归的可决系数判断。4.降低多重共线性的经验方法: (1)利用外部或先验信息; (2)横截面与时间序列数据并用; (3)剔除高度共线性的变量(如逐步回归); (4)数据转换; (5)获取补充数据或新数据; (6)选择有偏估计量(如岭回归)。 经验方法的效果取决于数据的性质和共线性的严重程度。第十章、时间序列计量经济模型 第一节 时间序列基本概念1、 伪回归问题传统计量经济学模型的假定条件:序列的平稳性、正态性。 所谓“伪回归”,是指变量间本来不存在相依关系,但回归结果却得出存在相依关系的错误结论。20世纪70年代,Grange、Newbold 研究发现,造成“伪回归”的根本原因在于时序序列变量的非平稳性2、 随机过程有些随机现象,要认识它必须研究其发展变化过程,随机现象的动态变化过程就是随机过程。 例如,考察一段时间内每一天的电话呼叫次数,需要考察依赖于时间t的随机变量 , 就是一随机过程。又例如,某国某年的GNP总量,是一随机变量,但若考查它随时间变化的情形,则 就是一随机过程。3、 时间序列的平稳性所谓时间序列的平稳性,是指时间序列的统计规律不会随着时间的推移而发生变化。直观上,一个平稳的时间序列可以看作一条围绕其均值上下波动的曲线。从理论上,有两种意义的平稳性,一是严格平稳,另一种是弱平稳。时间序列的非平稳性是指时间序列的统计规律随着时间的位移而发生变化,即生成变量时间序列数据的随机过程的特征随时间而变化。在实际中遇到的时间序列数据很可能是非平稳序列,而平稳性在计量经济建模中又具有重要地位,因此有必要对观测值的时间序列数据进行平稳性检验。第2节 时间序列平稳性的单位根检验一、单位根检验结论:随机游动过程是非平稳的。因此,检验序列的非平稳性就变为检验特征方程是否有单位根,这就是单位根检验方法的由来 2、 Dickey-Fuller检验(DF检验)大多数经济变量呈现出强烈的趋势特征。这些具有趋势特征的经济变量,当发生经济振荡或冲击后,一般会出现两种情形: 受到振荡或冲击后,经济变量逐渐又回它们的长期趋势轨迹; 这些经济变量没有回到原有轨迹,而呈现出随机游走的状态。若我们研究的经济变量遵从一个非平稳过程,一个变量对其他变量的回归可能会导致伪回归结果。这是研究单位根检验的重要意义所在。Dickey、Fuller研究发现,DF检验的临界值同序列的数据生成过程以及回归模型的类型有关,因此他们针对如下三种方程编制了临界值表,后来Mackinnon把临界值表加以扩充,形成了目前使用广泛的临界值表,在EViews软件中使用的是Mackinnon临界值表。三、Augmented Dickey-Fuller检验(ADF检验)DF检验存在的问题是,在检验所设定的模型时,假设随机扰动项不存在自相关。但大多数的经济数据序列是不能满足此项假设的,当随机扰动项存在自相关时,直接使用DF检验法会出现偏误,为了保证单位根检验的有效性,人们对DF检验进行拓展,从而形成了扩展的DF检验(Augmented Dickey-Fuller Test),简称为ADF检验。 第3节 协整问题:估计出来的货币需求函数是否揭示了货币需求的长期均衡关系?(1)如果上述货币需求函数是适当的,那么货币需求对长期均衡关系的偏离将是暂时的,扰动项序列是平稳序列,估计出来的货币需求函数就揭示了货币需求的长期均衡关系。(2)相反,如果扰动项序列有随机趋势而呈现非平稳现象,那么模型中的误差会逐步积聚,使得货币需求对长期均衡关系的偏离在长时期内不会消失。述货币需求模型是否具有实际价值,关键在于扰动项序列是否平稳。 货币供给量、实际收入、价格水平以及利率可能是I(1)序列。一般情况下,多个非平稳序列的线性组合也是非平稳序列。 如果货币供给量、实际收入、价格水平以及利率的任何线性组合都是非平稳的,那么上述货币需求模型的扰动项序列就不可能是平稳的,从而模型并没有揭示出货币需求的长期稳定关系。反过来说,如果上述货币需求模型描述了货币需求的长期均衡关系,那么扰动项序列必定是平稳序列,也就是说,非平稳的货币供给量、实际收入、价格水平以及利率四变量之间存在平稳的线性组合。 上述例子向我们揭示了这样一个事实:“包含非平稳变量的均衡系统,必然意味着这些非平稳变量的某种组合是平稳的”这正是协整理论的思想。协整概念的提出对于用非平稳变量建立经济计量模型,以检验这些变量之间的长期均衡关系非常重要。(1)如果多个非平稳变量具有协整性,则这些变量可以合成一个平稳序列。这个平稳序列就可以用来描述原变量之间的均衡关系。(2)当且仅当多个非平稳变量之间具有协整性时,由这些变量建立的回归模型才有意义。所以协整性检验也是区别真实回归与伪回归的有效方法。(3)具有协整关系的非平稳变量可以用来建立误差修正模型。由于误差修正模型把长期关系和短期动态特征结合在一个模型中,因此既可以克服传统计量经济模型忽视伪回归的问题,又可以克服建立差分模型忽视水平变量信息的弱点。二、协整检验协整性的检验有两种方法基于回归残差的协整检验,这种检验也称为单一方程的协整检验;基于回归系数的完全信息协整检验。这里我们仅考虑单一方程的情形,而且主要介绍两变量协整关系的EG两步法检验。三、误差修正模型(Error Correction Model ,ECM)误差修正模型(ECM,也称误差修正模型)是一种具有特定形式的计量经济模型。建立误差修正模型一般采用两步,分别建立区分数据长期特征和短期待征的计量经济学模型。第一步,建立长期关系模型。即通过水平变量和OLS法估计出时间序列变量间的关系。若估计结果形成平稳的残差序列时,那么这些变量间就存在相互协整的关系长期关系模型的变量选择是合理的,回归系数具有经济意义。第二步,建立误差修正模型。将长期关系模型 各个变量以一阶差分形式重新构造,并将第一步中的残差引入。在一个从一般到特殊的检验过程中,对短期动态关系进行逐项检验,剔除不显著项,直到得到最适当的模型形式。注意,解释变量引入的短期关系模型的残差,代表着在取得长期均衡的过程中各时点上出现“偏误”的程度,使得第二步可以对这种偏误的短期调整或误差修正机制加以估计。举例货币需求函数以建立我国货币需求函数为例,说明误差修正模型的建模过程。货币需求函数通常在局部调整的结构下加以设定。在这种模型中,当前实际货币需求余额是关于实际货币需求余额滞后值、实际国民收入(通常用GDP表示)和机会成本等变量的回归。那么这种依据交易方程设定的模型可作为长期关系模型。小结:1.大多数经济时间序列是非平稳的。如果直接将时间序列作回归分析,则可能造成“伪回归” ,造成“伪回归”的根本原因在于时序序列变量的非平稳性。2.时间序列的平稳性,是指时间序列的统计规律不会随着时间的推移而发生变化。严格平稳是指随机过程的联合分布函数与时间的位移无关。弱平稳是指随机过程的一阶矩和二阶矩不随时间推移而变化。3.单位根过程是最常见的非平稳过程。如果非平稳序列经过次差分后平稳,而 次差 分却不平稳,那么称为阶单整序列,称为整形阶数。4.时间序列平稳性的检验方法主要有两类:自相关函数检验法和单位根检验法。本书只介绍最常用的单位根检验法DF检验法和ADF 检验法。5.协整是指多个非平稳经济变量的某种线性组合 是平稳的。协整分析对于检验变量之间的长期 均衡关系非常重要,而且也是区别真实回归与 伪回归的有效方法。6.任何一组相互协整的时间序列变量都存在误差 修正机制。误差修正模型把长期关系和短期动 态特征结合在一个模型中,既可以克服传统计 量经济模型忽视伪回归的问题,又可以克服建 立差分模型忽视水平变量信息的弱点。