单一方程模型的扩展问题.ppt
第八章:单一方程模型的扩展问题第一节:关于虚拟变量的回归 许多实际问题中,经济变量不仅受定量变量的影响,而且受定性变量的影响。这样在回归模型中,解释变量不仅应该包括定量变量,有时需要包括定性变量。本节讨论包括定性变量的回归模型。一、虚拟变量及其表示方法 最简单但又最常见的定性变量是二分定性变量,即只取两个类别的变量:是与非、男与女、农村与城市、白人与黑人,等。,例1:美国某学院其他条件基本相同的10位教员的起薪数据由下表给出,试判断该学院在教员薪金上是否存在性别歧视?(sjk15)起薪:22.0 19.0 18.0 21.7 18.5 21.0 20.5 17.0 17.5 21.2 性别:男 女 女 男 女 男 男 女 女 男 解:设立虚拟变量,建立回归模型。问题:*回归分析得到怎样的结果可以认为该学院在教员薪金上是否存在性别歧视?*能否这样建立虚拟变量,并建立新的回归模型?,有的定性变量是多分定性变量,即变量所取的类别多于两类,如:文化程度可取:中学以下、中学、大学及以上;一年有四个季度,12个月份,等等。N分类定性变量可用N-1个虚拟变量来表示,此时应防止落入虚拟变量陷阱。如:,要点1:对二分定性变量,虚拟变量通常采用0、1形式来表示。为避免虚拟变量陷阱,对n分定性变量,应该引入n-1个虚拟变量。所有虚拟变量都取0值的那个类别,通常称为基底类别。,二、虚拟变量回归模型 1、加法类型虚拟变量改变模型的截距 虚拟变量与定量变量在模型中的关系是相加关系,虚拟变量的引入改变不同类别样本回归直线的截距,但不影响斜率。例2:教员薪金y与教龄x、性别的D的关系。某学院教员薪金受教龄的影响,可能也会受到性别的影响,如果认为教龄对薪金的影响不会受到性别的影响,则可建立如下模型:其中虚拟变量的取法与前相同。如果模型及参数可以通过检验,则就有:女性教员薪金与教龄的关系 男性教员薪金与教龄的关系,要点2:如果在回归模型的解释变量中既包括定量变量、也包括定性变量,并且定量变量对应变量的影响不受定性变量所涉及的类别的影响,则表示定性变量的虚拟变量在模型应以加法类型出现。如果虚拟变量在模型中以加法类型出现,则代表不同类型的样本回归直线具有不同的截距,但是具有相同的斜率。,2、乘法类型虚拟变量改变模型的斜率 虚拟变量与定量变量在模型中的关系是相乘关系,虚拟变量的引入改变不同类别样本直线的斜率、但不改变截距。例3:证券投资基金经理市场时机把握能力研究 资本资产定价模型的计量经济学形式 资本市场的一个特点:高收益伴随着高风险(在牛市,值大则收益高,在熊市,值大则可能遭受的损失大),如果基金经理具有对牛、熊市的预测能力,则应在两种不同市场采取不同的投资策略。引入虚拟变量,建立如下回归模型:如果回归结果显示参数,且可以通过显著性检验,则在熊市时基金资产组合收益率所服从的样本回归直线为:而在牛市时,基金资产组合收益率所服从的回归直线为:由于基金经理在牛、熊市采用不同的投资策略,且这种投资策略可提高基金资产的收益率,则可以认为基金经理具有市场时机把握能力。,要点3:如果回归模型的解释变量既包括定量变量、也包括定性变量,且定量变量对应变量的影响受到定性变量所涉及的类别的影响,则表示定性变量的虚拟变量在模型应以乘法类型出现。如果虚拟变量在模型中以乘法类型出现,则代表不同类型的样本回归直线具有相同的截距,但是具有不同的斜率。,3、加法与乘法混合类型检验回归模型的结构稳定性 虚拟变量与定量变量在模型中的关系既有相加关系,也有相乘关系,虚拟变量的引入不仅改变不同类别样本直线的斜率、而且改变截距。例4:英国1946-1963年度国民收入x与个人储蓄y的数据有sjk16给出,有人将数据分为二期:1946-1954(重建时期)、1955-1963(重建后时期),并且认为在两个不同时期中,收入与储蓄的关系应该不同,试用虚拟变量法检验这种观点是否成立。解:收入与储蓄的回归模型为,如果两个不同时期的回归模型不同,则不同之处可能体现在截距上,也可能体现在斜率上,因此引入虚拟变量,并建立新的回归模型。,直接进行回归分析得到模型参数 都可以通过显著性检验,因此可以认为在两个不同时期,英国个人收入与储蓄的关系是不相同的。在战后重建时期:在重建后时期:,要点4:如果回归模型的解释变量既包括定量变量、也包括定性变量,且定量变量对应变量的影响受到定性变量所涉及的类别的影响,同时类别也可能应该截距项,则表示定性变量的虚拟变量在模型应以加法-乘法混合类型出现。利用加法-乘法混合类型可以检验不同时段(类别)的回归模型是否存在结构改变。,4、加法与乘法混合类型交互作用效应 如果模型中存在多个定性变量,且定性变量之间存在交互作用效应,则回归模型中虚拟变量之间既有相加的关系,也有相乘的关系。例5:考虑如下模型 其中 模型假设,除收入外性别与学历也会影响衣着支出,但一种类别的差异不受另一个类别的变换的影响,如女性与男性的平均衣着支出存在差异,但这个差异不受学历的影响。这可能与实际情况不符。,如果我们认为性别之间的衣着支出差异也会受到学历的影响(交互作用效应),则可建立如下模型 这样 其中,基底类别为男性的非大学毕业生。,要点5:如果定性变量所反映的类别之间存在交互效应,则存在交互效应的定性变量所对应的虚拟变量,在模型中以加法和相互之间的乘法这样的混合类型出现。更一般的模型是,模型中既有虚拟变量之间的加法-乘法混合类型,也有虚拟变量和定量变量之间的加法-乘法混合类型。,5、虚拟变量的应用分段线性回归 设想一家公司对其销售人员采取如下方式支付酬金:*在销售额没有达到某个目标前,采用一种形式的酬金形式;*在销售额达到这个目标后,对超过部分采用另外一种酬金形式 回归模型:其中,这样,没有达到目标前的酬金支付方式 达到目标后的酬金支付方式,要点6:利用虚拟变量可以建立分段线性回归模型,其中虚拟变量的取法与门槛水平 决定。与乘法类型生成二条(或多条)样本回归直线不同,分段线性回归模型生成一条折线。根据实际问题的不同,分段线性回归模型也可以分成多段。,第二节:模型设定误差 如果在模型设置过程中遗漏了相关变量,或误选了无关变量,就说模型存在设定误差。如果模型遗漏相关变量,就说模型存在欠拟合现象;如果模型误选无关变量,就说模型存在过拟合现象。一、相关变量遗漏的后果 设置准确的模型:欠拟合的模型:,其他的基本假设均满足对此进行最小二乘估计,得到:,如果解释变量x与z相关,则对斜率的参数估计是有偏的;如果解释变量x与z不相关,则对截距的估计是有偏的。同时现在 的方差是 的方差的有偏估计。,二、无关变量的误选 原方程:误设置成:无关变量误选的结果:*对斜率的最小二乘估计依然是无偏的、一致的*估计量的方差增大,最小二乘估计不是有效估计量 模型的欠拟合与模型的过拟合造成的后果是不一样的。,三、模型设置误差的检验 1、对无关变量误选的检验主要采用模型参数的显著性检验,即t检验 2、对相关变量遗漏的检验,可采用DW方法基本思路:如果遗漏相关变量,则该变量对解释变量的影响就会反映在随机扰动项中,模型就会存在自相关性现象。,