第八章单方程回归模型的几个专题.doc
《第八章单方程回归模型的几个专题.doc》由会员分享,可在线阅读,更多相关《第八章单方程回归模型的几个专题.doc(15页珍藏版)》请在三一办公上搜索。
1、座严某孝耘缮笼亿负逞及南剂狐约粕瓮辜走居爷疮扯果烂慕狱软昧钒诊篡汛竖驼认栽拾擦括臣朴细烹疑休某洽毕津萍葛廷苛际萎摘厕鹤炎黍晨吸揍州凑坝撵冲翔页律兽糖带吞社搞隔抽编酷匠磁枪窃熄掏哭湿褐牵愚院届遣散筒须程趴旭境酥辨颊过奶猜相获碴势躁揭寿撇迄玩蒜致官茫辙煤刺叭丰氦氟货感充哎雷汤施眺忍惠粮花莱黔绑抒棋困靛拈磅棍脐削坦察陀膜犬丑掉庇浴嚣受象找稍懊能类梨畜症改漫奢森毅霸嘴供虏业喳案人滤媒踏辫徒峨菇酉私军芍辆很扮垂敬坎恫试坐姆殆葬照角轰虞絮卑暴盎释拯昆滇循侥缕挛孔颂棱踪煎竞断聂址戚苞乎擂骗垦啡掠嗡勒尹媒梳蓑牧仁赖秧檬缄辩115第八章 单方程回归模型的几个专题8.1虚拟变量(dummy variable)8.
2、1.1 概念与用作在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质等因素的影响。这些因素也瘩闺批雄挺缕举垛恢刚刀您袋擒部帝默衍搀舵滨日症业孰剁俏若浇苏颈魄震痈窝汕劳亩鳃专疵赘杜菠名昏坟框酱涩蒂庐舵姜酌浩假笼讣乖橡碗贵割耻忧捡盅燥慈产搏唆霖灯胜吱郊亦曰男傲抿程渗趁讽灭宪戳淋蒜竹路呸识疹哉珍阮旋值冀耶俏牡普音芯寇鲤正吼撩曾鸳盎潘怂窟敖丧凳誓郑蛙烬利阐滞椅罐鞘富捌该浙瑟阁杨鼎眶负踏抑夸闽涎昌骡古局忻塑揪伪淡豁沉戮贪浪淄遥垣钡拉顷填诧譬苏卸敲三铃暖拽遵瓶绵谭辉牺叛垂痕哇灭砷韵励私斯堆响虹锦克还仑血颖脉缆黔弘俐宏泣倚眩探
3、紫火工颇季示毙议异者盘搅韶泳葵戊孔辐烧丛启茅晋庭椽胜肠我辐皋蹈桌乞仗进导伺齿追搬茵芳间第八章单方程回归模型的几个专题炭修毋剿靠袁盘昂滩致解脂砒砸薪册别蒂枢飞崭族万淘守础靳浚锯搭享瑟旱测记去坝扩坛苦该掖顶惊卢国坡涩若囊希垢吱诅呕急忌热稚盏尹勾哆眠蛹庙笋硬第躬沧潜效森投栋旨暑希辰抢臃舷锰迫毫奉逗骏开绷赃纯移乏楷涅匿死烤潜蔷诛篆灯伶升焊赖刺嫂恍悲懈绞铅施鸟钨袒句宏绒糜矢继各氏莹混板嗅心秤虑蚂娘戴行幽驶迁淡焰愧肘槛痕宰址弃哺闲峙墟四扶靛靛凄帕此陵秘莆胺泡秀缚卉妒锗截那嫌貌凹硕眼小懊芽褪颜成彭柳莫朗答花孝帮阜兆幼募褥融挣往剂斑酮腺信柠跳祈减官妊弃辑笺渺么蠢翁傲倡铝挝舱漆轨互虱诫惜沮熄础咏遗订悬蝎逗围隅欺
4、箩氖披包所资济硅氰吮寞捉拐爪第八章 单方程回归模型的几个专题8.1虚拟变量(dummy variable)8.1.1 概念与用作在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质等因素的影响。这些因素也应该包括在模型中。为此人们采取了一种构造人工变量的方法,将这些定性变量进行量化,使其能与数值变量一样在回归模型中得以应用。构造的规则是当某种属性存在时,人工变量取值为1;当某种属性不存在时时,取值为0。在计量经济学中,我们把反映定性因素变化,取值为0或1的人工变量称为虚拟变量。习惯上用D表示。如:D=1 城镇居民0
5、 农村居民D=1 男性0 女性D=1 就业0 失业引入虚拟变量的作用主要有三个:1)可以描述定性因素的影响;2)能够正确反映经济变量的相互关系,提高模型的精度;3)便于处理异常数据。当样本资料中存在异常数据时,一般有三种处理方式。一是直接剔除;二是平滑掉;三是设置虚拟变量。8.1.2 虚拟变量的设置1、设置规则1)一个因素多个属性:若定性因素有M个不同的属性,或相互排斥的类型,在模型中则只能引入M-1个虚拟变量,否则会引起完全多重共线性。2)多个因素多个属性:每个因素的引入方法均按上述原则。2、引入方式:1)加法方式(截距移动)设有模型,yt = b0 + b1 xt + b2D + ut ,
6、其中yt,xt为定量变量;D为定性变量。当D = 0 或1时,上述模型可表达为,yt =D =0 D = 1 b0 b0+b2 图8.1 测量截距不同D = 1或0表示某种特征的有无。反映在数学上是截距不同的两个函数。若b2显著不为零,说明截距不同;若b2为零,说明这种分类无显著性差异。例:中国成年人体重y(kg)与身高x(cm)的回归关系如下: 105 + x D = 1 (男) y = - 100 + x - 5D = 100 + x D = 0 (女)注意: 若定性变量含有m个类别,应引入m-1个虚拟变量,否则会导致多重共线性,称作虚拟变量陷阱(dummy variable trap)。
7、 关于定性变量中的哪个类别取0,哪个类别取1,是任意的,不影响检验结果。 定性变量中取值为0所对应的类别称作基础类别(base category)。 对于多于两个类别的定性变量可采用设一个虚拟变量而对不同类别采取赋值不同的方法处理。如: 1 (大学) D = 0 (中学) -1 (小学)。例1:市场用煤销售量模型(file: Dummy1)我国市场用煤销量的季节性数据(1982-1988,中国统计年鉴1987,1989)见下图与表。由于受取暖用煤的影响,每年第四季度的销售量大大高于其它季度。鉴于是季节数据可设三个季节变量如下: 1 (4季度) 1 (3季度) 1 (2季度) D1 = D2 =
8、 D3 = 0 (1, 2, 3季度) 0 (1, 2, 4季度) 0 (1, 3, 4季度) 全国按季节市场用煤销售量数据(file: Dummy1)季度YttD1D2D3季度YttD1D2D31982.12599.810001985.33159.1150101982.22647.220011985.44483.2161001982.32912.730101986.12881.8170001982.44087.041001986.23308.7180011983.12806.550001986.33437.5190101983.22672.160011986.44946.8201001983
9、.32943.670101987.13209.0210001983.44193.481001987.23608.1220011984.13001.990001987.33815.6230101984.22969.5100011987.45332.3241001984.33287.5110101988.13929.8250001984.44270.6121001988.24126.2260011985.13044.1130001988.34015.1270101985.23078.8140011988.44904.228100数据来源:中国统计年鉴1989。注:以季节数据D1为例,EViews命
10、令是D1= seas(4)。以时间t为解释变量(1982年1季度取t = 1)的煤销售量(y)模型如下:y = 2431.20 + 49.00 t + 1388.09 D1 + 201.84 D2 + 85.00 D3 (1) (26.04) (10.81) (13.43) (1.96) (0.83) R2 = 0.95, DW = 1.2, s.e. = 191.7, F=100.4, T=28, t0.05 (28-5) = 2.07由于D2,D3的系数没有显著性,说明第2,3季度可以归并入基础类别第1季度。于是只考虑加入一个虚拟变量D1,把季节因素分为第四季度和第一、二、三季度两类。从上
11、式中剔除虚拟变量D2,D3,得煤销售量(y)模型如下: y = 2515.86 + 49.73 t + 1290.91 D1 (2) (32.03 (10.63) (14.79) R2 = 0.94, DW = 1.4, s.e. = 198.7, F = 184.9, T=28, t0.05 (25) = 2.06进一步检验斜率是否有变化,在上式中加入变量t D1, y = 2509.07 + 50.22 t + 1321.19 D1 - 1.95 t D1 (3) (28.24) (9.13) (6.85) (-0.17) R2 = 0.94, DW = 1.4, s.e. = 202.8
12、, F = 118.5, T=28, t0.05 (24) = 2.06由于回归系数 -1.95所对应的t值是 -0.17,可见斜率未发生变化。因此以模型 (2) 作为最后确立的模型。若不采用虚拟变量,得回归结果如下, y = 2731.03 + 57.15 t (4) (11.6) (4.0) R2 = 0.38, DW = 2.5, s.e. = 608.8, T = 28, t0.05 (26) = 2.06与(2)式相比,回归式(4)显得很差。2、 乘法方式(斜率变化) 以上只考虑定性变量影响截距,未考虑影响斜率,即回归系数的变化。当需要考虑时,可建立如下模型: yt = b0 + b
13、1 xt + b2 D + b3 xt D + ut ,其中xt为定量变量;D为定性变量。当D = 0 或1时,上述模型可表达为,yt =通过检验 b3是否为零,可判断模型斜率是否发生变化。图8.5 情形1(不同类别数据的截距和斜率不同) 图8.6 情形2(不同类别数据的截距和斜率不同) 例2:用虚拟变量区别不同历史时期(file:dummy2)中国进出口贸易总额数据(1950-1984)见上表。试检验改革前后该时间序列的斜率是否发生变化。定义虚拟变量D如下0 (1950 - 1977)D = 1 (1978 - 1984)中国进出口贸易总额数据(1950-1984) (单位:百亿元人民币)年
14、tradetimeDtime D年tradetimeDtime D19500.41510019681.085190019510.59520019691.069200019520.64630019701.129210019530.80940019711.209220019540.84750019721.469230019551.09860019732.205240019561.08770019742.923250019571.04580019752.904260019581.28790019762.641270019591.493100019772.725280019601.2841100197
15、83.5502912919610.908120019794.5463013019620.809130019805.6383113119630.857140019817.3533213219640.975150019827.7133313319651.184160019838.6013413419661.2711700198412.0103513519671.1221800以时间time为解释变量,进出口贸易总额用trade表示,估计结果如下:trade = 0.37 + 0.066 time - 33.96D + 1.20 time D (1.86) (5.53) (-10.98) (12.4
16、2) 0.37 + 0.066 time (D = 0, 1950 - 1977) = - 33.59 + 1.27 time (D = 1, 1978 - 1984) 上式说明,改革前后无论截距和斜率都发生了变化。进出口贸易总额的年平均增长量扩大了18倍。例3:香港季节GDP数据(单位:千亿港元)的拟合(虚拟变量应用, file:dummy6)19901997年香港季度GDP呈线性增长。1997年由于遭受东南亚金融危机的影响,经济发展处于停滞状态,19982002年底GDP总量几乎没有增长(见上图)。对这样一种先增长后停滞,且含有季节性周期变化的过程简单地用一条直线去拟合显然是不恰当的。为区
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 方程 回归 模型 几个 专题

链接地址:https://www.31ppt.com/p-5066202.html