【教学课件】第八章虚拟变量回归.ppt
《【教学课件】第八章虚拟变量回归.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第八章虚拟变量回归.ppt(37页珍藏版)》请在三一办公上搜索。
1、经典线性回归模型默认回归系数为常数,没有考虑不同类别观测值对应的回归系数可能是有差别的,即没有把相关的定性影响因素引入到模型中来。例如,研究居民的消费行为时,构建如下模型:其中,Y为消费支出;X为收入。该模型默认城镇居民和农村居民的消费行为是无差异的,但如果城乡居民的消费行为存在差异,则对上述模型直接采用OLS估计,结果将是不精确的。为了有效的将定性影响因素反映到回归模型中,就需要采用虚拟变量方法。,第八章 虚拟变量回归,第一节 虚拟变量第二节 虚拟解释变量的回归第三节 虚拟被解释变量的回归第四节 案例,第一节 虚拟变量,一、虚拟变量(Dummy Variables)定义定义:就是用一个取值为
2、0和1的变量来表示定性变量中的一个属性类别,1表示出现该属性,0表示没有出现该属性。虚拟变量也叫设计变量(Design Variables,Hosmer&Lemeshow,1989)、代理变量(Proxy Variables,Kennedy,1981)等。作用:回归分析中,虚拟变量方法可有效的衡量诸如性别、战争、地震、政治动乱、经济政策变化及季节等定性变量对因变量的影响。,二、虚拟变量设置规则如果研究的定性变量包含M个类别,将构建个M-1个虚拟变量,省略的那个类别可视为参照组。如在消费模型中,考虑区域因素(东部,中部,西部)影响,可构建2个虚拟变量:,注:如果针对包含M个类别的定性因素构造M个
3、虚拟变量,则会陷入虚拟变量陷阱(Dummy Variable Trap),即由于而带来了完全的多重共线性。在没有截距项的模型中,对于包含M个类别的定性因素,构建M个虚拟变量虽不会产生虚拟变量陷阱,但此时检验截距的差值将变的更困难,而且没有截距项时怎样计算 也没有一个一致同意的方法,所以该方法很少人使用(Jeffrey M.Wooldridge,2000)。,第二节 虚拟解释变量模型,采用虚拟变量可有效的衡量不同观测类别对应回归参数的差异性,其中以加法方式引入虚拟变量可以反映不同类别对应截距的不同,以乘法方式引入虚拟变量可以反映不同类别对应斜率的不同。,一、加法模型以加法方式引入虚拟变量,即将虚
4、拟变量当作自变量直接引入模型。研究居民的消费行为时,考虑居民来源(城镇、农村)这个因素,则需构建虚拟变量:加法模型:,如果该模型设定正确,则有,此时有:可见,截距虚拟变量D的系数 反映了城乡居民之间自发性消费水平的差异。,二、乘法模型以乘法方式引入虚拟变量,即将虚拟变量与解释变量乘积项当作自变量直接引入模型。在消费模型中以乘法方式引入虚拟变量,即引入虚拟变量和自变量的交互乘积项DX:如果该模型设定正确,此时有:可见,城镇居民的边际消费倾向为,农村居民的边际消费倾向为。,如果不同属性类别对应的截距项和斜率项都是有差异的,可在回归模型中同时引入虚拟变量的加法方式和乘法方式,结果如下:对于城镇居民和
5、农村居民这两个类别,有总体回归函数如下:可见,和 分别表示城镇居民与农村居民的消费函数在截距和斜率上的差异。,注:对于包含多个类别(M个)的属性变量,构建M-1个虚拟变量,如在消费模型中,考虑区域因素(东部,中部,西部)影响,可构建2个虚拟变量:若考虑不同区域居民对应回归模型截距的不同,可构建模型如下:,则有:如果模型中包含不止一个定性变量,利用虚拟变量还可以研究定性变量对因变量的交互影响。如在消费模型中,同时考虑性别(男,女)和来源(城镇,农村)两个因素,构建虚拟变量如下:,可以加法方式引进两个虚拟变量的交互乘积项,构建模型如下:则有:可见,反映性别的影响,反映了居民来源影响,而 反映了性别



- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 第八 虚拟 变量 回归

链接地址:https://www.31ppt.com/p-5663256.html