包含虚拟变量的回归模型.ppt
《包含虚拟变量的回归模型.ppt》由会员分享,可在线阅读,更多相关《包含虚拟变量的回归模型.ppt(27页珍藏版)》请在三一办公上搜索。
1、1,第6章包含虚拟变量的回归模型,Multiple Regression Analysis:Dummy variables,2,6.1 虚拟变量的性质,虚拟变量(dummy variable),又称哑变量,是其值只取1或0的变量,一般在回归模型中用D表示。现实中的很多定性的因素,往往不能用具体的数值表示出来,而使用哑变量则可以更好的描述。比如,性别、种族、肤色、结婚与否、是否是基地班、是否是班干部、是否是党员、是否有男女朋友等等。诸如此类的定性因素,一般可以用哑变量来进行描述。例如:定义性别变量female,如果是女性,female=1,如果是男性,female=0。那么,female就是一个
2、虚拟变量。,3,6.1 虚拟变量的性质:例子,工资决定的例子wage=b0+b1female+u假设E(u)=0E(wage|female=1)=b0+b1 表示的是女性的平均工资水平E(wage|female=0)=b0表示的是男性的平均工资水平b1代表了女性与男性之间的平均工资差别。,4,虚拟变量:工资决定模型,使用wage.raw(wooldridge),估计结果如下:wge=7.099 2.512female(0.21)(0.30)n=526 R2=0.1157 F=68.54所以,女性的平均小时工资(female=1)为4.588美元。男性的平均小时工资(female=0)为7.09
3、9则女性比男性的平均小时工资低2.512美元(即对应虚拟变量的回归系数)。,5,6.2包含一个定量变量,一个虚拟变量的回归模型,wage=b0+b1female+b2educ+ufemale仍然是一个性别虚拟变量,取值同前E(wage|female=0,educ)=b0+b2educ给定受教育水平,男性的平均小时工资E(wage|female=1,educ)=b0+b1+b2educ 给定受教育水平,女性的平均小时工资b1仍然是男女之间的平均小时工资差别。男女的平均小时工资对教育(educ)具有相同的斜率,不同的截距。表明,无论男女都有相同的教育收益,即工资对教育的变动都为b2。,6,6.2工
4、资决定模型:例子,wge=0.623-2.273female+0.506educSe=(0.673)(0.279)(0.050)p=(0.355)(0.000)(0.000)n=526 R2=0.2588 Adj-R2=0.2560 F=91.32,7,8,虚拟变量的性质,1、如果一个定性变量只有两个取值,那么在模型中,我们只需加入一个虚拟变量即可。比如性别变量,我们可以设定个虚拟变量D,当性别为男时D1,性别为女是D0。不需要设置两个虚拟变量,否则则会出现完全共线性,无法进行估计。因此,一个基本的原则是,如果定性变量有m个类别,我们则需要取m-1个虚拟变量。2、虚拟变量的赋值是任意的,根据各
5、个研究偏好。3、取值为0的一类一般常为基准类或对比类等。比如,前文的例子中female=0,即男性是基准类。即模型估计结果得到的截距直接代表基准类男性的平均工资水平。4、虚拟变量D的系数称为差别截距系数,它表明了D1与基准类截距的差别。因此前文的b1表示女性与男性的平均工资差别。,9,刚才估计的例子,wge=0.623-2.273female+0.506educSe=(0.673)(0.279)(0.050)p=(0.355)(0.000)(0.000)n=526 R2=0.2588 Adj-R2=0.2560 F=91.32 当性别固定时,受教育程度每增加1年,其平均小时工资水平将增加0.5
6、06美元。当受教育程度固定不变时,女性的平均小时工资比男性的少2.273美元。男性的平均小时工资wge=0.623+0.506educ女性的平均小时工资wge=-1.651+0.506educ,10,6.3虚拟变量有多种分类的情况,有时我们所考察的定性变量会超过2个值,这时我们不能单纯的用数字的形式表示,也无法用刚才0或1的数值形式表示。要用多个虚拟变量来进行分解。比如对于受教育程度,我们现在不是用具体的受教育年限来反应,而是用下列三类来反应不同的受教育的程度:未达到中学水平,中学水平及大学水平。这时我们不能用令未达到中学水平为0,中学水平为1,大学水平为2的形式(?)。我们可以使用两个虚拟变
7、量来分解受教育程度这一因素,比如定义D21表示为中学水平,D20表示非中学水平;同样用D31表示大学水平,而D30表示非大学水平。,11,例子:工资决定,wage=b0+b1exper+b2D2+b3D3+u其中则E(wage|exper,D2=0,D3=0)=b0+b1exper 表示小学水平的人的平均小时工资E(wage|exper,D2=1,D3=0)=b0+b1exper+b2表示中学水平的人的平均小时工资E(wage|exper,D2=0,D3=1)=b0+b1exper+b3表示大学以上水平的人的平均小时工资,12,例子:工资决定(续),估计结果wge=1.675+0.187exp
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 包含 虚拟 变量 回归 模型

链接地址:https://www.31ppt.com/p-6102356.html