第7讲包含虚拟变量的回归分析.ppt
《第7讲包含虚拟变量的回归分析.ppt》由会员分享,可在线阅读,更多相关《第7讲包含虚拟变量的回归分析.ppt(42页珍藏版)》请在三一办公上搜索。
1、第七讲 包含虚拟变量的回归分析Regression Analysis with Dummy Variables,一、什么是虚拟变量?二、自变量中包含虚拟变量三、因变量为虚拟变量,一、什么是虚拟变量?,什么是虚拟变量?,变量的分类定类/类别变量(nominal/categorical variable)定序/有序变量(ordinal variable)定距/定量变量(interval variable)问题:如何在计量分析中使用定类变量和定序变量,什么是虚拟变量?,对于只有两种取值的定类变量,可以用0和1表示这两种取值。这样的变量称为虚拟变量(dummy variable)或二分变量(binar
2、y variable)。其中,赋值为0的一组称为对照组(reference group)或基准组(benchmark group)注意:变量名的选择,什么是虚拟变量?,对于有多个取值的定类变量,可构造多个虚拟变量来表示用east、central、west三个虚拟变量表示不同地区用sx、jy、qt三个虚拟变量表示本科生毕业后的状态,什么是虚拟变量?,对于定序变量和定距变量,也可以用虚拟变量表示学习成绩(定序变量)年收入(定距变量,但通过划分收入区间将之转换为虚拟变量),自变量中包含一个虚拟变量自变量中包含多个虚拟变量交互项,二、自变量中包含虚拟变量,自变量中包含一个虚拟变量,自变量仅为一个虚拟变
3、量如果自变量仅为一个虚拟变量,实际上是以自变量为分类依据,分析因变量的均值差异,自变量中包含一个虚拟变量,例题7_1:工资差异,自变量中包含一个虚拟变量,自变量包含定距变量和一个虚拟变量此时,虚拟变量的回归系数表示在控制其它自变量的情况下,两组之间的差异例题7_2:课本p217,例7.2,自变量中包含一个虚拟变量,自变量包含定距变量和一个虚拟变量虚拟变量可用于政策分析,虚拟变量取值为0的一组称为控制组或对照组(control group),取值为1的一组称为实验组(experimental group)或处理组(treatment group)例题7_3:课本p218,例7.3,自变量中包含多
4、个虚拟变量,自变量中包含多个虚拟变量可分为三种情况每个虚拟变量代表不同的分类若干个虚拟变量代表同一种分类,且这种分类是定类的若干个虚拟变量代表同一种分类,且这种分类是定序的,自变量中包含多个虚拟变量,每个虚拟变量代表不同的分类例题7_4:性别和婚姻状况对工资的影响(课本p220,例7.6)引入性别和婚姻状况两个虚拟变量上述结果表明,性别对工资有显著影响,但婚姻状况没有显著影响。这一模型可能存在问题,即假定婚姻状况的影响对于男性和女性是相同的。进一步的分析应考虑婚姻状况的影响存在性别差异。,自变量中包含多个虚拟变量,每个虚拟变量代表不同的分类例题7_4:性别和婚姻状况对工资的影响(课本p220,
5、例7.6)虚拟变量的定义如果有n种分类,则回归时只能引入n-1个虚拟变量,否则会造成完全共线性。未引入的即为对照组。下面是以单身男性为对照组的回归结果:,自变量中包含多个虚拟变量,每个虚拟变量代表不同的分类例题7_4:性别和婚姻状况对工资的影响(课本p220,例7.6)不同性别和婚姻状况个体的样本回归方程,自变量中包含多个虚拟变量,每个虚拟变量代表不同的分类例题7_4:性别和婚姻状况对工资的影响(课本p220,例7.6)根据研究关注问题的不同,可以选择不同的对照组。下面是以已婚女性为对照组的回归结果:,自变量包含多个虚拟变量,若干个虚拟变量代表同一种分类,且这种分类是定类的例题7_5:工资的地
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 包含 虚拟 变量 回归 分析

链接地址:https://www.31ppt.com/p-5136075.html