《虚拟变量回归》PPT课件.ppt
《《虚拟变量回归》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《虚拟变量回归》PPT课件.ppt(37页珍藏版)》请在三一办公上搜索。
1、1,虚拟变量回归,1,很多研究认为,影响商品房价格的因素有多个方面,例如:1.成本费用因素:包括土地、建筑物建造成本、其他费用;2.房地产供求因素:包括住房需求量、房地产开发量等;3.经济因素:包括宏观经济状况、物价状况、居民收入状况等;4. 人口因素:包括人口密度、家庭结构等;5.社会因素:包括社会治安、城市化水平、消费心理等;6.行政(政策)因素:包括土地与住房制度、房地产价格政策等;7.区域因素:包括所处地段的市政基础设施、交通状况等;8.个别因素:包括朝向、结构、材料、功能设计、施工质量等;9.房地产投机因素:投机者在房地产市场中的投机活动;10.自然因素:包括自然环境、地质、地形、地
2、势及气候等。(资料来源:徐静; 武乐杰, 房地产价格影响因素的解释结构模型分析, 金融经济, 2009年 10期),2,引子1 影响房地产价格的复杂因素,3,在影响房地产价格的众多因素中,有定量的因素: 成本因素、房地产供求因素、经济因素、人口因素等;也有定性的因素: 社会因素、行政因素、区位因素、个别因素、投机因 素、 自然因素等。在研究房地产价格影响机理时,需要分析那些不易量化的定性因素对房地产价格是否真的有显著影响。能否把定性的因素也引入计量经济模型中呢? 怎样才能在模型中有效地表示这些定性因素的作用呢?,引子2 男女大学生的消费真的有差异吗?,当代大学生在消费结构呈现出多元化趋势。大学
3、生除了日常生活费开支以外,还有人际交往、网络通讯、书报、衣着、化妆品、电脑、旅游、食品、学习用品、各种考证等消费。不同性别大学生的消费结构有所不同,专科生、本科生、研究生的消费结构更有差异。不同年级之间,男女同学之间,消费水平、消费结构、消费方式上都存在着差异。(注:来源于新华网等:共青团中央、全国学联共同发布的中国大学生消费与生活形态研究报告 )为了研究男女大学生、不同层次大学生、不同年级大学生的消费结构是否有差异,需要将这些定性的因素引入计量模型,怎样才能在模型中有效地表示这类定性因素的作用呢?,4,第一节 虚拟变量,一、什么是虚拟变量,5,变量可分以为两类:数量变量与属性变量 可用数量表
4、现的变量 只表明属性的不连续变量属性变量:不能精确计量的说明某种属性或状态的定性变量,如性别、民族、战争、政治事件 本身是定性的二分类变量(非此即彼) 本来是连续变量也可转换为定性变量(如上线/不上线) 问题:属性变量一般难以直接用数据去度量虚拟变量:人工构造的取值为0和1的作为属性变量代表的变量称虚拟变量,一般常用D(dummy) 表示 D=0 表示某种属性或状态不出现或不存在 D=1 表示某种属性或状态出现或存在,虚拟变量的作用 作为属性因素的代表,如性别(男/女) 作为某些非精确计量的数量因素的代表, 如受教育程度(高中及以下、专科、本科及以上) 作为某些偶然因素或政策因素的代表, 如
5、伊拉克战争、“911事件”、四川汶川大地震 时间序列分析中作为季节(月份)的代表 分段回归研究斜率、截距的变动 比较两个回归模型的差异 虚拟被解释变量模型:被解释变量本身是定性变量 面板数据回归中的应用,6,二、虚拟变量模型,虚拟变量模型:包含有虚拟变量的模型称虚拟变量模型 三种类型: 1. 解释变量中只包含虚拟变量作用:假定其他因素都不变,只研究某种定性因素在某定量变量上是否表现出显著差异 (只论有无显著差异,不论差异的原因)2. 解释变量中既含定量变量,又含虚拟变量 作用:研究定量变量和虚拟变量同时对被解释变量的影响 3. 虚拟被解释变量模型:被解释变量本身取值为0或1作用:对某社会经济现
6、象进行“是”与“否”判断研究 (离散选择模型),7,三、虚拟变量的设置规则,1、虚拟变量取值 虚拟变量D取值为0,还是取值为1,要根据研究的目的去决定,注意区分所代表的基础类型和比较类型 D取值为0的类型基础类型,作为比较的基准 D取值为1的类型与基础类型相比较的类型 例如:D=0 如果是女性(基础类型) D=1 如果是男性(比较类型) D=0 为“911事件”以前(基础类型) D=1 为“911事件”以后(比较类型) D=0 不是大学毕业生(基础类型) D=1 是大学毕业生(比较类型),8,9,和 取值均为0的类型基础类型: 是比较的基准, 代表了基准组(西部地区)的截距 或 分别取值为1的
7、类型是与基础类型比较的类型,其中 和 为(与西部的)差异截距系数,为东部地区,为中部地区,为其他(不是东部),为其他(不是中部),又如,研究东、中、西部地区居民收入X与消费支出Y的关系:,注意:各类型间“非此即彼”, 和 不能同时取值为1,(是为了说明与基础类型的差异,而不是非基础类型相互之间比较的差异),10,(1)对于有截距项的模型如果模型中每个定性因素有m个相互排斥的类型,模型中只能引入m-1个虚拟变量,否则会出现完全多重共线性例如:一个定性因素有三种类型,若设三个虚拟变量若 ; 若 ,等等。显然此时 ,而截距 对应的变量正是1, 再次生成了截距项,则导致了完全的多重共线性,这称为“虚拟
8、变量陷阱”。,2、避免落入“虚拟变量陷阱”,11,模型为此时虽然有 , , ,且 ,但因没有截距项(或视截距项对应变量为0),所以不会出现完全的多重共线性。注意: 此时 等参数不再是差异截距系数,而分别是相应类型的截距。,(2)对于无截距项模型,第二节 虚拟解释变量回归,定性变量作为解释变量,既可以影响模型的截距,也可以 影响模型的斜率,还可以同时影响截距和斜率 一、用虚拟变量表示不同截矩的回归 加法类型虚拟变量以加法方式引入模型的作用:可以改变模型中截距,可分为各种情况去设置虚拟变量,12,只使截距变动(平行回归),只使斜率变动 (共点回归),使截距与斜率都变动 (不同的回归),13,1.解
9、释变量只有一个分为两种类型的定性变量无定量变量的回归这种模型又称方差分析模型 其中:为公立学校教师工资, =0为农村学校;D=1为城镇学校分析条件期望: 基础类型: 比较类型: 为差异截距系数,通过对系数 的 t 检验:可检验在其他因素不变的条件下,城乡教师的工资是否有显著差别特点:假定其他因素都不变,只研究某种定性因素在某定量变量上是否表现出显著差异 (只论有无显著差异,不论差异的原因),13,2、解释变量包含一个定量变量和一个分为两种类型的定性变量的回归例1: 为服装消费 为收入, =0为男性 D=1为女性分析条件期望: 基础类型: 比较类型: 为差异截距系数。对系数 的 t 检验:可检验
10、定性因素对截距是否有显著影响注意: 应服从基本假定 这里一个定性变量具有两种类型,只使用了一个虚拟 变量(为什么?),14,例2 其中: 年工资 工龄 D=1 大学毕业及以上 D=0 其他(非大学毕业)非大学毕业(基准类型)大学毕业及以上,15,注意:同一个虚拟变量取值意义 的设定要”非此即彼”,3、解释变量包含一个定量变量和一个两种以上类 型的定性变量的回归,例如:高中以下、高中毕业、大学毕业及以上三种类型模型 年工资 工龄 =1 只是高中毕业 =1 大学毕业及以上 =0 其他 =0 其他 基础类型: (高中以下)比较类型: (高中) (大学及以上) 差异截距系数为 和问题:如果还要区分“专
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 虚拟变量回归 虚拟 变量 回归 PPT 课件
链接地址:https://www.31ppt.com/p-1311602.html