欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    《虚拟变量回归》PPT课件.ppt

    • 资源ID:1311602       资源大小:1.92MB        全文页数:37页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    《虚拟变量回归》PPT课件.ppt

    1,虚拟变量回归,1,很多研究认为,影响商品房价格的因素有多个方面,例如:1.成本费用因素:包括土地、建筑物建造成本、其他费用;2.房地产供求因素:包括住房需求量、房地产开发量等;3.经济因素:包括宏观经济状况、物价状况、居民收入状况等;4. 人口因素:包括人口密度、家庭结构等;5.社会因素:包括社会治安、城市化水平、消费心理等;6.行政(政策)因素:包括土地与住房制度、房地产价格政策等;7.区域因素:包括所处地段的市政基础设施、交通状况等;8.个别因素:包括朝向、结构、材料、功能设计、施工质量等;9.房地产投机因素:投机者在房地产市场中的投机活动;10.自然因素:包括自然环境、地质、地形、地势及气候等。(资料来源:徐静; 武乐杰, 房地产价格影响因素的解释结构模型分析, 金融经济, 2009年 10期),2,引子1 影响房地产价格的复杂因素,3,在影响房地产价格的众多因素中,有定量的因素: 成本因素、房地产供求因素、经济因素、人口因素等;也有定性的因素: 社会因素、行政因素、区位因素、个别因素、投机因 素、 自然因素等。在研究房地产价格影响机理时,需要分析那些不易量化的定性因素对房地产价格是否真的有显著影响。能否把定性的因素也引入计量经济模型中呢? 怎样才能在模型中有效地表示这些定性因素的作用呢?,引子2 男女大学生的消费真的有差异吗?,当代大学生在消费结构呈现出多元化趋势。大学生除了日常生活费开支以外,还有人际交往、网络通讯、书报、衣着、化妆品、电脑、旅游、食品、学习用品、各种考证等消费。不同性别大学生的消费结构有所不同,专科生、本科生、研究生的消费结构更有差异。不同年级之间,男女同学之间,消费水平、消费结构、消费方式上都存在着差异。(注:来源于新华网等:共青团中央、全国学联共同发布的中国大学生消费与生活形态研究报告 )为了研究男女大学生、不同层次大学生、不同年级大学生的消费结构是否有差异,需要将这些定性的因素引入计量模型,怎样才能在模型中有效地表示这类定性因素的作用呢?,4,第一节 虚拟变量,一、什么是虚拟变量,5,变量可分以为两类:数量变量与属性变量 可用数量表现的变量 只表明属性的不连续变量属性变量:不能精确计量的说明某种属性或状态的定性变量,如性别、民族、战争、政治事件 本身是定性的二分类变量(非此即彼) 本来是连续变量也可转换为定性变量(如上线/不上线) 问题:属性变量一般难以直接用数据去度量虚拟变量:人工构造的取值为0和1的作为属性变量代表的变量称虚拟变量,一般常用D(dummy) 表示 D=0 表示某种属性或状态不出现或不存在 D=1 表示某种属性或状态出现或存在,虚拟变量的作用 作为属性因素的代表,如性别(男/女) 作为某些非精确计量的数量因素的代表, 如受教育程度(高中及以下、专科、本科及以上) 作为某些偶然因素或政策因素的代表, 如 伊拉克战争、“911事件”、四川汶川大地震 时间序列分析中作为季节(月份)的代表 分段回归研究斜率、截距的变动 比较两个回归模型的差异 虚拟被解释变量模型:被解释变量本身是定性变量 面板数据回归中的应用,6,二、虚拟变量模型,虚拟变量模型:包含有虚拟变量的模型称虚拟变量模型 三种类型: 1. 解释变量中只包含虚拟变量作用:假定其他因素都不变,只研究某种定性因素在某定量变量上是否表现出显著差异 (只论有无显著差异,不论差异的原因)2. 解释变量中既含定量变量,又含虚拟变量 作用:研究定量变量和虚拟变量同时对被解释变量的影响 3. 虚拟被解释变量模型:被解释变量本身取值为0或1作用:对某社会经济现象进行“是”与“否”判断研究 (离散选择模型),7,三、虚拟变量的设置规则,1、虚拟变量取值 虚拟变量D取值为0,还是取值为1,要根据研究的目的去决定,注意区分所代表的基础类型和比较类型 D取值为0的类型基础类型,作为比较的基准 D取值为1的类型与基础类型相比较的类型 例如:D=0 如果是女性(基础类型) D=1 如果是男性(比较类型) D=0 为“911事件”以前(基础类型) D=1 为“911事件”以后(比较类型) D=0 不是大学毕业生(基础类型) D=1 是大学毕业生(比较类型),8,9,和 取值均为0的类型基础类型: 是比较的基准, 代表了基准组(西部地区)的截距 或 分别取值为1的类型是与基础类型比较的类型,其中 和 为(与西部的)差异截距系数,为东部地区,为中部地区,为其他(不是东部),为其他(不是中部),又如,研究东、中、西部地区居民收入X与消费支出Y的关系:,注意:各类型间“非此即彼”, 和 不能同时取值为1,(是为了说明与基础类型的差异,而不是非基础类型相互之间比较的差异),10,(1)对于有截距项的模型如果模型中每个定性因素有m个相互排斥的类型,模型中只能引入m-1个虚拟变量,否则会出现完全多重共线性例如:一个定性因素有三种类型,若设三个虚拟变量若 ; 若 ,等等。显然此时 ,而截距 对应的变量正是1, 再次生成了截距项,则导致了完全的多重共线性,这称为“虚拟变量陷阱”。,2、避免落入“虚拟变量陷阱”,11,模型为此时虽然有 , , ,且 ,但因没有截距项(或视截距项对应变量为0),所以不会出现完全的多重共线性。注意: 此时 等参数不再是差异截距系数,而分别是相应类型的截距。,(2)对于无截距项模型,第二节 虚拟解释变量回归,定性变量作为解释变量,既可以影响模型的截距,也可以 影响模型的斜率,还可以同时影响截距和斜率 一、用虚拟变量表示不同截矩的回归 加法类型虚拟变量以加法方式引入模型的作用:可以改变模型中截距,可分为各种情况去设置虚拟变量,12,只使截距变动(平行回归),只使斜率变动 (共点回归),使截距与斜率都变动 (不同的回归),13,1.解释变量只有一个分为两种类型的定性变量无定量变量的回归这种模型又称方差分析模型 其中:为公立学校教师工资, =0为农村学校;D=1为城镇学校分析条件期望: 基础类型: 比较类型: 为差异截距系数,通过对系数 的 t 检验:可检验在其他因素不变的条件下,城乡教师的工资是否有显著差别特点:假定其他因素都不变,只研究某种定性因素在某定量变量上是否表现出显著差异 (只论有无显著差异,不论差异的原因),13,2、解释变量包含一个定量变量和一个分为两种类型的定性变量的回归例1: 为服装消费 为收入, =0为男性 D=1为女性分析条件期望: 基础类型: 比较类型: 为差异截距系数。对系数 的 t 检验:可检验定性因素对截距是否有显著影响注意: 应服从基本假定 这里一个定性变量具有两种类型,只使用了一个虚拟 变量(为什么?),14,例2 其中: 年工资 工龄 D=1 大学毕业及以上 D=0 其他(非大学毕业)非大学毕业(基准类型)大学毕业及以上,15,注意:同一个虚拟变量取值意义 的设定要”非此即彼”,3、解释变量包含一个定量变量和一个两种以上类 型的定性变量的回归,例如:高中以下、高中毕业、大学毕业及以上三种类型模型 年工资 工龄 =1 只是高中毕业 =1 大学毕业及以上 =0 其他 =0 其他 基础类型: (高中以下)比较类型: (高中) (大学及以上) 差异截距系数为 和问题:如果还要区分“专科”、“本科”、“硕士”、“博士”应怎么办?,16,注意: 应服从基本假定一个定性变量有三种类型,使用了两个虚拟变量, 和 代表的是同一个定性变量的两种不同类型同一个虚拟变量取值意义的设定要”非此即彼”两个差异截距系数 和 表示的都是与基础类型的差异一个定性变量有多种类型时,虚拟变量可同时取值为0,但不能同时取值为1,因同一定性变量的各类型间“非此即彼”,17,4、解释变量包含一个定量变量和两个定性变量,例如模型: 为文化支出,为收入 用t检验分别检验 和 的统计显著性:可以分别验 证两个定性变量对截距是否有显著影响,高中及以上文化程度,农村居民,城镇居民,高中以下文化程度,18,对比类型:,这里的 和 代表的是两个不同的定性变量,各分为两种类型基础类型:,注意: 应服从基本假定 两个定性变量分别有两种类型,可以用两个虚拟变量,不会落入虚拟变量陷阱(为什么?)注意:“两个定性变量个两种类型”和“一个定性变量三种类型”都用了两个虚拟变量,但其性质是不同的。 K个定性变量可选用K个虚拟变量去表示,这不会出现“虚拟变量陷阱” 代表不同定性变量的虚拟变量,可以同时为0,也可同时为1,因为代表不同定性变量的虚拟变量之间并没有“非此即彼”的关系。,19,二、用虚拟变量表示不同斜率的回归,加法形式引入虚拟变量只能分析不同截距(平行回归)的差异 模型中斜率系数的差异,可用以乘法形式引入的虚拟变量去表示。,乘法类型,重合回归,同截距(共点)回归,非相似(不同)回归,20,不同截距(平行回归),21,1. 回归模型比较结构变化的检验,回顾:邹氏参数稳定性检验可以检验模型结构是否发生了变化:结构无变化 作受约束模型;结构变化 作无约束模型但是,邹氏检验只能检验模型结构是否发生变化,不能说明具体变化了多少,也不能说明究竟是截距变化还是斜率变化。,21,22,用虚拟变量对结构变化的检验,模型 基础类型: 对比类型: 可看出:以加法引入虚拟变量D的系数是截距的差异系数, 以乘法引入虚拟变量D的系数是斜率的差异系数 用t检验分别检验 和 的显著性:可检验此定性变量对截距和斜率是否有显著影响,即检验两个回归的结构是否有差异 优点: 用一个回归替代了多个回归,简化了分析过程 可方便地检验各种假设 合并回归增加了自由度,提高参数估计的精确性 注意: 所比较的方程应是同方差,否则会出现异方差 应服从基本假定,2.交互效应分析,基本思想:分析两个定性变量对被解释变量影响的虚拟变量模型,暗含着假定:两个定性变量是分别独立影响被解释变量的。但在实际经济活动中,两个定性变量对被解释变量的影响可能存在交互作用。为描述这种交互作用,可把代表两个定性因素的虚拟变量的乘积以加法形式引入模型。 模型: 其中: 代表第一个定性变量的虚拟变量 代表第二个定性变量的虚拟变量 ( )描述二者交互效应的虚拟变量 因为 其中 是交互效应的截距差异系数,可以通过对 的显著性的检验,可以判断是否存在交互效应,23,例如其中: 种油菜籽和养蜂的收入 投入资金 代表是否种油菜籽的虚拟变量 =1 种油菜籽 =0 不种油菜籽 代表是否养蜂的虚拟变量 =1 养蜂 =0 不养蜂 ( )描述种油菜籽与养蜂的交互效应,24,在农村经常见到的景象!,3.分段线性回归,基本思想: 有的社会经济现象的变动,会在解释变量 达到某个临界值时发生突变,为了区分 不同阶段的截距和斜率可利用虚拟变量 进行分段回归 第一段回归,当 时( 是临界值) 第二段回归,当 时 整理得 例如:不同销售业绩的奖励方式不同,25,怎样用一个模型统一估计和检验分段的回归呢? 模型形式 其中: 1 若 0 若 第一段回归 第二段回归 注意:第一、二段回归不仅截距不同,而且斜率也不同 分为两段回归时用了一个虚拟变量 推理:分为K段回归时,可用K1个虚拟变量,26,4.季节变动分析中的应用思想:时间序列数据可分解为四个因素: 长期趋势; 季节变动; 循环变动; 随机(不规则)变动为消除季节变动影响,常用修匀方法。为预测某季度变量又需加入季节因素。也可利用虚拟变量方法区分季节因素。方法:例如某商品销售量Q与价格P有关,可能还与季节有关(1)引入四个季度影响因素 其中: 销售量 价格 为二季度 为三季度 为四季度 为其它 为其它 为其它 注意:一年分为四季,使用三个虚拟变量(为什么?),27,(2)显著性检验对 作 t 检验,若显著不为0,表明该季度有季节变化影响;若显著为0,表明不存在季节变动影响(3)重建季节变动模型例如只是二季度有明显季节性变动,可省略 重建模型D=1为二季度; D=0为一、三、四季度在一、三、四季度时在二季度时,28,29,第三节 虚拟被解释变量,有时所研究的经济现象本身可能是定性变量。例如:是否购买住房?是否购买汽车?是否参加保险?是否按期归还贷款? 上市公司是否ST?定性的被研究对象作为被解释变量,也可用虚拟变 量0或1表示,其取值可能受多种因素影响。 虚拟被解释变量模型的估计和检验会产生一些特殊的 问题。将在高级计量经济学(二)“离散选择模型”中 专门讨论。,29,第四节 案例分析,一、问题提出:为了考察改革开放以来中国居民的储蓄存款增长与收入的关系是否发生变化,以城乡居民人民币储蓄存款年底余额代表居民储蓄(Y),以国民总收入GNI代表城乡居民收入,分析居民收入对储蓄存款影响的数量关系。二、数据:1978-2008年中国的国民总收入和城乡居民人民币储蓄存款年底余额及增加额的数据。 (数据见P228表8.1),30,城乡居民储蓄存款、国民总收入随时间的变化情况,如图(1)所示。看不出居民的储蓄行为发生明显改变的信息。 若取居民储蓄的增加量(YY),作时序图(2),并作城乡居民储蓄存款增量与国民总收入之间关系的散布图(3)。(2)(3)均表现出明显的阶段特征。,三、分析变动情况,(1),(2),(3),32,居民储蓄时序,储蓄存款增量与国民总收入关系,四、建立模型,为了分析居民储蓄行为在1996年、 2000年、2005年、2007年前后五个阶段的数量关系,引入虚拟变量D1、D2、D3、D4,YY城乡居民储蓄存款增加量; GNI 国民总收入,70142.5是1996年的国民总收入 98000.5是2000年的国民总收入184088.6是2005年的国民总收入251483.2是2007年的国民总收入,33,其中:,34,34,34,34,对于,基础类型:1996年及以前,对比类型:1996年2000年,对比类型:2000年2005年,对比类型:2005年2007年,对比类型:2007年以后,五、估计参数与检验,各解释变量的系数显著地不等于0,居民人民币储蓄存款年增加额的回归模型分别为:,35,R2=0.986394,F=347.9964 DW=1.914501,居民储蓄增加额回归方程的截距和斜率有明显变化,1996年以前国民总收入每增加1亿元,平均说来居民储蓄存款增加额上升0.1330亿元;1996年-2000年国民总收入每增加1亿元,平均说来居民储蓄存款增加额下降0.0579亿元;2000年-2005年国民总收入每增加1亿元,平均说来居民储蓄存款增加额上升0.3755亿元;2005年-2007年国民总收入每增加1亿元,平均说来居民储蓄存款增加额下降0.2137亿元;在2007年以后国民总收入每增加1亿元,平均说来居民储蓄存款增加额上升0.3755亿元。,问题: 在上述建模过程中,只是运用虚拟变量区分几个时期,没有考虑通货膨胀等其他因素,也没有考虑时序数据的特殊问题。,注意:这里是”储蓄存款增加额”变动,不是”储蓄存款总量”变动!为什么出现这样的情况?应从经济意义(如政策与环境)上深入分析!,37,37,THANKS,第 八 章 讲 完 了!,有什么问题吗?,37,

    注意事项

    本文(《虚拟变量回归》PPT课件.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开