多元离散选择模型.ppt
多元离散选择模型,胡 枫北京科技大学经济管理学院二一一年十月,北京科技大学经济管理学院 胡 枫,2,本讲内容,多元离散选择模型定序选择模型,一、多元离散选择模型,北京科技大学经济管理学院 胡 枫,4,问题:农村异地转移劳动力的迁移目的地,被解释变量:迁移目的地,即小城镇、县级市、地级市、省级城市和超大城市,依次取值1、2、3、4、5。解释变量:个人特征、家庭特征和目前所在地属性。连续变量包括受教育程度、家庭规模、家庭内其他劳动力人数、家庭负担、原有收入、现有收入,目前所在地属性中的所在地农村人口、国内生产总值、城乡居民储蓄余额、粮食产量、中学生在校人数、小学生在校人数等。离散变量包括性别、婚姻状况、收入稳定与否,目前所在地所属级别与家乡所在地所属级别等。,与上次讲的有何不同?,北京科技大学经济管理学院 胡 枫,5,Multinomial Logistic Model,Multinomial logistic regression involves nominal response variables more than two categories Multinomial logit models are multi-equation modelsA response variable with j+1 categories will generate j equationsEach of these j equations is a binary logistic regression comparing a group with the reference group Multinomial logistic regression simultaneously estimates the j logits,北京科技大学经济管理学院 胡 枫,6,多元离散选择Logit模型,如果决策者i在(J+1)项可供选择方案中选择了第j项,那么其效用模型为:,如果(J+1)个随机误差项互不相关,并且服从类极值分布,选择j的概率,北京科技大学经济管理学院 胡 枫,7,多元离散选择Logit模型,北京科技大学经济管理学院 胡 枫,8,多元离散选择Logit模型,X中未包含备选方案所具有的属性变量,而参数向量B对不同的选择方案(即不同的方程)是不同的。,令B0=0,j=1,2,J,北京科技大学经济管理学院 胡 枫,9,Multinomial Logistic Model,Therefore,we can obtain the following probabilities relative to the reference group:The coefficients,represent the log odds of being in the target groups relative to the reference group,北京科技大学经济管理学院 胡 枫,10,参数估计,北京科技大学经济管理学院 胡 枫,11,Ex1.Binary Logistic Model Result,Dependent variable:honcomp,北京科技大学经济管理学院 胡 枫,12,Stata Output,北京科技大学经济管理学院 胡 枫,13,Multinomial Logistic Model Result,Dependent variable:prog,北京科技大学经济管理学院 胡 枫,14,Stata Output,北京科技大学经济管理学院 胡 枫,15,例2 农村异地转移劳动力的迁移目标研究,被解释变量:迁移目标,即小城镇、县级市、地级市、省级城市和超大城市,依次取值1、2、3、4、5。解释变量:个人特征和目前所在地属性。连续变量包括受教育程度、家庭规模、家庭内其他劳动力人数、家庭负担、原有收入、现有收入,目前所在地属性中的所在地农村人口、国内生产总值、城乡居民储蓄余额、粮食产量、中学生在校人数、小学生在校人数等。离散变量包括性别、婚姻状况、收入稳定与否,目前所在地所属级别与家乡所在地所属级别等。虽然作为被解释变量的城市规模本身是有序的,但是对于农村劳动力来说,选择进入哪一个级别的城市,本身是无序的,因此对于城市化迁移目标构造多元名义logit离散选择模型。,北京科技大学经济管理学院 胡 枫,16,调查样本:有效样本303份。用统计软件进行估计与分析(SAS、Stata、SPSS均可)。首先将定义的全部变量放进模型中进行估计,并通过比较各个变量的P值来考虑具体剔除哪些变量以及对哪些变量考虑将其交互影响的效应放进模型中去。小城镇、县级市、地级市、省级城市和超大城市依次取值1、2、3、4、5。,北京科技大学经济管理学院 胡 枫,17,最终模型的估计结果(部分),*代表的是90的显著性水平,*代表的是95的显著性水平,*代表的是99的显著性水平。,北京科技大学经济管理学院 胡 枫,18,教育程度、家庭情况及现有收入对迁移目标的影响:,Log(小城镇/超大城市),Log(县级市/超大城市),Log(地级市/超大城市),Log(省级市/超大城市),北京科技大学经济管理学院 胡 枫,19,从教育程度来看,所有系数都是负值,教育程度越高的农村劳动力越愿意进入规模较大的城市;从显著性水平来看,相对于超大城市来说,县级市被选择的可能性最小,其次是小城镇,然后是地级城市,而教育程度相似的农村劳动力在省级城市与超大城市之间的选择没有明显的差异从家庭情况来看,所有系数都是负值,也就是说家庭情况越好的农村劳动力越愿意进入规模较大的城市;从显著性水平来看,相对于超大城市来说,省级城市最不容易被选中,其次是县级市,而小城镇与地级市之间没有明显区别从现有收入来看,所有系数都是负值,也就是说目前收入越高的农村劳动力越愿意进入规模较大的城市;再从显著性水平来看,所有系数都是显著的,这说明相对于任何级别的城市而言,农村劳动力都更倾向于超大城市,结果解释,北京科技大学经济管理学院 胡 枫,20,Other Models for Nominal Outcomes,Conditional LogitAttributes of choices can be used as predictorsExample:way of transportation(car,bus,bike)time,wealth,and ageNested LogitTreats a set of choices as a hierarchyIIA assumption can be relaxedExample:migration current(permanent,or temporary),or return?,北京科技大学经济管理学院 胡 枫,21,一是研究选择某种方案的概率与决策者的特征变量之间的关系;二是研究选择某种方案的概率与决策者的特征变量以及方案的特征变量之间的关系;三是考虑到不同方案之间的相关性的情况。,Multinomial Logit Model多项式Logit模型名义Logit模型,Conditional Logit Model 条件Logit模型,Nested Logit模型嵌套模型,Three Types of Multiple Response Models,二、定序选择模型,北京科技大学经济管理学院 胡 枫,23,1、问题的提出,作为被解释变量的(J+1)个选择结果本身是排序的,J优于(J1),2优于1,1优于0。决策者选择不同的方案所得到的效用也是排序的。一般多元离散选择模型中的效用关系不再适用。,北京科技大学经济管理学院 胡 枫,24,Example,A study looks at factors that influence the decision of whether to apply to graduate school.College juniors are asked if they are unlikely,somewhat likely,or very likely to apply to graduate school.Hence,our outcome variable has three categories.Data on parental educational status,whether the undergraduate institution is public or private,and current GPA is also collected.,北京科技大学经济管理学院 胡 枫,25,2、效用关系,选择不同方案的效用关系:,北京科技大学经济管理学院 胡 枫,26,3、模型,为了保证所有的概率都是正的,必须有:,假定服从正态分布,并且标准化为服从期望为0、方差为1的正态分布。那么可以得到选择各个方案的概率,为正态分布的概率函数,ML estimation,北京科技大学经济管理学院 胡 枫,27,Ex3.Ceilphone,Objective:Consumer preference for different ceilphoneData SourceThe EDP students from GSMA total of 1451 observations,北京科技大学经济管理学院 胡 枫,28,Variables,北京科技大学经济管理学院 胡 枫,29,Linear Regression?,One common/convenient way,but,北京科技大学经济管理学院 胡 枫,30,A Latent Variable Model,北京科技大学经济管理学院 胡 枫,31,The Ordinal Regression Model,北京科技大学经济管理学院 胡 枫,32,Two Popular Models,北京科技大学经济管理学院 胡 枫,33,Another Formulation,北京科技大学经济管理学院 胡 枫,34,The Log Likelihood,北京科技大学经济管理学院 胡 枫,35,The Z-Test,北京科技大学经济管理学院 胡 枫,36,Likelihood Ratio Test,We have seen this before!,北京科技大学经济管理学院 胡 枫,37,Ordered Probit Model,北京科技大学经济管理学院 胡 枫,38,SPSS Results,北京科技大学经济管理学院 胡 枫,39,SPSS Results,北京科技大学经济管理学院 胡 枫,40,STATA Results,北京科技大学经济管理学院 胡 枫,41,Ex4.Parents Long-Distance Migration,Remittances,and Educational Performance of Left-Behind Children,Contribution,北京科技大学经济管理学院 胡 枫,42,Literature review,北京科技大学经济管理学院 胡 枫,43,Data,北京科技大学经济管理学院 胡 枫,44,Empirical Model,北京科技大学经济管理学院 胡 枫,45,Empirical Model,北京科技大学经济管理学院 胡 枫,46,Results,北京科技大学经济管理学院 胡 枫,47,Results,北京科技大学经济管理学院 胡 枫,48,Results,北京科技大学经济管理学院 胡 枫,49,Conclusions,