离散选择模型举例12.2.doc
《离散选择模型举例12.2.doc》由会员分享,可在线阅读,更多相关《离散选择模型举例12.2.doc(11页珍藏版)》请在三一办公上搜索。
1、一二元离散选择模型1二元响应模型(Binary response model)我们往往关心响应概率,其中x表示各种影响因素(各种解释变量,包括虚拟变量)。根据不同的函数形式可以分为下面三类模型:线性概率模型(Linear probability model,LPM)、对数单位模型(logit)、概率单位模型(probit):三种模型估计的系数大约有以下的关系:2偏效应(1)如果解释变量是一个连续型变量,那么他对p(x)=p(y=1|x)的偏效应可以通过求下面的偏导数得出来:,偏效应的符号和该解释变量对应的系数的符号一致;两个解释变量偏效应之比等于它们各自的估计系数之比。(2)如果解释变量是一个
2、离散性变量,则从变化到+1时对概率的影响大小为:上面的其他解释变量的取值往往取其平均值。3估计方法与约束检验极大似然估计;三种常见的大样本检验:拉格朗日乘数检验、wald检验、似然比检验。4Stata程序语法(以Probit为例)probit depvar indepvars weight if exp in range , level(#) nocoef noconstant robust cluster(varname) score(newvar) asis offset(varname) maximize_options predict type newvarname if exp in
3、 range , statistic rules asif nooffset where statistic is p predicted probability of a positive outcome; the default xb linear prediction stdp standard error of the prediction二具体的例子1数据:美国1988年的CPS数据2模型:估计成为工会成员的可能性,模型形式如下:参加工会的概率=F(潜在经验potexp、经验的平方项potexp2、受教育年限grade、婚否married、工会化程度high);解释变量:Potexp
4、=年龄-受教育年限-5;grade=完成的受教育年限;married:1表示婚,0未婚;high:1表示高度工会化的行业,否则为0。3估计的结果3.1 probit union potexp potexp2 grade married highunionCoef.Std. Err.zPz95% Conf.Intervalpotexp.0835091.01560875.350.000.0529166.1141016potexp2-.0015308.0003179-4.820.000-.0021538-.0009078grade-.042078.0189089-2.230.026-.0791388
5、-.0050171married.0622516.11258360.550.580-.1584083.2829115high.5612953.0996625.630.000.3659613.7566292_cons-1.468412.2958112-4.960.000-2.048192-.88863323.2 dprobit union potexp potexp2 grade married high给出了,如果要求偏效应还需要对其乘以估计的系数beta;union dF/dx Std. Err. z Pz x-bar 95%C.I. potexp .0226964 .0041529 5.3
6、5 0.000 18.884 .014557.030836potexp2 -.000416 .000085 -4.82 0.000 519.882 -.000583-.00025grade -.0114361 .0051379 -2.23 0.026 13.014 -.021506-.001366married* .0167881 .0301137 0.55 0.580 .641 -.042234.07581high* .1470987 .02470055.63 0.000 .568 .098687.195511obs. P .216pred. P .1904762 (at x-bar)(*)
7、 dF/dxis for discrete change of dummy variable from 0 to 1,对离散变量。此外,如果想针对某些解释变量的特定取值进行计算,可以用下面的语句:matrix myx=(8,64,10,1,1)dprobit,at(myx)uniondF/dxStd. Err.zPzx 95%C.I. potexp.0261573.00443085.350.0008.017473.034841potexp2-.0004795.0000978-4.820.00064-.000671-.000288grade-.0131799.0065759-2.230.0261
8、0-.026068-.000291married*.0190706.03458370.550.5801-.048712.086853high*.1389514.02660335.630.0001.08681.191093obs. P .216pred. P .1904762(at x-bar)pred. P .2433575(at x)3.3 logit (1)logistic union potexp potexp2 grade married high, coef (给出回归系数)等价于 logit union potexp potexp2 grade married highunionC
9、oef.Std. Err.zPz95% Conf.Intervalpotexp.1474021.0280975.250.000.0923329.2024712potexp2-.0026869.0005654-4.750.000-.0037951-.0015787grade-.0703209.032142-2.190.029-.1333181-.0073236married.115463.1967790.590.557-.2702167.5011427high.9801411.1800495.440.000.62725151.333031_cons-2.581436.5186859-4.980.
10、000-3.598041-1.56483(2)给出发生比率(odds ratio)logistic union potexp potexp2 grade married high等价于 logit union potexp potexp2 grade married high,orunionOdds RatioStd. Err.zPz95% Conf.Intervalpotexp1.15882.03255945.250.0001.096731.224425potexp2.9973167.0005639-4.750.000.9962121.9984225grade.9320947.0299594
11、-2.190.029.8751866.9927031married1.122393.22086330.590.557.76321411.650606high2.664832.47980055.440.0001.8724573.79252如果存在异方差,可采用稳健估计,在上面命令后面加上robust。其他命令:1 有序模型ologit,oprobit2 多重选择模型mlogit,rrr给出发生比率;多重probit模型设计复杂计算,目前尚无对应的命令。3 工具变量如果在probit模型中有内生变量,就要采用工具变量方法予以克服,ivprob命令给出了结果。4 面板数据的离散选择模型xtlogit
12、,xtprobit,xttobitsas 相关过程:logistic,logit,probit;多重logit模型:proc catmod 三托宾模型(Tobit)和赫克曼修正模型(Heckit)一. tobit 模型(censored model截取回归模型)实际上tobit模型是probit模型的推广,(tobit意即Tobin的probit);在严格为正值的时候大致连续,但是有相当部分取值为0。模型:隐变量满足经典的线性假定,服从具有线性条件均值的正态同方差分布。由于正态分布,所以y在严格正值上连续分布。2估计和检验极大似然估计,检验同上面的三种检验。3偏效应我们估计出的系数,是隐变量(
13、效用)的偏效应,而我们关心的是对y(工作时间)的偏效应。这表明对于那些具有正值的观测值作OLS,由于忽略了逆米尔斯比率(inverse mills ratio)可能导致估计结果的非一致性。从上面推导可以得出:因此,当y服从一个tobit模型时,难以直接得出偏效应。(1)如果xj是一个连续变量,可以通过微分求出偏效应:首先,大括号中为一个调整因子,可以通过代入的估计值,而且必须带入解释变量的有意义的值,一般用均值。偏效应Tobit模型估计的结果并不能直接给出偏效应,但是估计系数的符号和偏效应的符号是一致的,而且统计显著性也一致。如果要求具体的偏效应大小,需要将估计的参数值和解释变量的相应取值代入
14、进行计算而得。Stata 程序语法tobit depvar indepvar weightif exp in range,l1(#) u1(#)level(#) offset(varname) maximize_optionspredict type newvarname if exp in range,statistics nooffsetl1表示左截断,那些小于l1的y值被截断;那些大于u1的y值被右截断。Tobit命令默认为他们分别为因变量的最小和最大值。其中statistics:xb 拟合值pr(a,b) Pr(ayjb)e(a,b) E(yj|a yjt95% Conf.Interv
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 离散 选择 模型 举例 12.2
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-4167586.html