受限数据模型.ppt
受限被解释变量数据模型选择性样本 Model with Limited Dependent Variable Selective Samples Model,一、经济生活中的受限被解释变量问题 二、“截断”问题的计量经济学模型 三、“归并”问题的计量经济学模型,一、经济生活中的受限被解释变量问题,1、“截断”(truncation)问题,由于条件限制,样本不能随机抽取,即不能从全部个体,而只能从一部分个体中随机抽取被解释变量的样本观测值,而这部分个体的观测值都大于或者小于某个确定值。“掐头”或者“去尾”。消费函数例题:被解释变量最底200元、最高10000元。原因:抽样。离散选择模型的例题:银行贷款,实际上是选择性样本,通常表现为“截断样本”。原因:问题的局限。,能够获得贷款的企业是全部有贷款需求的企业中表现良好的一部分,类似的实际问题很多,2、“归并”(censoring)问题,将被解释变量的处于某一范围的样本观测值都用一个相同的值代替。经常出现在“检查”、“调查”活动中,因此也称为“检查”(censoring)问题。需求函数模型中用实际消费量作为需求量的观测值,如果存在供给限制,就出现“归并”问题。被解释变量观测值存在最高和最低的限制。例如考试成绩,最高100,最低0,出现“归并”问题。,二、“截断”问题的计量经济学模型,1、思路,如果一个单方程计量经济学模型,只能从“掐头”或者“去尾”的连续区间随机抽取被解释变量的样本观测值,那么很显然,抽取每一个样本观测值的概率以及抽取一组样本观测值的联合概率,与被解释变量的样本观测值不受限制的情况是不同的。如果能够知道在这种情况下抽取一组样本观测值的联合概率函数,那么就可以通过该函数极大化求得模型的参数估计量。,2、截断分布,如果服从均匀分布U(a,b),但是它只能在(c,b)内取得样本观测值,那么取得每一个样本观测值的概率,为随机变量分布范围内的一个常数,服从正态分布,是标准正态分布条件概率函数,3、截断被解释变量数据模型的最大似然估计,求解该1阶极值条件,即可以得到模型的参数估计量。由于这是一个复杂的非线性问题,需要采用迭代方法求解,例如牛顿法。,4、例题城镇居民消费模型-截断样本数据,将这组样本看成是在4500的条件下随机抽取得到,将这组样本看成是在4000的条件下随机抽取得到,参数由 0.750072变化为,似然函数值由228.6718减小为,似然函数值为什么变小?,将这组样本看成是在11500、4500条件下随机抽取得到,参数由 0.750072变化为,似然函数值由228.6718增大为,似然函数值为什么增大?,将这组样本看成是在0条件下随机抽取得到,结果与OLS相同似然函数值减小,似然函数值最小,5、为什么截断被解释变量数据模型不能采用普通最小二乘估计,对于截断被解释变量数据计量经济学模型,如果仍然把它看作为经典的线性模型,采用OLS估计,会产生什么样的结果?因为yi只能在大于a的范围内取得观测值,那么yi的条件均值为:,由于被解释变量数据的截断问题,使得原模型变换为包含一个非线性项模型。如果采用OLS直接估计原模型:实际上忽略了一个非线性项;忽略了随机误差项实际上的异方差性。这就造成参数估计量的偏误,而且如果不了解解释变量的分布,要估计该偏误的严重性也是很困难的。,6、Heckman两步修正法,Sample Selection Bias as a Specification Error,Econometrica 47(1),1979,P153-161,市场工资方程,工作倾向方程,如何估计该模型?第一步,用probit模型估计,利用全部样本;利用估计结果,计算i。第二步,利用选择性样本,将(1)作为一个待估计参数,估计模型,得到1的估计。,三、“归并”问题的计量经济学模型,1、思路,以一种简单的情况为例,讨论“归并”问题的计量经济学模型。即假设被解释变量服从正态分布,其样本观测值以0为界,凡小于0的都归并为0,大于0的则取实际值。如果y*以表示原始被解释变量,y以表示归并后的被解释变量,那么则有:,单方程线性“归并”问题的计量经济学模型为:,如果能够得到yi的概率密度函数,那么就可以方便地采用最大似然法估计模型,这就是研究这类问题的思路。由于该模型是由Tobin于1958年最早提出的,所以也称为Tobin模型。,2、“归并”变量的正态分布,由于原始被解释变量y*服从正态分布,有,3、归并被解释变量数据模型的最大似然估计,该似然函数由两部分组成,一部分对应于没有限制的观测值,是经典回归部分;一部分对应于受到限制的观测值。这是一个非标准的似然函数,它实际上是离散分布与连续分布的混合。如何理解后一部分?,为什么要求和?,如果样本观测值不是以0为界,而是以某一个数值a为界,则有,估计原理与方法相同。,4、例题城镇居民消费模型-归并样本数据,11123.84,11040.34,Censored(11000)估计,参数估计结果、似然函数值都与OLS估计差异较大。为什么似然函数值大于OLS估计?,Censored(12000)估计与OLS相同,5、实际模型中的Truncation与Censored,时间序列样本,不考虑。截面上的全部个体作为样本,不考虑Truncation。按照抽样理论选取截面上的部分个体作为样本,不考虑Truncation。按照特定的规则选取截面上的部分个体作为样本,必须考虑Truncation。截面数据作样本,根据样本观测值的经济背景,决定是否考虑Censored。,