可线性化模型.ppt
第四章 非线性回归模型的线性化,因变量和解释变量之间的线性关系,包括参数线性和解释变量线性两种。至今,线性总体回归模型的一般形式为其中:Y是被解释变量,X1,XK是解释变量。此时,被解释变量既是解释变量的线性函数,也是相应参数的线性函数。我们又称之为标准的线性回归模型。实际应用中,只有很少一部分经济变量之间存在上述这种标准的线性回归关系。对于绝大多数经济变量而言,他们之间的关系都是非线性的。,非线性回归模型的一般形式,其中,f(.)是关于解释变量和相应参数的一个非线性函数。具体地,又可以分为以下三类:非标准线性回归模型可线性化的非线性回归模型不可线性化的非线性回归模型,非标准线性回归模型,当被解释变量Y与解释变量X1,X2,XK之间不存在线性关系,但是与参数之间存在线性关系时其中,f1(.),fK(.)是关于解释变量的一个非线性函数。我们称之为非标准线性回归模型。比如:,可线性化的非线性回归模型,当被解释变量Y与解释变量X1,X2,XK和参数之间都不存在线性关系,但是可以通过适当的变换将其化为标准线性回归模型时。我们称之为可线性化的非线性回归模型。比如C-D生产函数:,不可线性化的非线性回归模型,当被解释变量Y与解释变量X1,X2,XK和参数之间都不存在线性关系,并且不可以通过适当的变换将其化为标准线性回归模型时。我们称之为不可线性化的非线性回归模型。比如:,对于这些不符合线性假定的模型进行参数估计,必须加以适当的变换以后,才能用OLS方法估计模型参数。对前两类情况,虽然其形式是非线性的,但可以通过适当的变换,转化为线性模型,然后利用线性回归模型的估计与检验方法进行处理。下面介绍几种典型的可以做线性化处理的非线性模型。,对于参数线性的模型,可以采用变量的直接代换,转化为参数、变量均为线性的形式进行估计。,1、非标准线性回归模型,多项式方程模型,多项式方程的表达形式是(4.4),图4.9 yt=b0+b1 xt+b2 xt2+b3 xt3+ut 图4.10 yt=b0+b1 xt+b2 xt2+b3 xt3+ut,yt=b0+b1 xt+b2 xt2+ut(4.14)其中b10,b20和b10,b20情形的图形分别见图4.11和4.12。令xt 1=xt,x t 2=xt 2,上式线性化为,yt=b0+b1 xt1+b2 xt2+ut(4.15)如经济学中的边际成本曲线、平均成本曲线与图4.11相似。描述自变量对因变量递增或者递减的边际效应。,图4.11 yt=b0+b1xt+b2xt2+ut 图4.12 yt=b0+b1xt+b2xt2+ut,另一种多项式方程的表达形式,二次函数,yt=b0+b1 xt+b2 xt2+ut 当b10,b20,b20时,具有U型的形式,在点-2b1/b2之前x对y的影响是负的,在点-2b1/b2之后x对y的影响是正的,在点-2b1/b2处影响为0。可以与对数联合使用。,含有交互作用项的模型,yt=b0+b1 xt1+b2 xt2+b3 xt1 xt2 ut因变量对一个解释变量的偏效应、弹性或者半弹性与另一个或几个解释变量有关。,例4.1,双曲线函数模型,1/yt=+/xt+ut(4.6)也可写成,yt=1/(+/xt+ut)0情形的图形见图。,yt=1/(+/xt),(0),倒数模型,这是双曲线函数的另一种表达方式 令变量,则回归函数可变为:,根据解释变量的观测值,计算出X*i 的之后进行OLS估计,得到:,因此可得到原模型的估计方程:,xt和yt的关系是非线性的。令xt*=1/xt,得 yt=+xt*+ut上式已变换成线性回归模型。,图4.8 yt=+/xt,(0),yt=+/xt+ut,半对数函数模型 yt=+Ln xt+ut 0和 0两种情形的图形分别见图。xt和yt的关系是非线性的。令xt*=Lnxt,则 yt=+xt*+ut 变量yt 和xt*已变换成为线性关系。,图4.3 yt=+Lnxt+ut,(0)图4.4 yt=+Lnxt+ut,(0),S-曲线函数模型,1/yt=+e-x+ut令 yt*=1/yt,xt*=e-xyt=+xt*+ut,2、可线性化的非线性回归模型,幂函数模型,yt=a xt b b取不同值的图形分别见图4.5和4.6。xt和yt的关系是非线性的。对上式等号两侧同取对数,得 Lnyt=Lna+b Lnxt+ut令yt*=Lnyt,a*=Lna,xt*=Lnxt,则上式表示为 yt*=a*+b xt*+ut 变量yt*和xt*之间已成线性关系。其中ut表示随机误差项。也称作全对数模型。,图4.5 yt=a xt b 图4.6 yt=a xt b,幂函数模型,半对数线性模型,根据解释变量的观测值,进行OLS估计,得到:,因此可得到原模型的估计方程:,对数线性模型,通过对原模型的对数变换,函数形式可变为:,令变量,则回归函数可变为:,根据解释变量的观测值,进行OLS估计,得到:,因此可得到原模型的估计方程:,下面介绍柯布道格拉斯(Cobb-Douglas)生产函数。其形式是Q=k L C 1-(4.24)其中Q表示产量;L表示劳动力投入量;C表示资本投入量;k是常数;0 1,称模型为规模报酬递增型;1+2 1,称模型为规模报酬递减型。,Cobb-Douglas生产函数,yt=(4.16)一般f(t)=a0+a1 t+a2 t 2+an t n,常见形式为f(t)=a0-a t yt=(4.17)其中b=。a 0情形的图形分别见图4.13和4.14。美国人口统计学家Pearl和Reed广泛研究了有机体的生长,得到了上述数学模型。生长模型(或逻辑斯谛曲线,Pearl-Reed曲线)常用于描述有机体生长发育过程。其中k和0分别为yt的生长上限和下限。=k,=0。a,b 为待估参数。曲线有拐点,坐标为(,),曲线的上下两部分对称于拐点。图4.13 yt=k/(1+)图4.14 yt=k/(1+),生长曲线(logistic)模型,直接搜索法直接优化法迭代线性化法,不可线性化的非线性回归模型,基础知识回顾(1),求和算子线性函数非线性函数弹性与半弹性改变测量单位对OLS的影响,求和算子,求和算子用以表示多个数的总和运算,具有:c=nc cxi=cxi(axi+byi)=axi+byi 但是,不具有:(xi/yi)=xi/yi,线性函数,线性函数在经济计量学中扮演重要角色。对于两变量的情形y=0+1x此时,有y=1 x可见,y关于 x的边际效应是常数。对于多变量,以三变量为例,有y=0+1x1+2x2此时,有y=1 x1+2x2如果x2不变,即x2=0时,1描述了y如何随 x而变化,故尔称作局部效应或偏效应。它隐含着“其余情况不变”这一前提。,y=0+1x,一元线性函数的图示,改变测量单位对OLS的影响,仅被解释变量改变测量单位仅解释变量改变测量单位举例说明,非线性函数,线性函数对于许多经济关系来说有时并不适用,比如边际报酬递减就不适合用线性函数描述。为此,在经验分析中,用到诸如二次函数、自然对数、指数函数等非线性函数,二次函数,二次函数y=0+1x+2x2当10,20时,y与x之间是抛物线关系,在-1/2 2处达到最大,x 对y有一个递减的边际效应y/x=1+22x适用于计算x取任何初始值并且仅有微小变化时,对于y的近似边际效应。这种倒U型的曲线有时在经验研究中并不容易看到,有时我们看到的只是倒U型曲线的左侧。此时,在较大值处出现最大值。,y=0+1x+2x2,一元二次函数的图示,自然对数,y=log(x)=ln(x),x0 具有:log(x1x2)=log(x1)+log(x2)log(x1/x2)=log(x1)-log(x2)log(xc)=c log(x)与二次函数的差别在于:dy/dx=1/x 0,是单减的,即y和x间的边际报酬是递减的;增函数,即x对y永远没有负效应。对于x微小变化,有log(x1)-log(x0)(x1-x0)/x0=x/x0。,y=ln(x),自然对数的图示,指数函数 y=exp(x),具有:exp(x1+x2)=exp(x1)exp(x2)expc log(x)=xc函数y=0+1 log(x)等价于y=exp(0+1x)由于y/x=1 exp(0+1x),当1 0时,有递增的边际效应。,y=exp(x),指数函数的图示,弹性,线性函数y=0+1x对应的变弹性模型(y/x)/(x/y)=(y/y)/(x/x)=1(0+1x)/x函数log(y)=0+1 log(x)对应的恒常弹性模型(y/x)/(x/y)=(y/y)/(x/x)=1函数log(y)=0+1 x对应的半弹性模型(y/y)/x=1函数y=0+1 log(x)对应的半弹性模型y/(x/x)=1,对数形式的作用,斜率系数的意义是弹性或者半弹性的概念斜率系数不会随着变量的测量单位的变化而变化,只影响截距项当因变量非负时,取对数后所建模型更接近CLM假设可以部分消除变量中的异方差对数取值一般会缩小变量的取值范围,从而减少估计值对变量中异常值的敏感。,