计量经济学-一元线性回归分析.ppt
2.2 一元线性回归模型及其参数估计Simple Linear Regression Model and Its Estimation,一、线性回归模型及其普遍性二、线性回归模型的基本假设三、一元线性回归模型的参数估计四、最小二乘估计量的统计性质五、参数估计量的概率分布与随机项方差的估计,一、线性回归模型及其普遍性,1、线性回归模型的特征,一个例子 凯恩斯绝对收入假设消费理论:消费(C)是由收入(Y)唯一决定的,是收入的线性函数:C=+Y(2.2.1)但实际上上述等式不能准确实现。原因 消费除受收入影响外,还受其他因素的影响;线性关系只是一个近似描述;收入变量观测值的近似性:收入数据本身并不绝对准确地反映收入水平。,因此,一个更符合实际的数学描述为:C=+Y+(2.2.2)其中:是一个随机误差项,是其他影响因素的“综合体”。线性回归模型的特征:通过引入随机误差项,将变量之间的关系用一个线性随机方程来描述,并用随机数学的方法来估计方程中的参数;在线性回归模型中,被解释变量的特征由解释变量与随机误差项共同决定。,2、线性回归模型的普遍性,线性回归模型是计量经济学模型的主要形式,许多实际经济活动中经济变量间的复杂关系都可以通过一些简单的数学处理,使之化为数学上的线性关系。,将非线性关系化为线性关系的常用的数学处理方法,变量置换例如,描述税收与税率关系的拉弗曲线:抛物线 s=a+b r+c r2 c0 s:税收;r:税率设X1=r,X2=r2,则原方程变换为 s=a+b X1+c X2 c0变量置换仅用于变量非线性的情况。,函数变换,例如,Cobb-Dauglas生产函数:幂函数 Q=AKLQ:产出量,K:投入的资本;L:投入的劳动,方程两边取对数:ln Q=ln A+ln K+ln L,(3)级数展开,例如,不变替代弹性CES生产函数:方程两边取对数后,得到:对在=0处展开台劳级数,取关于的线性项,即得到一个线性近似式。,变量置换得到,结论:,实际经济活动中的许多问题,都可以最终化为线性问题,所以,线性回归模型有其普遍意义。即使对于无法采取任何变换方法使之变成线性的非线性模型,目前使用得较多的参数估计方法非线性最小二乘法,其原理仍然是以线性估计方法为基础。线性模型理论方法在计量经济学模型理论方法的基础。,二、线性回归模型的基本假设,1、技术线路,由于回归分析的主要目的是要通过样本回归函数(模型)SRF尽可能准确地估计总体回归函数(模型)PRF。即通过 估计采用普通最小二乘或者普通最大似然方法估计。需要对解释变量和随机项作出假设。,2、线性回归模型在上述意义上的基本假设,(1)解释变量X是确定性变量,不是随机变量;解释变量之间互不相关。(2)随机误差项具有均值和同方差:E(i)=0 i=1,2,n Var(i)=2 i=1,2,n(3)随机误差项在不同样本点之间是独立的,不存在序列相关:Cov(i,j)=0 ij i,j=1,2,n,(5)随机误差项服从均值、同方差的正态分布:iN(0,2)i=1,2,n注意:如果第(1)条假设满足,则第(4)条也满足;模型对变量和函数形式的设定是正确的,即不存在设定误差。,(4)随机误差项与解释变量之间不相关:Cov(Xi,i)=0 i=1,2,n,重要提示,几乎没有哪个实际问题能够同时满足所有基本假设;通过模型理论方法的发展,可以克服违背基本假设带来的问题;违背基本假设问题的处理构成了单方程线性计量经济学理论方法的主要内容:异方差问题(违背同方差假设)序列相关问题(违背序列不相关假设)共线性问题(违背解释变量不相关假设)随机解释变量(违背解释变量确定性假设)0均植、正态性假设是由模型的数理统计理论决定的。,三、一元线性回归模型的参数估计,1、普通最小二乘法(Ordinary Least Square,OLS),给定一组样本观测值Xi,Yi(i=1,2,n),要求样本回归函数尽可能好地拟合这组值,即样本回归线上的点与真实观测点的“总体误差”尽可能地小。,2、最大或然法(Maximum Likelihood,ML),最大或然法,也称最大似然法,是不同于最小二乘法的另一种参数估计方法,是从最大或然原理出发发展起来的其它估计方法的基础。基本原理:对于最大或然法,当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的联合概率最大。,将该或然函数极大化,即可求得到模型参数的极大或然估计量。,由于或然函数的极大化与或然函数的对数的极大化是等价的,所以,取对数或然函数如下:,可见,在满足一系列基本假设的情况下,模型结构参数的最大或然估计量与普通最小二乘估计量是相同的。,但是,随机误差项的方差的估计量是不同的。,3、参数估计的离差形式(deviation form),注:在计量经济学中,往往以小写字母表示对均值的离差(deviation)。,4、样本回归线的数值性质(numerical properties),样本回归线通过Y和X的样本均值;Y估计值的均值等于观测值的均值;残差的均值为0。,四、最小二乘估计量的统计性质高斯-马尔可夫定理,当模型参数估计完成,需考虑参数估计值的精度,即是否能代表总体参数的真值,或者说需考察参数估计量的统计性质。一个用于考察总体的统计量,可从三个方面考察其优劣性:(1)线性性(linear):即是否是另一随机变量的线性函数;(2)无偏性(unbiased):即它的均值或期望值是否等于总体的真实值;(3)有效性(efficient):即它是否在所有线性无偏估计量中具有最小方差。,高斯马尔可夫定理(Gauss-Markov theorem)在给定经典线性回归的假定下,最小二乘估计量是具有最小方差的线性无偏估计量。,1、线性性:参数估计量是Y的线性函数,2、无偏性:参数估计量的均值等于总体回归参数真值,3、有效性:在所有线性无偏估计量中,最小二乘估计量具有最小方差。,(2)证明最小方差性,4、结论 普通最小二乘估计量具有线性性、无偏性、最小方差性等优良性质。具有这些优良性质的估计量又称为最佳线性无偏估计量,即BLUE估计量(the Best Linear Unbiased Estimators)。显然这些优良的性质依赖于对模型的基本假设。,五、参数估计量的概率分布与随机项方差的估计,例2.3:在收入-消费支出例中,参数估计及其标准差的计算如下:,