《简单回归模型》PPT课件.ppt
第二讲 简单回归模型Simple Regression Model,一、基本概念二、普通最小二乘法(OLS)三、几个问题四、OLS估计量的性质,回归的涵义一个基本假定总体回归函数,一、基本概念,3,回归的涵义,最初的涵义:回归(regress)一词最早由英国生理学家高尔顿(Galton)提出,用以指给定父母的身高后,儿女的身高有回复到人口总体平均身高的趋势,即“回归到中等”(regression to mediocrity)回归分析:在其他条件不变的情况下,考察一个变量对另一个变量的影响。,4,回归的涵义,回归分析中的变量和参数,5,回归的涵义,例子简单回归分析(即只有一个解释变量)难以做到控制其他条件不变,但可以为我们学习多元回归分析(即两个及两个以上解释变量)奠定基础,6,一个基本假定,零条件均值假定(zero conditional mean assumption)如何保证其他条件不变?简单地,如果X和u是独立的,即X的变化不会对u造成影响,那么b1就可以度量其他条件不变的情况下X对Y的影响。在计量分析中,采用一个更弱一些的技术性假定零条件均值假定零条件均值假定的关键是假定u的均值独立性,如果均值独立性成立,那么u的条件均值必然等于零,7,一个基本假定,三个假定u与X独立u的均值独立于X(均值独立性)u与X不相关1是比2和3更强的假定,而2是比3更强的假定。对于回归分析,假定2是必须的,但假定1和3更易于理解,8,总体回归函数,总体回归函数(population regression function,PRF),9,.,.,x1,x2,总体回归函数,E(y|x)=b0+b1x,y,f(y),x,10,.,.,.,.,y4,y1,y2,y3,x1,x2,x3,x4,u1,u2,u3,u4,x,y,E(y|x)=b0+b1x,总体回归函数,OLS的推导OLS的推导:另一种方法OLS的计算步骤拟合优度,二、普通最小二乘法(OLS),12,OLS的推导,为了估计出总体回归函数中的参数,需要从总体中抽取一个样本。用(Xi,Yi):i=1,n 表示从总体中得到的一个样本容量为n的随机样本。有:Yi=b0+b1Xi+ui,13,OLS的推导,根据零条件均值假定,Cov(X,u)=E(Xu)E(X)E(u)=E(Xu)=0所以:E(Y b0 b1X)=0 EX(Y b0 b1X)=0,14,OLS的推导,即:,15,OLS的推导,普通最小二乘(ordinary least square,OLS)估计量,16,OLS的推导,进一步的分析,17,OLS的推导,拟合值(fitted value)、残差(residual)和样本回归函数(sample regression function,SRF),18,.,.,.,.,y4,y1,y2,y3,x1,x2,x3,x4,1,2,3,4,x,y,SRF,OLS的推导,19,.,.,.,.,y4,y1,y2,y3,x1,x2,x3,x4,x,y,SRF1,OLS的推导,SRF2,不同的样本得到不同的样本回归函数,20,OLS的推导:另一种方法,基本思想:找到参数的合适估计值使得Y的拟合值与实际值总体而言尽可能地接近,也就是总体而言令残差最小,21,OLS的计算步骤,OLS的计算步骤,22,OLS的计算步骤,例题2_1(课本p31:例2.3)salary:CEO的薪水roe:公司的股本回报率OLS估计:方法一:用excel方法二:用stata(先请看“课程相关材料”中“stata基本操作”)结果:,23,拟合优度,为了衡量根据OLS估计得出的样本回归函数对真实数据的拟合程度,引入拟合优度(goodness of fitness)的概念,24,拟合优度,图解,Xi,SRF,Yi,A,B,C,25,拟合优度,总平方和(total sum of squares,SST):衡量Y的样本总变异解释平方和(explained sum of squares,SSE):Y的样本总变异能够被解释变量解释的部分残差平方和(residual sum of squares,SSR):Y的样本总变异不能被解释变量解释的部分,也称为剩余平方和,26,拟合优度,判定系数(coefficient of determination)注意:判定系数并不是判断模型好坏的主要标准!,27,拟合优度,判定系数的计算,28,拟合优度,例题2_2(课本p38,例2.8)salary:薪水roe:股本回报率R2=0.0132意味着股本回报率可以解释CEO薪水变异的1.3%,测量单位函数形式过原点回归,三、几个问题,30,测量单位,解释变量或/和被解释变量的测量单位变化会改变回归结果例题2_3,31,函数形式,线性模型(Linear model):所谓线性,是指对参数是线性的,并非指对变量是线性的。,32,函数形式,如果对解释变量或被解释变量进行某种形式的函数变换,不会改变模型的参数线性性,但会使得模型的经济意义更为合理。我们讨论三种常用的函数形式:对数-水平模型(log-level)对数-对数模型(log-log)水平-对数模型(level-log),33,函数形式,对数-水平模型(不变增长率模型),34,函数形式,对数-水平模型:工资模型,W,S,LnW,S,35,函数形式,例题2_4:对数-水平模型(课本p42,例2.10),36,函数形式,对数-对数模型(常弹性模型),37,函数形式,对数-对数模型:需求价格弹性,Qd,P,LnQd,LnP,38,函数形式,例题2_5:对数-对数模型(课本p42,例2.11),39,函数形式,水平-对数模型,40,函数形式,例题2_6:水平-对数模型,41,过原点回归,在分析经济问题时有时要求被解释变量为0时解释变量也为0,此时需要用到过原点回归(regression through the origin)实例:可变成本正比于产量永久性消费正比于永久性收入通货膨胀率正比于货币供给量此时1 的OLS估计量同样由前面给出的公式计算,简单回归模型的高斯-马尔科夫假定OLS估计量的无偏性OLS估计量的方差OLS估计量的有效性,四、OLS估计量的性质,43,简单回归模型的高斯-马尔科夫假定,以上介绍了回归系数的OLS点估计,但为了判断点估计的无偏性、有效性等性质以及进行假设检验,还需对回归模型做出一些假定简单回归模型的高斯-马尔科夫假定,44,简单回归模型的高斯-马尔科夫假定,同方差性(homoscedasticity):误差项的条件方差相同异方差性(heteroscedasticity):误差项的条件方差不相同,45,简单回归模型的高斯-马尔科夫假定,同方差性,X,Y,概率密度,X:受教育年限Y:工资,46,简单回归模型的高斯-马尔科夫假定,异方差性,X,Y,概率密度,X:受教育年限Y:工资,47,简单回归模型的高斯-马尔科夫假定,异方差性,X,Y,概率密度,X:时间Y:打字正确率,48,OLS估计量的无偏性,OLS估计量的无偏性证明见课本p47-48在保证OLS估计量无偏性的四个假定中,零条件均值假定(SLR.4)可能是最难被满足的,在今后的学习中我们将反复讨论这个问题。(参看课本p48,例2.12)无偏性无法保证OLS估计量的离散程度,因此还需要讨论估计量的有效性,49,OLS估计量的方差,回归标准误(standard error of the regression)证明见课本p54,50,OLS估计量的方差,回归标准误的计算步骤,51,OLS估计量的方差,OLS估计量的方差估计和标准差估计在得出回归标准误后,可以证明回归系数的方差估计和标准差估计(即标准误,standard error)为(课本p52):,52,OLS估计量的方差,OLS估计量的标准误的计算步骤,53,OLS估计量的方差,例题2_7salary:薪水roe:股本回报率,54,OLS估计量的有效性,OLS估计量的有效性证明见课本p108,附录3A.6,55,OLS估计量的有效性,OLS估计量的性质高斯-马尔科夫定理,56,习题,2.42.9C2.3C2.4,