《古典回归模型上.ppt》由会员分享,可在线阅读,更多相关《古典回归模型上.ppt(49页珍藏版)》请在三一办公上搜索。
1、第二章 回归模型,第一节 古典回归模型 第二节 回归模型的参数估计 第三节 回归模型的统计检验 第四节 非线性回归模型,第一节 古典回归模型,一、回归分析 二、模型的随机设定 三、古典回归模型的基本假定 练习题,第一节 古典回归模型,单方程模型 y=(x1,x2,xk,)是计量经济模型最基本的模型形式。回归分析方法是研究这类随机模型的有力工具。,一、回归分析概述(一)相关分析和回归分析 经济变量之间的关系,大体可分为两类:确定性关系或函数关系:研究的是确定现象非随机变量间的关系;统计依赖或相关关系:研究的是非确定现象随机变量间的关系。,对变量间统计依赖关系的考察主要是通过相关分析(correl
2、ation analysis)或回归分析(regression analysis)来完成的:,1.相关分析 变量性质:都是随机变量且关系对等 分析方法:图表法和相关系数 分析目的:判定变量之间相关的方向和关系的密切程度。2、回归分析研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。前一个变量被称为被解释变量或因变量,后一个(些)变量被称为解释变量或自变量。,变量性质:自变量与因变量的关系不对等的,自变量是确定性变量,而因变量是随机变量分析方法:建立回归方程分析目的:变量之间的数量依存关系,并根据自变量的数值变化去推测因变量数 值变化,下面通过一个例题简要说明回归分析的一些基本概念
3、。假设一个总体由60户家庭组成,为了研究家庭消费支出Y与家庭收入X之间的关系,将这60户家庭按人均月收入划分成组内收入水平大致相同的10个组。表2-1列出了每组各个家庭的人均月消费支出和收入情况。,表2-1 某总体的家庭收支情况 单位:元/月,图2-1 不同收入水平的家庭消费支出散点分布图,从图2-1的散点分布可以看出,虽然各个家庭的消费支出存在着差异,但各组家庭的平均消费支出随着收入水平的提高也在不断增加。,回归模型 1、总体回归模型,称为总体回归方程,常数a、b称为总体回归参数(或回归系数)。回归分析的主要任务就是设法求出总体回归参数的具体数值,进而利用总体回归方程描述和分析总体的平均变化
4、规律。,总体回归直线所对应的方程Yi=a+bXi+i,2、样本回归模型,根据这10组观察值绘制成散点图(图2-2)如下:,无法获取总体的所有资料,只能通过对总体的若干次观察得到总体的一个样本,再依据样本信息来估计总体回归方程。例如,从表2-1的总体中随机抽取一个样本列入表2-2:表2-2总体2-1的一个样本,图2-2总体回归直线与样本回归直线,可以看出,散点分布仍然呈现出明显的线性趋势;现设法确定一条直线来较好地拟合这些样本观察值,称这条直线为样本回归直线,其对应的方程:,称为样本回归方程,分别为总体回归参数a、b的估计量。,注:在参数(或变量)字母上面加上符号“”,表示是该参数(或变量)的估
5、计值或估计量,以后将一直采用这种习惯表示方法。因此,回归分析的主要内容可以概括成:(1)根据样本观察值确定样本回归方程;(2)检验样本回归方程对总体回归方程的近似程度;(3)利用样本回归方程分析总体的平均变化规律。,在回归分析中,被解释变量定义为随机变量,具有一定的概率分布,解释变量则假定在重复抽样中取固定的值。如果研究的是一个被解释变量对另一个解释变量的相关关系,就称为一元回归分析。若研究的是一个被解释变量对一个以上的解释变量的相关关系就称为多元回归分析。,二、回归模型的随机设定,1随机误差项 总体回归方程只是反映了总体的平均变化规律,从表2-1和图2-1都可以看出,单个家庭的消费支出Yi与
6、平均消费支出E(Yi)之间存在着一定的离差,将这个离差用i表示,即:iYiE(Yi)Yi(abxi)其中i是一个不可观测的、可正可负的随机变量,所以称i为随机误差项。YiE(Yi)i abxii 称为总体回归模型的随机设定形式,相应地,若样本回归方程为,则实际值yi与估计值 的离差用ei表示,即:,称ei为残差(或拟合误差),它可以作为随机误差i的估计。而方程:,称为样本回归方程的随机设定形式。,2随机误差产生的原因,宏观现象本身的随机性。模型本身的局限性。模型函数形式的设定误差。数据的测量与归并误差。随机因素的影响(如自然灾害等)值得说明的是,传统回归分析只侧重于研究x对y的影响,将视为一个
7、较小的随机误差而忽略不计。但是在计量经济学中,将要专门讨论随机误差项的特性。,三、古典回归模型的基本假定,1解释变量x为非随机变量。2零均值假定:E(i)=0 3同方差假定:D(i)=2(常数)4无自相关假定:Cov(i,j)=0(ij)5解释变量与随机误差项不相关假定:Cov(xi,i)=0(或E(xii)=0),6无多重共线性假定。7、i服从正态分布,即i N(0,2)。YiN(a+bxi,2)将满足这些假定的回归模型称为古典回归模型。这些假定的成立与否将直接影响回归分析中统计推断的结论。计量经济学正是对包括这些假定在内的传统回归分析理论做了进一步的研究而有所发展,因此,也有人将计量经济方
8、法称为现代回归分析。,四、单方程回归模型的类型,1、根据回归模型中包含的自变量个数的不同,回归模型可分为一元回归模型和多元回归模型。2、根据因变量与自变量相关形式不同,回归模型可分为线性回归模型和非线性回归模型。3、根据回归模型中是否含有虚拟变量,回归模型可分为普通回归模型和带虚拟变量的回归模型。4、根据回归模型中是否包括滞后的因变量作为自变量,回归模型可分为无自回归现象的回归模 型和自回归模型。,课外练习题,1、总体回归方程与样本回归方程的区别。2、随机误差产生的原因。3、古典回归模型的基本假定包括哪些。,第二节 回归模型的参数估计,一、最小二乘估计(OLS)二、一元线性回归模型的参数估计三
9、、多元线性回归模型的参数估计四、最小二乘估计的性质,第二节 回归模型的参数估计,一、最小二乘原理(Ordinary Least quareOLS),对于一元线性回归模型:yiabxiei 选择最佳拟合曲线的标准为:使总的拟合误差(即总残差)达到最小。数学语言描述中最常用的是普通最小二乘法(OLS):残差平方和达到最小。即:,=最小,二、利用OLS法估计一元线性回归模型参数,由于 是关于 的二次函数并且非负,所以存在最小值。利用微分学中求极值的方法,可以求得 的值。根据,从而得到:,此方程组称为正规方程组。,解正规方程组可得:,其中,,由于(2-1)式是根据(普通)最小二乘法得到的,所以称 为参
10、数的最小二乘估计,简记成OLS估计。,(2-1),例1.我国税收预测模型。表2-3列出了我国19952008年期间税收收入Y和国内生产总值 X的统计资料(时间序列数据),试利用EViews软件建立一元线性回归模型。,表2-3 我国税收与GDP统计资料 单位:亿元,(1)建立工作文件:,先启动EViews软件(单击“开始”按钮“程序”“Eviews 5”单击“Eviews 5”),出现Eviews软件窗口,如下图所示:,EViews软件的具体操作是在Workfile中进行。如果想用EViews进行某项具体的操作,必须先新建一个Workfile或打开一个已经存在硬盘(或软盘)上的Workfile,
11、然后才能够定义变量、输入数据、建造模型等操作。,在主菜单上依次点击FileNewWorkfile,将弹出一个对话框(如图2-3所示),由用户选择数据的时间频率(frequency)、起始期和终止期。,起始期,终止期,Workfilefrequency中选择数据的频率,可选的频率包括年度、半年、季度、月度、星期、天(每周5天、每周7天)以及非时间序列或不规则数据。可在Start date文本框中输入起始日期,End date文本框中输入终止日期,年度与后面的数字用:分隔。日期的表示法为:年度:二十世纪可用两位数,其余全用四位数字;半年:年后加1或2;季度:年后加1-4;月度:年后加1-12;星期
12、:月/日/年;日:月/日/年;非时间序列或不规则数据:样本个数。,在EViews软件的命令窗口中直接键入CREATE命令,也可以建立工作文件;命令格式为:CREATE时间频率类型起始期终止期例如:CREATE A 95 08,(2)输入统计资料:在EViews软件的命令窗口键入数据输入/编辑命令:DATA Y X 将显示一个数组窗口(如图2-4所示),此时可以按全屏幕编辑方式输入每个变量的统计资料.,图2-4数组窗口,(3)估计回归模型:,在数组窗口中点击ProcsMake Equation,则打开一个方程描述窗口,如果不需要重新定义方程中的变量,或调整样本区间,则直接点击OK进行估计。系统将
13、弹出一个方程窗口,显示有关估计结果(如右图所示):,因此,我国税收模型的估计式为:,模型的估计结果表明,国内生产总值每增加1亿元,我国税收将增加0.0946亿元。,常数和解释变量,参数标准差,T统计量值,双侧概率,判定系数,调整的判定系数,回归方程的标准差,残差平方和,似然函数的对数,德宾-瓦森统计量,被解释变量均值,被解释变量标准差,赤池信息准则,施瓦兹信息准则,F统计量,F统计量的概率,参数估计值,在EViews软件的命令窗口中,也可以直接键入LS命令来估计模型。命令格式为:LS 被解释变量 C 解释变量 其中,C表示常数项;例如:LS Y C X,例2中国城镇居民消费函数。表2-5列出了
14、我国城镇居民家庭2008年平均每人全年消费性支出Y和可支配收入X的统计资料(横截面数据,单位:元/年),试利用EViews软件,通过在命令窗口中直接键入命令的方式建立城镇居民消费函数。,表2-5我国城镇居民家庭2008年收支情况,启动EViews软件之后,在命令窗口中依次键入以下命令:(1)建立工作文件:CREATE U 8(2)输入统计资料:DATA Y X,(3)估计回归模型:LS Y C X,右图所示是有关输出结果:所以,我国城镇居民的消费函数为:,估计结果表明,现阶段我国城镇居民的边际消费倾向为0.6237,即在新增加的可支配收入中,有62.37%用于增加消费。,三、多元线性回归模型的
15、参数估计,对于多元线性回归模型 如果利用最小二乘法估计模型的参数,同样应该使残差平方和达到最小,即有:,分别求关于模型参数的一阶偏导数,并令其等于零,得到下面的方程组:,整理得:,(2-2),同样称(2-2)式为正规方程组。,若定义矩阵:,则正规方程组(2-2)式可以用矩阵表示成:,所以,参数的最小二乘估计为:,(2-2),例3.我国国有独立核算工业企业生产函数。根据生产函数理论,生产函数的基本形式为:Y=(t,L,K,)。其中,L、K分别为生产过程中投入的劳动与资金,时间变量t反映了技术进步的影响。试利用EViews软件建立线性生产函数:Y=b0+b1t+b2L+b3K+,在Eviews的命
16、令窗口中输入以下命令:(1)建立工作文件:CREATE A 78 94(2)输入统计资料:DATA Y L K(3)生成时间变量t:GENR T=TREND(77)(4)建立回归模型:LS Y C T L K 操作演示 回归方程窗口如下图所示:,因此,我国国有独立工业企业的生产函数为:,其中括号里的数字为系数的标准差。模型表明,我国国有独立核算工业企业的劳动力边际产出为0.6667,资金的边际产出为0.7764,技术进步的影响使工业总产值平均每年递增77.68亿元。但是模型中除资金变量K之外,其它变量(包括常数项)所对应回归系数的估计误差都比较大。因此,需要对模型做适当的调整。,课外练习题,1
17、、如何理解OLS估计。2、如何利用OLS法估计多元线性回归模型参数,写出推导过程。3、上机练习本节例题1、2、3及教材例2-2、3。熟悉和掌握Eviews软件的使用。,第二节 回归模型的参数估计,四、最小二乘估计的性质,1、参数估计量的评价标准 数理统计学证明,一个优良估计量必须同时具有无偏性、有效性和一致性。(1)无偏性:设 是参数的估计量,如果E()=,则称 是的无偏估计。无偏性保证了参数估计值是在参数真实值(简称参数真值)的左右波动,并且“平均位置”就是参数的真值。(2)有效性(最小方差性):设,均为参数的无偏估计量,若D()D(),则称 比 有效;如果在的所有无偏估计量中,D()最小,
18、则称 为有效估计量。有效性衡量了参数估计值与参数真值平均离散程度大小。,(3)一致性:这是估计量的一个大样本性质,如果随着样本容量的增加,估计量 越来越接近于真值,则称 为的一致估计。严格地说,是依概率收敛于,即:其中为一个任意小的正数。2、高斯马尔可夫定理 在古典回归模型的若干假定成立的情况下,最小二乘估计是所有线性无偏估计量中的有效估计量。这就是著名的高斯马尔可夫定理,它表明:最小二乘估计与用其它方法得到的任何线性无偏估计量相比,具有方差最小的特性。所以称OLS估计为“最佳线性无偏估计量”(Best Linear Unbiased Estimator BLUE),这也是最小二乘估计被广泛使
19、用的原因之一。,现仅就一元线性回归模型给出高斯马尔可夫定理的证明。,(1)线性 所谓线性是指参数估计量是 的线性函数。根据一元线性回归模型的最小二乘估计式(2-1)式可以得出:,其中:,所以,是一个线性估计量,同理可得 也是一个线性估计量。,(2)无偏性,由 的定义容易证得:,从而有:,则:,(最后一步使用了基本假定E(i)=0和E(xii)=0)所以得到:,同理可得:,(3)有效性(最小方差性),先推导 的方差:,(使用了i与j互不相关假定),(使用了同方差假定),设 是b的另一个线性无偏估计量,由于,则应有,而且,所以,(注意yi也是互不相关的),(D(yi)=D(i)=2),而且等号只有当时ci=ki才能成立;也就是说,对于b的任意一个线性无偏估计量,其方差均大于最小二乘估计的方差。同理可以证得 的有效性。,从定理的证明过程可以看出,“OLS估计是最佳估计量”这个结论是有一些前提条件的,只有在古典回归模型的若干假定成立的情况下,OLS估计才具有无偏性、有效性等优良的统计性质。,
链接地址:https://www.31ppt.com/p-6251312.html