线性回归分析基础.ppt
《线性回归分析基础.ppt》由会员分享,可在线阅读,更多相关《线性回归分析基础.ppt(55页珍藏版)》请在三一办公上搜索。
1、第一章 一元线性回归分析基础,2023/6/23,重点问题,参数的最小二乘估计 最小二乘估计的性质 参数估计的检验 预测,2023/6/23,第一章 一元线性回归分析基础,1、几个概念条件分布(Conditional distribution):以X取定值为条件的Y的条件分布条件概率(Conditional probability):给定X的Y的概率,记为P(Y|X)。例如,P(Y=55|X=80)=1/5;P(Y=150|X=260)=1/7。条件期望(conditional Expectation):给定X的Y的期望值,记为E(Y|X)。例如,E(Y|X=80)=551/5601/5651
2、/5701/5751/565总体回归曲线(Popular Regression Curve)(总体回归曲线的几何意义):当解释变量给定值时因变量的条件期望值的轨迹。2、总体回归函数(Popular Regression Function,PRF)E(Y|Xi)=f(Xi)当PRF的函数形式为线性函数,则有,E(Y|Xi)=1+2Xi其中1和2为未知而固定的参数,称为回归系数。1和2也分别称为截距和斜率系数。上述方程也称为线性总体回归函数。3、“线性”的含义“线性”可作两种解释:对变量为线性,对参数为线性。一般“线性回归”一词总是指对参数为线性的一种回归(即参数只以它的1次方出现)。,2023/
3、6/23,第一章 一元线性回归分析基础,4、PRF的随机设定 将个别的Yi围绕其期望值的离差(Deviation)表述如下:ui=Yi-E(Y|Xi)或 Yi=E(Y|Xi)+ui其中ui为随机误差项(Stochastic error)或随机干扰项(Stochastic disturbance)。线性总体回归函数:PRF:Yi=1+2Xi+ui=E(Y|Xi)+ui5、随机干扰项的意义 随机扰动项是从模型中省略下来的而又集体地影响着Y的全部变量的替代物。显然的问题是:为什么不把这些变量明显地引进到模型中来,而以随即扰动项来替代?理由是多方面的:(1)理论的含糊性:理论不能完全说明影响因变量的所
4、有影响因素。(2)数据的欠缺:无法获得有关数据。(3)核心变量与周边变量:希望能找到与有较大影响的核心变量的关系。(4)内在随机性:因变量具有内在的随机性。(5)替代变量:用来代替不可观测变量的替代变量选择,造成一定误差。(6)省略原则:研究中尽可能使回归式简单。(7)错误的函数形式:回归式的的选择是主观的。,2023/6/23,第一章 一元线性回归分析基础,6、样本回归函数(SRF)由于在大多数情况下,我们只知道变量值得一个样本,要用样本信息的基础上估计PRF。,样本1,样本2,样本回归函数SRF:,在回归分析中,我们用SRF估计PRF。,2023/6/23,第一章 一元线性回归分析基础,估
5、计量(Estimator):一个估计量又称统计量(statistic),是指一个规则、公式或方法,以用来根据已知的样本所提供的信息去估计总体参数。在应用中,由估计量算出的数值称为估计(值)(estimate)。样本回归函数SRF的随机形式为:,其中 表示(样本)残差项(residual)。,Xi X,PRF:E(Y|Xi)=1+2Xi,SRF:,Y,E(Y|Xi),SRF是PRF的近似估计。为了使二者更为接近,即要使,第一章 一元线性回归分析基础,2023/6/23,主要内容,第一节 模型的假定 第二节 参数的最小二乘估计 第三节 最小二乘估计量的性质第四节 系数的显著性检验第五节 预测和预测
6、区间,第一章 一元线性回归分析基础,2023/6/23,第一节 模型的假定,一、一元线性回归模型 各种经济变量之间的关系,可以划分为两种类型。一类是变量之间有惟一确定的关系,即函数关系,可表示为:F(X1,X2,Xn,Y)=0(11)或 Y=f(X1,X2,Xn)(12)其中,最简单的形式为一元线性函数关系 Y=PX(13)另一类关系为不完全确定的相关关系,表示为:F(X1,X2,Xn,Y,u)=0(14),第一章 一元线性回归分析基础,2023/6/23,第一节 模型的假定,或 Y=f(X1,X2,Xn,u)(15)其中最简单的形式为一元线性回归模型 Y=1+2X+u(16)计量经济学只讨论
7、变量之间不完全确定的关系,如式(14)或式(15)所表示的关系。如式(16)所表示的关系式,称为一元线性回归模型。“一元”是指只有一个自变量X,这个自变量X可以解释引起因变量Y变化的部分原因。因此,X称为解释变量,Y称为被解释变量,1和2为参数。,第一章 一元线性回归分析基础,2023/6/23,第一节 模型的假定,“线性”一词在这里有两重含义。它一方面指被解释变量Y与解释变量X之间为线性关系,另一方面也指Y与参数1、2之间为线性关系。在数理统计学中,“回归”通常指散布点分布在一条直线(或曲线)附近,并且越靠近该直线(或曲线),点的分布越密集的情况。“模型”一词通常指满足某些假设条件的方程或方
8、程组。,第一章 一元线性回归分析基础,2023/6/23,第一节 模型的假定,二、误差项的性质 与精密数学中的函数关系相比,回归模型式(14),式(15),式(16)中的显著特点是多了误差项u。产生误差项的原因主要有以下几方面:1.忽略掉的影响因素造成的误差 2.模型关系不准确造成的误差 3.变量观察值的计量误差 4.随机误差 误差项的存在是计量经济学模型的特点,是计量经济学模型与精密数学中完全确定的函数关系的主要区别。,第一章 一元线性回归分析基础,2023/6/23,第一节 模型的假定,三、经典假设条件 经典的一元线性回归模型 Yt=1+2Xt+ut(t=1,2,,n)(17)通常要满足五
9、个假设条件:假设1 误差项ut的数学期望(均值)为零,即 E(ut)=0(t=1,2,,n)(18)假设2 误差项ut的方差与t无关,为一个常数,即 var(ut)=E(ut-E(ut)2)=E(ut2)=u2(t=1,2,,n)(19)假设3 不同的误差项ut和us之间互相独立,即 cov(ut,us)=E(ut-E(ut)(us-E(us)=0(110),第一章 一元线性回归分析基础,2023/6/23,第一节 模型的假定,(ts;t=1,2,n;s=1,2,n)或 E(utus)=0(111)假设4 解释变量Xt与误差项ut不相关,即 cov(Xt,ut)=E(Xt-E(Xt)(ut-E
10、(ut)=E(Xt-E(Xt)ut)=0(t=1,2,,n)(112)假设5 ut为服从正态分布的随机变量,即 utN(0,u2)以上五个假设条件称为经典假设条件。综上所述,一元线性回归模型可以归结为 Yt=1+2Xt+ut(t=1,2,,n)(113),第一章 一元线性回归分析基础,2023/6/23,第一节 模型的假定,E(ut)=0 cov(ut,us)=0(ts;t,s=1,2,n)var(ut)=u2(常数)cov(Xt,ut)=0 utN(0,u2),第一章 一元线性回归分析基础,2023/6/23,第二节 参数的最小二乘估计,一、拟合准则与最小二乘估计 拟合准则:1使 达到最小值
11、 2使 达到最小值 3使 达到最小值 4使 达到最小值,第4种准则,由于逐项平方,不存在正负抵消的问题。它不仅考虑了所有点的影响,而且具有无偏性,是一个很好的准则。这个准则称为最小二乘准则。用最小二乘准则寻找拟合直线的方法称为最小二乘法。,第一章 一元线性回归分析基础,2023/6/23,第二节 参数的最小二乘估计,为简化表达式,从本节起,在不会发生误解的情况下,略去求和指标t求和的上下限。只要求和符号没有上下限,就表示为从t=1到t=n求和。即用求和符号代替符号,假设估计直线:Y=*+*X*,*为参数估计当X=XtYt=*+*Xt(Xt,Yt)(Xt,*+*Xt)残差:et=Yt-(*+*X
12、t)误差:ut=Yt-(+Xt)残差平方和:Q=et2=Yt-(*+*Xt)2,第一章 一元线性回归分析基础,2023/6/23,第二节 参数的最小二乘估计,第一章 一元线性回归分析基础,2023/6/23,第二节 参数的最小二乘估计,第一章 一元线性回归分析基础,2023/6/23,第二节 参数的最小二乘估计,第一章 一元线性回归分析基础,2023/6/23,第二节 参数的最小二乘估计,二、总体与样本 在数理统计中,通常把研究对象的全体称为总体。把总体中的每个元素称为个体。从总体中随机抽取的一组个体称为样本。抽取的个体数,称为样本容量。从总体中抽取样本的过程称为随机抽样。,总体,有限总体,无
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性 回归 分析 基础
链接地址:https://www.31ppt.com/p-5298653.html