第十一章统计学一元线性回归课件.ppt
《第十一章统计学一元线性回归课件.ppt》由会员分享,可在线阅读,更多相关《第十一章统计学一元线性回归课件.ppt(88页珍藏版)》请在三一办公上搜索。
1、第,11,章,一元线性回归,11.1,变量间关系的度量,11.2,一元线性回归,11.3,利用回归方程进行估计和预测,11.4,残差分析,学习目标,1.,相关关系的分析方法,2.,一元线性回归的基本原理和参数的最小,二乘估计,3.,回归直线的拟合优度,4.,回归方程的显著性检验,5.,利用回归方程进行估计和预测,6.,用,Excel,进行回归,重点,1.,一元线性回归分析,2.,用软件进行回归分析,难点,最小二乘法的原理并用它解决实际问题,本章教学重点与难点,11.1,变量间关系的度量,11.1.1,变量间的关系,11.1.2,相关关系的描述与测度,11.1.3,相关系数的显著性检验,变量间的
2、关系,函数关系,1.,是一一对应的确定关系,2.,设有两个变量,x,和,y,,变量,y,随变量,x,一起变化,并完,全依赖于,x,,当变量,x,取某,个数值时,,y,依确定的关系,取相应的值,则称,y,是,x,的,函数,记为,y,=,f,(,x,),,其中,x,称为自变量,,y,称为因变,量,3.,各观测点落在一条线上,?,?,?,?,?,?,?,?,?,x,y,函数关系,(,几个例子,),?,某种商品的销售额,y,与销售量,x,之间的关系,可表示为,y,=,px,(,p,为单价,),?,圆的面积,S,与半径,R,之间的关系可表示为,S,=,?,R,2,?,企业的原材料消耗额,y,与产量,x,
3、1,、单位产,量消耗,x,2,、原材料价格,x,3,之间的关系可表,示为,y,=,x,1,x,2,x,3,相关关系,(correlation),1.,变量间关系不能用函数关,系精确表达,2.,一个变量的取值不能由另,一个变量唯一确定,3.,当变量,x,取某个值时,变,量,y,的取值可能有几个,4.,各观测点分布在直线周围,?,?,?,?,?,?,?,?,?,x,y,相关关系,(,几个例子,),?,父亲身高,y,与子女身高,x,之间的关系,?,收入水平,y,与受教育程度,x,之间的关系,?,粮食单位面积产量,y,与施肥量,x,1,、降雨量,x,2,、温度,x,3,之间的关系,?,商品的消费量,y
4、,与居民收入,x,之间的关系,?,商品销售额,y,与广告费支出,x,之间的关系,相关关系,(,类型,),正,相,关,负,相,关,线,性,相,关,非,线,性,相,关,正,相,关,负,相,关,完,全,相,关,不,相,关,相,关,关,系,相关关系的描述与测度,(,散点图,),相关分析及其假定,1.,相关分析要解决的问题,?,变量之间是否存在关系?,?,如果存在关系,它们之间是什么样的关系?,?,变量之间的关系强度如何?,?,样本所反映的变量之间的关系能否代表总体变量之,间的关系?,2.,为解决这些问题,在进行相关分析时,对总体有,以下两个主要假定,?,两个变量之间是线性关系,?,两个变量都是随机变量
5、,散点图,(scatter diagram),?,?,?,?,?,?,?,?,?,?,?,?,不相关,?,?,?,?,?,?,?,?,?,负线性相关,?,?,?,?,?,?,?,?,?,正线性相关,?,?,?,?,?,?,?,?,?,?,?,?,非线性相关,?,?,?,?,?,?,?,完全负线性相关,完全正线性相关,?,?,?,?,?,?,?,?,?,散点图,(,例题分析,),?,【例】,一家大型商业银行在多个地区设有分行,,其业务主要是进行基础设施建设、国家重点项,目建设、固定资产投资等项目的贷款。近年来,,该银行的贷款额平稳增长,但不良贷款额也有,较大比例的增长,这给银行业务的发展带来较,
6、大压力。为弄清楚不良贷款形成的原因,管理,者希望利用银行业务的有关数据做些定量分析,,以便找出控制不良贷款的办法。下面是该银行,所属的,25,家分行,2002,年的有关业务数据,散点图,(,例题分析,),散点图,(,不良贷款对其他变量的散点图,),不良贷款与贷款余额的散点图,0,2,4,6,8,10,12,14,0,100,200,300,400,贷款余额,不,良,贷,款,不良贷款与贷款项目个数的散点图,0,2,4,6,8,10,12,14,0,10,20,30,40,贷款项目个数,不,良,贷,款,不良贷款与固定资产投资额的散点图,0,2,4,6,8,10,12,14,0,50,100,150
7、,200,固定资产投资额,不,良,贷,款,不良贷款与累计应收贷款的散点图,0,2,4,6,8,10,12,14,0,10,20,30,累计应收贷款,不,良,贷,款,相关关系的描述与测度,(,相关系数,),相关系数,(correlation coefficient),1.,度量变量之间关系强度的一个统计量,2.,对两个变量之间线性相关强度的度量称为简单相,关系数,3.,若相关系数是根据总体全部数据计算的,称为总,体相关系数,记为,?,4.,若是根据样本数据计算的,则称为样本相关系数,,简称为相关系数,记为,r,?,也,称,为,线,性,相,关,系,数,(linear,correlation,coe
8、fficient),?,或称为,Pearson,相关系数,(Pearsons,correlation,coefficient),相关系数,(,计算公式,),?,?,样本相关系数的计算公式,?,?,?,?,?,?,?,?,?,2,2,),(,),(,),)(,(,y,y,x,x,y,y,x,x,r,或化简为,?,?,?,?,2,2,2,2,?,?,?,?,?,?,?,?,?,?,?,y,y,n,x,x,n,y,x,xy,n,r,相关系数的性质,?,性质,1,:,r,的取值范围是,-1,1,?,|,r,|=,1,,为完全相关,?,r,=,1,,为完全正相关,?,r,=,-1,,为完全负正相关,?,
9、r,=,0,,不存在,线性,相关,关系,?,-1,?,r,0,,为负相关,?,0,r,?,1,,为正相关,?,|,r,|,越趋于,1,表示关系越强;,|,r,|,越趋于,0,表示,关系越弱,相关系数的性质,?,性质,2,:,r,具有对称性。即,x,与,y,之间的相关系数和,y,与,x,之间的相关系数相等,即,r,xy,=,r,y,?,性质,3,:,r,数值大小与,x,和,y,原点及尺度无关,即改变,x,和,y,的数据原点及计量尺度,并不改变,r,数值大小,?,性质,4,:仅仅是,x,与,y,之间线性关系的一个度量,它不,能用于描述非线性关系。这意为着,,r,=0,只表示两,个变量之间不存在线性
10、相关关系,并不说明变量之,间没有任何关系,?,性质,5,:,r,虽然是两个变量之间线性关系的一个度量,,却不一定意味着,x,与,y,一定有因果关系,相关系数的经验解释,1.,|,r,|,?,0.8,时,可视为两个变量之间高度相,关,2.,0.5,?,|,r,|,0.8,时,可视为中度相关,3.,0.3,?,|,r,|,0.5,时,视为低度相关,4.,|,r,|,0.3,时,说明两个变量之间的相关程度,极弱,可视为不相关,5.,上述解释必须建立在对相关系数的显著性,进行检验的基础之上,相关系数,(,例题分析,),?,?,用,Excel,计算相关系数,相关系数的显著性检验,相关系数的显著性检验,(
11、,检验的步骤,),1.,检验两个变量之间是否存在线性相关关系,2.,等价于对回归系数,b,1,的检验,3.,采用,R.A.Fisher,提出的,t,检验,4.,检验的步骤为,?,提出假设:,H,0,:,?,?,?,;,H,1,:,?,?,0,),2,(,1,2,2,?,?,?,?,n,t,r,n,r,t,?,计算检验的统计量:,?,确定显著性水平,?,,并作出决策,?,若,?,t,?,t,?,,拒绝,H,0,?,若,?,t,?,t,?,,不拒绝,H,0,相关系数的显著性检验,(,例题分析,),?,?,对不良贷款与贷款余额之间的相关系数,进行显著性检验,(,?,?,0.05),1.,提出假设:,
12、H,0,:,?,?,?,;,H,1,:,?,?,0,2.,计算检验的统计量,5344,.,7,8436,.,0,1,2,25,8436,.,0,2,?,?,?,?,t,3.,根据显著性水平,?,0.05,,查,t,分布表得,t,?,(,n,-2)=2.069,?,由于,?,t,?,=7.5344,t,?,(25-2)=2.069,,拒绝,H,0,,不良贷,款与贷款余额之间存在着显著的正线性相关关系,相关系数的显著性检验,(,例题分析,),?,各相关系数检验的统计量,11.2,一元线性回归,11.2.1,一元线性回归模型,11.2.2,参数的最小二乘估计,11.2.3,回归直线的拟合优度,11.
13、2.4,显著性检验,什么是回归分析?,(Regression),1.,从一组样本数据出发,确定变量之间的数学,关系式,2.,对这些关系式的可信程度进行各种统计检验,,并从影响某一特定变量的诸多变量中找出哪,些变量的影响显著,哪些不显著,3.,利用所求的关系式,根据一个或几个变量的,取值来预测或控制另一个特定变量的取值,,并给出这种预测或控制的精确程度,回归模型的类型,线,性,回,归,非,线,性,回,归,一,元,回,归,线,性,回,归,非,线,性,回,归,多,元,回,归,回,归,模,型,一元线性回归模型,一元线性回归,1.,涉及一个自变量的回归,2.,因变量,y,与自变量,x,之间为线性关系,?
14、,被,预,测,或,被,解,释,的,变,量,称,为,因,变,量,(dependent,variable),,用,y,表示,?,用来预测或用来解释因变量的一个或多个变,量称为自变量,(independent,variable),,用,x,表示,3.,因变量与自变量之间的关系用一个线性方,程来表示,回归模型,(regression model),1.,回答“变量之间是什么样的关系?”,2.,方程中运用,?,1,个数值型因变量,(,响应变量,),?,被预测的变量,?,1,个或多个数值型或分类型自变量,(,解释变量,),?,用于预测的变量,3.,主要用于预测和估计,一元线性回归模型,1.,描述因变量,y
15、,如何依赖于自变量,x,和误差项,?,的,方程称为,回归模型,2.,一元线性回归模型可表示为,?,y,=,b,?,+,b,1,x,+,?,?,y,是,x,的线性函数,(,部分,),加上误差项,?,线性部分反映了由于,x,的变化而引起的,y,的变化,?,误差项,?,是随机变量,?,反映了除,x,和,y,之间的线性关系之外的随机因素对,y,的,影响,?,是不能由,x,和,y,之间的线性关系所解释的变异性,?,b,0,和,b,1,称为模型的参数,一元线性回归模型,(,基本假定,),1.,因变量,x,与自变量,y,之间具有线性关系,2.,在重复抽样中,自变量,x,的取值是固定的,即假定,x,是,非随机
16、的,3.,误差项,是一个期望值为,0,的随机变量,即,E,(,)=0,。对,于一个给定的,x,值,,y,的期望值为,E,(,y,)=,b,0,+,b,1,x,4.,对于所有的,x,值,,的方差,2,都相同,5.,误差项,是一个服从正态分布的随机变量,且相互独立。,即,N,(0,2,),?,独立性意味着对于一个特定的,x,值,它所对应的,与其他,x,值所对应的,不相关,?,对于一个特定的,x,值,它所对应的,y,值与其他,x,所对应的,y,值也不相关,一元线性回归模型,(,基本假定,),x,=,x,3,时的,E,(,y,),x,=,x,2,时,y,的分布,x,=,x,1,时,y,的分布,x,=,
17、x,2,时的,E,(,y,),x,3,x,2,x,1,x,=,x,1,时的,E,(,y,),b,0,x,y,x,=,x,3,时,y,的分布,b,0,+,b,1,x,回归方程,(regression equation),1.,描述,y,的平均值或期望值如何依赖于,x,的方,程称为,回归方程,2.,一元线性回归方程的形式如下,3.,E,(,y,),=,b,0,+,b,1,x,?,方程的图示是一条直线,也称为直线回归方程,?,b,0,是回归直线在,y,轴上的截距,是当,x,=0,时,y,的期,望值,?,b,1,是直线的斜率,称为回归系数,表示当,x,每变动,一个单位时,,y,的平均变动值,估计的回归
18、方程,(estimated regression equation),3.,一元线性回归中估计的回归方程为,2.,用样本统计量,和,代替回归方程中的未知参,数,和,,就得到了,估计的回归方程,0,?,b,1,?,b,0,b,1,b,1.,总体回归参数,和,是未知的,必须利用样本数,据去估计,0,b,1,b,x,y,1,0,?,?,?,b,b,+,?,其中:,是估计的回归直线在,y,轴上的截距,,是直线,的斜率,它表示对于一个给定的,x,的值,,是,y,的估,计值,也表示,x,每变动一个单位时,,y,的平均变动值,0,?,b,1,?,b,y,?,参数的最小二乘估计,最小二乘估计,(method
19、of least squares),最小,?,?,?,?,?,?,?,?,?,n,i,i,i,n,i,i,x,y,y,y,1,2,1,0,1,2,),?,?,(,),?,(,b,b,1.,德国科学家,Karl Gauss(1777,1855),提出用,最小化图中垂直方向的误差平方和来估计参数,2.,使因变量的观察值与估计值之间的误差平方和,达到最小来求得,和,的方法。即,3.,用最小二乘法拟合的直线来代表,x,与,y,之间的,关系与实际数据的误差比其他任何直线都小,0,?,b,1,?,b,Karl Gauss,的最小化图,x,y,(,x,n,y,n,),(,x,1,y,1,),?,?,?,?,
20、?,?,?,?,?,(,x,2,y,2,),(,x,i,y,i,),e,i,=,y,i,-,y,i,x,y,1,0,?,?,?,b,b,+,?,?,相关分析中,x,与,y,对等,回归分析中,x,与,y,要确定自变量和因变量;,?,相关分析中,x,、,y,均为随机变量,回归分,析中只有,y,为随机变量;,?,相关分析测定相关程度和方向,回归分,析用回归模型进行预测和控制。,回归分析与相关分析,区别:,总体一元线性回归模型:,?,b,b,+,+,?,X,Y,1,0,?,模型,参数,误差,项,假定:,E,(,?,)=0,总体一元线性回归方程:,X,Y,1,0,?,b,b,+,?,一元线性回归方程的几
21、何意义,),(,Y,E,X,X,Y,b,?,+,?,?,截距,斜率,一元线性回归方程的可能形态,b,为正,b,为负,b,为,0,回归直线的拟合,?,?,BX,A,Y,E,Y,+,?,?,?,总体一元线性,回归方程,:,样本一元线性回归方程:,bx,a,y,+,?,?,以样本统计量估计总体参数,斜率(回归系数),截距,截距,a,表示在没有自变量,x,的影响时,其它各,种因素对因变量,y,的平均影响;,回归系数,b,表,明自变量,x,每变动一个单位,因变量,y,平均变,动,b,个单位。,(,估计的回归方程,),i,i,i,i,y,bx,a,y,y,y,x,bx,a,y,?,?,+,?,+,+,?,
22、+,?,?,),(,?,值应为,的实际,而变量,之间的平均变动关系,,变量,与,是理论模型,表明,随机干扰:,各种偶然,因素、观察误差和其,他被忽视因素的影响,X,对,y,的线性影响而形,成的系统部分,反映,两变量的平均变动关,系,即本质特征。,一元线性回归方程,中参数,a,、,b,的确定,:,bx,a,y,+,?,?,最小平方法,基本数学要求,?,?,?,?,?,?,?,?,min,),?,(,0,?,2,y,y,y,y,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,0,2,0,1,2,min,min,),?,(,2,
23、2,x,bx,a,y,bx,a,y,b,a,bx,a,y,y,y,,有,求偏导数,并令其为零,、,分别对函数中,,有,由,整理得到由两个关于,a,、,b,的二元一次,方程组成的方程组:,?,?,?,?,+,?,?,?,?,+,?,?,2,x,b,x,a,xy,x,b,na,y,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,x,b,y,n,x,b,n,y,a,x,x,n,y,x,xy,n,b,2,2,),(,进一步整理,有:,10名学生的身高与体重散点图,40,45,50,55,60,65,70,75,158,160,162,164,166,168,170,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十一 统计学 一元 线性 回归 课件
链接地址:https://www.31ppt.com/p-3947012.html