《线性回归》PPT课件.ppt
《《线性回归》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《线性回归》PPT课件.ppt(33页珍藏版)》请在三一办公上搜索。
1、2023/7/31,1,第四部分 回归分析,回归分析的概念一元线性回归多元线性回归多项式回归非线性回归逐步回归,2023/7/31,2,4.1 回归分析的概念,在工农业生产和科学研究中,常常需要研究变量之间的关系。变量之间的关系可以分为两类:确定性关系、非确定性关系。确定性关系就是指存在某种函数关系。然而,更常见的变量之间的关系存在着某种不确定性。例如:商品的销售量与当地人口有关,人口越多,销售量越大,但它们之间并没有确定性的数值关系,同样的人口,可能有不同的销售量。这种既有关联,又不存在确定性数值关系的相互关系,就称为相关关系。回归分析就是研究变量之间相关关系的一种数理统计分析方法。在回归分
2、析中,主要研究以下几个问题:,2023/7/31,3,4.1 回归分析的概念,(1)拟合:建立变量之间有效的经验函数关系;(2)变量选择:在一批变量中确定哪些变量对因变量有显著影响,哪些没有实质影响;(3)估计与检验:估计回归模型中的未知参数,并且对模型提出的各种假设进行推断;(4)预测:给定某个自变量,预测因变量的值或范围。根据自变量个数和经验函数形式的不同,回归分析可以分为许多类别。,2023/7/31,4,4.2 一元线性回归,一元线性回归模型给定一组数据点(x1,y1),(x2,y2),.,(xn,yn),如果通过散点图可以观察出变量间大致存在线性函数关系,则可以建立如下模型:,其中a
3、,b称为一元线性回归的回归系数;表示回归值与测量值之间的误差。针对该模型,需要解决以下问题:(1)如何估计参数a,b以及2;(2)模型的假设是否正确?(3)如何应用所求的回归方程对试验指标进行预测。,2023/7/31,5,4.2 一元线性回归,回归系数的最小二乘估计已知(x1,y1),(x2,y2),.,(xn,yn),代入回归模型得到:,采用最小二乘法(即使观测值与回归值的离差平方和最小):,2023/7/31,6,4.2 一元线性回归,回归系数估计量的性质,2023/7/31,7,4.2 一元线性回归,对2的估计,对a,b,2的区间估计,2023/7/31,8,4.2 一元线性回归,样本
4、相关系数及其显著性检验,显然:样本相关系数R的符号决定于Lxy,因此与相关系数b的符号一致。说明:(1)当R=0时,Lxy=0,因此b=0,说明Y的变化与X无关,此时Y与X毫无线性相关关系;(2)当R=1时,所有的样本点都在回归直线上,此时称Y与X完全线性相关,R=1,完全正相关,R=-1,完全负相关;(3)当0|R|1时,说明X与Y存在一定的线性相关关系,0R1,正相关;-1 R0,负相关;R的绝对值越大,相关关系越显著。,2023/7/31,9,4.2 一元线性回归,给定显著性水平a,查表得F的临界值Fa,若F*Fa(F*为F的观测值),则拒绝假设即认为X与Y之间相关关系显著;否则认为Y与
5、X不存在线性相关关系;也可使用P=PFF*来比较,若P Fa),则拒绝假设即认为X与Y之间相关关系显著;一般使用时,P接近于0。,显著性检验:原假设H0:b=0,的值可以使用polyfit()或regress()命令计算,用法参看MATLAB具体说明。,2023/7/31,10,4.2 一元线性回归,利用回归模型进行预测,当回归模型和系数通过检验后,可由给定的x0值代入回归方程得到Y的点预测值y0:,给定显著性水平a,可以得到Y的预测区间:,2023/7/31,11,4.2 一元线性回归,利用回归模型进行控制,观察值y在某个区间(y1,y2)取值时,应如何控制x的取值范围,使得响应的观察值落入
6、指定区间的概率至少为1-a.解方程:,解得x1,x2,即可以得到x的控制区间的两个端点值。,x1,x2,y2,y1,2023/7/31,12,4.2 一元线性回归,异常数据的剔除,当用regress()命令得到回归模型的系数估计值和残差及残差置信区间时,由于残差符合均值为零的正态分布,所以残差置信区间应该通过零点。用rcoplot(r,rint)画出残差图,由图可容易看出异常数据点,剔除这些异常点,重新进行回归分析,可使模型预测更精确。,2023/7/31,13,4.2 一元线性回归,例4.1人口预测1949年1994年我国人口数据资料如下:年份xi 49 54 59 64 69 74 79
7、84 89 94人数yi 5.4 6.0 6.7 7.0 8.1 9.1 9.8 10.3 11.3 11.8 建模分析我国人口增长的规律,预报1999、2005年我国人口数。,建模分析步骤:(1)在坐标系上作观测数据的散点图。(2)根据散点分布的几何特征提出模型(3)利用数据估计模型的参数(4)计算拟合效果(1)散点图,2023/7/31,14,4.2 一元线性回归,(2)人口线性增长模型假设:人口随时间线性地增加,模型:y=a+b x+(3)利用数据估计模型的参数观测值的模型:yi=a+b xi+i,i=1,n拟合的精度:Q=i 2=(yi-a b xi)2,误差平方和。最小二乘法:求参数
8、 a 和 b,使得误差平方和最小。用MATLAB中的regress()命令可以算出:a=2.032,b=0.148模型:y=2.032+0.148 x(4)拟合精度 Q=0.3280,R2=0.9928,F=1101.878,P=0由R2和P表明拟合效果很好!(5)预报当X=99时,Y=12.62亿;当X=105时,Y=13.508亿,2023/7/31,15,4.3 多元线性回归,多元线性回归模型,其中i称为多元线性回归的回归系数;表示回归值与测量值之间的误差。,2023/7/31,16,4.3 多元线性回归,回归系数的最小二乘估计,已知(xi1,xi2,.,xim,yi),i=1,2,.,
9、n,代入回归模型,利用最小二乘法可得到回归系数的最小二乘估计。令:,2023/7/31,17,4.3 多元线性回归,2023/7/31,18,4.3 多元线性回归,回归模型的检验回归模型是否为线性函数形式?问题可转化为检验原假设:H0:1=2=.=m=0,与一元回归分析一样F检验,命令说明等类似。,2023/7/31,19,4.3 多元线性回归,回归系数的检验上个检验被拒绝时,表明回归系数不全为零,但不排除某个或某些系数为零。检验原假设:H0:i=0,若假设成立,表明因素Xi对Y的影响不显著。,2023/7/31,20,4.3 多元线性回归,例4.2 为了研究火柴销量与各因素间的回归关系,收集
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性回归 线性 回归 PPT 课件
链接地址:https://www.31ppt.com/p-5589488.html