回归与拟合分析课件.ppt
《回归与拟合分析课件.ppt》由会员分享,可在线阅读,更多相关《回归与拟合分析课件.ppt(68页珍藏版)》请在三一办公上搜索。
1、第二章 回归与拟合分析,提纲,1.线性回归分析2.逐步回归分析3.非线性回归分析4.SCGM多点分析,1.1 线性回归概念,经典的线性回归分析法仍广泛应用于变形测量数据处理中。它是研究一个变量(因变量)与多个因子(自变量)之间非确定关系(相关关系)的最基本方法。该方法通过分析所观测的效应量(如变形)和原因(如荷载)之间的相关性,来建立数学模型。如:因变量:水库大坝的变形;自变量:水库水位、气温、降雨量等,1.2 线性回归模型,线性回归模型 式中 为因变量,是为可观测的随机变量;是自变量,为可观测的已知变量;为不可观测的随机误差项,为未知参数 如果进行了n 期观测,可写为,1.2 线性回归模型,
2、矩阵表达 式中,1.3 线性回归模型建立过程,回归分析模型建立的过程根据实际研究问题设置目标变量收集整理统计数据构造回归模型对模型参数进行估计对回归方程和回归系数进行假设检验回归模型的应用,1.4 线性回归模型参数估计,模型参数估计回归参数可通过样本数据(观测数据)来估计,误差方程可以写成:按最小二乘准则参数估值,1.4 线性回归模型参数估计,的最小二乘估值多元回归模型的标准差(中误差),1.5 线性回归模型的拟合优度,拟合优度:样本观测值聚集在样本回归线周围的紧密程度。常用指标是复相关系数定义:总离差平方和回归平方和残差平方和三者关系,1.5 线性回归模型的拟合优度,复相关系数(可决系数)在
3、总离差平方和中回归平方和所占的比重越大,则回归效果越好,说明回归模型与样本观测值拟合得好;如果残差平方和所占比重大,则回归模型与样本观测值拟合得不理想。把回归平方和与总离差平方和之比定义为可决系数,或复相关系数,1.6 总体回归模型的显著性检验,实际问题中,事先并不能断定因变量 与自变量 之间是否确有线性关系。在求线性回归方程之前,线性回归模型只是一种假设。在求得线性回归方程后,还需要对回归方程进行统计检验,以给出肯定或者否定的结论。统计检验原假设:因变量与自变量之间不存在线性关系,则模型中的 为零向量,即备选假设:不全为零,1.6 总体回归模型的显著性检验,检验统计量检验:选择显著性水平 后
4、,可以用下式检验原假设:若上式成立,即可认为在显著性水平 下,回归系数不全为0,即回归方程是显著的。,1.7 回归系数显著性检验t检验,回归方程显著,并不意味着每个自变量 对因变量 的影响都显著,总想从回归方程中剔除那些可有可无的变量,重新建立更为简单的线性回归方程。这时可以采用回归系数显著性检验。统计检验原假设:如果某个变量 对 的作用不显著,则该变量的系数 就应该为零,即 检验统计量:,1.7 回归系数显著性检验t检验,检验:选择显著性水平 后,可以用下式检验原假设:若上式成立,即可认为回归系数 在 置信水平下是显著的。,1.7 回归系数显著性检验F检验,偏回归平方和:在回归分析中,去掉一
5、个自变量使回归平方和减少的部分,也可理解为添入一个自变量使回归平方和增加的部分。可以证明,其为:统计检验原假设:如果某个变量 对 的作用不显著,则该变量的系数 就应该为零,即 检验统计量:,1.7 回归系数显著性检验F检验,检验:选择显著性水平 后,可以用下式检验原假设:若上式成立,即可认为回归系数 在 置信水平下是显著的。,某大坝的垂直位移与水位观测值如下表,试用回归分析求回归方程,某大坝的水平位移与两个主要坝段的温度观测值如下表,试用回归分析求回归方程,1.8 线性回归模型的预报,线性回归模型的预报方程预报就是给自变量一组特定的值(),对因变量的值 进行估计自变量(如气温、水库水位、降雨量
6、、大坝滑坡体的岩土力学参数)的值可以通过实测得到,如滑坡体的岩土力学参数等也可以用前几十年的资料进行预测得到,如气温、水库水位、降雨量等,1.8 线性回归模型的预报,预报误差 的估计值 的期望和方差:构造统计量:,1.8 线性回归模型的预报,预报的置信区间控制:即要求因变量在 之间,自变量因素应该怎么控制,提纲,1.线性回归分析2.逐步回归分析3.非线性回归分析4.SCGM多点分析,2.1 最优回归方程的选择,对于一个因变量可能存在多个影响因素,如何从诸多的影响因素中选择一些有效的变量作为自变量,建立“最优”回归方程十分重要如果遗漏了重要的变量,回归分析的效果一定不会好;如果变量过多,将会把对
7、 y 影响不显著的变量也选入回归方程,这样就影响了回归方程的稳定性,效果也好不了。在实际问题中,影响y的因素很多,而且这些因素之间有可能存在多重共线性,即个自变量之间也有一定的依赖性,这样会出现选择不同的自变量,得到不同的回归结果,对结果的解释也不一样。,2.1 最优回归方程的选择,建立最优回归方程的方法:逐步剔除、逐步引入、逐步回归法“逐步剔除”回归分析步骤:首先采用全部自变量与因变量建立回归方程,对每一个因子作显著性检验,剔除不显著的变量中偏回归平方和最小的变量;然后用剩余的自变量和因变量重建回归方程,再逐个检验回归系数,剔除不显著的变量中偏回归平方和最小的变量;重复上述步骤,直到回归方程
8、中所有的因子都显著。缺点:一开始就要计算所有自变量的回归方程,如果原始自变量中有较多个不显著因素,计算量大;,2.1 最优回归方程的选择,“逐步引入”回归分析:从一个自变量开始,逐个地选入回归方程步骤第一步是在所有的自变量中选出一个,使它和y组成的一元回归方程,回归平方和达到最大,做显著性检验,确认显著时进入下一步;第二步,在未入选的变量中选择一个自变量,使它与已入选的变量组成二元方程,回归平方和达到最大,做显著性检验,确认显著时进入下一步;上述过程不断重复下去,直到选入的变量不显著缺点:未考虑新变量的逐步引入,使得原有引入的变量有可能失去重要性;,2.1 最优回归方程的选择,“逐步回归”分析
9、方法:为了克服上述两种方法的缺点,发展出“有进有出”的回归分析方法,即逐步回归分析方法。类似“逐步引入”方法,根据自变量对y作用的显著程度,逐个引入回归方程。不同之处在于,当原引入变量由于后面的变量引入不再显著时,将其剔除。,2.2 逐步回归分析步骤,一、确定F检验值引入或剔除变量的标准。一般地,为使最终回归方程中包含较多的变量,F检验水平不宜过高,即显著水平不宜太小二、逐步计算如果已计算t步,且回归方程中已引入t个变量,则第t+1步为(1)计算所有自变量的偏回归平方和;(2)剔除自变量:在已引入的t个自变量中,检查是否有需要剔除的不显著变量。方法:在已引入的变量中选取具有最小偏回归平方和的一
10、个并计算F值。如果FF,不需要剔除变量。计算转至步骤(3)。,2.2 逐步回归分析步骤,(3)引入自变量:从未引入的变量中选出具有最大偏回归平方和的自变量,并计算F值,如果FF,则表示该变量显著,应引入回归方程,计算转至步骤(4)。如果FF,则表示已无变量可以选入,逐步回归计算结束。(4)剔除或引入一个变量后,应该重新进行回归,第t+1步结束。重复(1)(4)进行计算。三、其他计算计算回归方程入选变量的系数、复相关系数和残差统计量等。,提纲,1.线性回归分析2.逐步回归分析3.非线性回归分析4.SCGM多点分析,3.1 非线性回归模型概念,自然界大量存在的相互作用是非线性的。例如,边坡变形是一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 拟合 分析 课件

链接地址:https://www.31ppt.com/p-4000344.html