回归分析赵小艳.ppt
《回归分析赵小艳.ppt》由会员分享,可在线阅读,更多相关《回归分析赵小艳.ppt(81页珍藏版)》请在三一办公上搜索。
1、线性回归分析,作 者:赵小艳 电子邮箱:电 话:,一、引言,2004年全国数模竞赛的B题“电力市场的输电阻塞管理”第一个问题:某电网有8台发电机组,6条主要线路,表1和表2中的方案0给出了各机组的当前出力和各线路上对应的有功潮流值,方案132给出了围绕方案0的一些实验数据,试用这些数据确定各线路上有功潮流关于各发电机组出力的近似表达式。,表1 各机组出力方案(单位:兆瓦,记作MW),表2 各线路的潮流值(各方案与表1相对应,单位:MW),仔细分析题目,可以发现,该问题就是要找出各线路上有功潮流与8台发电机出力的函数关系,这在数学上是一个函数拟合问题。对函数拟合,可以采用线性函数,也可以采用非线
2、性函数,比如多项式函数,三角函数,指数函数等等。在给出具体问题的具体数据时,首先想到的还是最简单的方法下手,采用最简单的函数去拟合,也就是线性函数来表达。,1、模型的分析,由电网的拓扑结构,线路上的有功潮流由机组出力决定。又根据功率的叠加原理,各线路上有功潮流应为各发电机组出力的线性组合,考虑对所有实验数据采用最小二乘法进行线性拟合,从而得到各线路有功潮流关于各发电机组出力的近似表达式。,2、模型的建立与求解,根据表1和表2围绕方案0的1-32组实验数据,可以列出关于未知数的32个方程的方程组,利用SAS或Matlab编程求解方程组,得,还需要根据样本值运用假设检验来判断,以确定求得的回归方程
3、是否有价值。,在许多国际国内数学建模竞赛中,都有可能用到回归分析。因此,我们介绍线性回归分析的基本原理,对模型好坏的评价指标,可线性化的回归分析,利用统计软件的实现等具体问题。,二、回归分析方法,回归分析是研究一个或一组变量(因变量,结果)与另一些变量(自变量或回归变量,原因)之间的依存关系。在回归模型中,若变量之间的关系是线性关系,称为线性回归模型,否则,称为非线性回归模型。当自变量只有一个,称为一元线性回归,如果自变量有多个,称为多元线性回归。,1、一元线性回归,一元线性回归模型为,满足,一元线性回归,则,令,正规方程组,一元线性回归,整理得,一元线性回归,其中,,参数的最小二乘估计,一元
4、线性回归,称作y关于x的一元经验回归方程。,一元线性回归,一元线性回归,一元线性回归,2、多元线性回归,模型为:,多元线性回归,令,多元线性回归,注意:矩阵X的第一列全是1.,则(6)可用矩阵表达为,多元线性回归,对应正规方程组为,在X不是列满秩时,其解虽然不唯一,但对任意一组解都使得残差平方和最小。,多元线性回归,多元线性回归,关于多重共线性的知识请参阅韩中庚数学建模方法及其应用。,当 p=1 时,多元线性回归就变成一元线性回归分析了,这时参数的求解和误差的方差的无偏估计与一元得到的结论是一样的,类似地也有经验回归平面方程。,多元线性回归,3、回归模型的假设检验,在许多实际问题中,我们事先并
5、不能断定因变量与自变量之间是否确有线性关系,而前面建立的因变量与多个自变量间的线性关系只是一种假设,尽管这种假设常常不是没有根据的。这就意味,所求得的经验回归方程是否有实用价值,需要经过假设检验才能确定。,主要从以下几个方面进行检验:,a、回归方程的检验;,b、回归系数的检验;,c、回归好坏程度的度量。,a、回归方程的检验,是否全为零。若全为零,则认为线性回归不显著,否则认为线性回归显著。为此,在上述模型中作假设,要检验(6)的变量间有没有这种线性关系,只要检验p个系数,考虑总偏差平方和,利用正规方程组,有,为了构造检验统计量,记,经验回归方程,回归方程的检验,回归方程的检验,它是由自变量X的
6、取值变化且通过线性回归模型对y的影响所构成的误差平方和。,它是由随机误差和其他未加控制的因素所引起的误差平方和。,回归方程的检验,回归方程的检验,构造检验统计量为,回归方程的检验,相应的检验法则为:,回归方程的检验,不全为零,但这并不意味着每个自变量,可能会起重要作用,而有的可能起的作用不大或者不起作用。,因此,在通过前面的线性回归模型的检验,,回归方程的检验,还有必要从线性回归模型中剔除那些次要的、,可有可无的自变量,只保留那些起重要作用的,自变量,以从新建立更为简练的线性回归模型,,使之有利于实际应用。,回归方程的检验,b、回归系数的检验,检验假设,下面的任务是选取检验统计量。,由(7),
7、所以,,回归系数的检验,则可以证明,注意:矩阵C的下标都是从0开始的!,回归系数的检验,回归系数的检验,如果回归方程的检验结果是显著的,而且各个回归系数的检验结果都为显著时,说明各个自变量对因变量的单纯影响都是显著的。若有回归系数经显著性检验为不显著时,说明其对应的自变量在回归方程中是不重要的,此时应该剔除。,回归系数的检验,在对变量进行剔除时,需要注意:,1)一次只能剔除一个不显著的回归系数对应的自变量,而且被剔除的自变量,应该是所有不显著的回归系数中的t值最小者。2)重新进行少一个自变量的多元线性回归分析。,回归系数的检验,前面说的是剔除变量,也会有变量因素考虑不周的情况,这时应该考虑引入
8、新的变量,那么如何引入新的变量?,对于模型的选择,目前普遍采用的是逐步回归法。也即,每引入一个变量,要进行逐个检验,将不显著的变量剔除。,详细情况请参阅韩中庚数学建模方法及其应用第九章。,回归系数的检验,c、复相关系数,对一个回归方程来说,即使回归显著,但还涉及到回归好坏程度的度量。对于一个因变量和一组自变量之间相关程度,则要采用的复相关系数来度量。研究一个变量与多个变量的线性相关称为复相关分析。,复相关系数定义为,复相关系数,但是复相关系数也有一些缺点。当采用的自变量,自变量的引入可能是多余的。,为了更准确地反映参数个数的影响,采用调整的,复相关系数,4、预测,如果经检验,认为线性回归方程是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 赵小艳
链接地址:https://www.31ppt.com/p-6410833.html