北邮最优化课件 10使用导数的最优化方法.ppt
《北邮最优化课件 10使用导数的最优化方法.ppt》由会员分享,可在线阅读,更多相关《北邮最优化课件 10使用导数的最优化方法.ppt(143页珍藏版)》请在三一办公上搜索。
1、帅天平北京邮电大学数学系Email:,Tel:62281308,Rm:主楼81410,使用导数的最优化方法,最优化理论与算法,第十章 使用导数的最优化方法,最速下降法牛顿法共轭梯度法拟牛顿法信赖域法,10.1最速下降法,10.1最速下降法,考虑无约束问题 min f(x),xRn(10.1.1)其中 f(x)具有一阶连续偏导数。,在处理这类问题时,一般策略是,希望从某一点出发,选择一个目标函数值下降最快的方向,沿此方向搜索以期尽快达到极小点,基于这一思想,Cauchy于1847年提出了最速下降法。这是无约束最优化中最简单的方法。,10.1最速下降法1,函数f(x)在点x处沿方向d的变化率可用方
2、向导数表示,当函数可微时有,方向导数,求函数f(x)在点x处下降最快的方向,归结为求,10.1最速下降法2,由上式知.当,时等号成立.故在点x处沿(1.5)所定义的方向变化率最小,即负梯度方向为最速下降方向.,注意:在不同的尺度下最速下降方向是不同的.,10.1最速下降法3,最速下降算法,最速下降算法的迭代公式为,10.1最速下降法4,算法描述,例1.1 用最速下降法求解下列问题,第一次迭代,目标函数f(x)在点x处的梯度,令搜索方向,令,在直线上的极小点,第二次迭代,令,得到,第三次迭代,令,此时,已经满足精度要求,得近似解,问题的最优解为x*=(0.0),算法的收敛性,证明:最速下降算法A
3、可表示为合成映射,A=MD,其中D(x)=(x,-f(x),是En En En的映射.,每给定一点x,经算法D作用,得到点x和在x处的负梯度(从x出发的方向d).算法M是En En En,映射.每给定一点x及方向d=-f(x),经M作用,即一维搜索,得到一个新点,在这一点,与前面的迭代点相比,具有较小的目标函数值,根据Th1.1,当 f(x)0时,M是闭映射.由于f(x)是连续可微实函数,故D连续,据推论2,A在x(f(x)0)处是闭的.,其次,当x时,d=-f(x)0,则f(x)T d0,因此对于yA(x),有f(y)f(x),由此知f(x)是关于A和的下降函数,因此根据Th8.2.1,算法
4、收敛,最后,按假设,x(k)含于紧集,在上述定理中,若令r=A/a,则,定理表明:条件数越小,收敛越快;条件数越大,收敛越慢.,最速下降法存在锯齿现象,容易证明,用最速下降法极小化目标函数时,相邻两个搜索方向是正交的.令,10.2 牛顿法,10.2.1 迭代格式,即,10.2 牛顿法,注意:牛顿法的迭代格式也可以从最速下降方向的角度来理解.,下求A度量下的最速下降方向,为此,考虑,10.2 牛顿法,下面介绍一下A度量及其意义下的最速下降方向.设A为对称正定矩阵,向量d的A范数定义为,由A,A-1对称正定,故存在对称平方根A1/2,A-1/2,使得,于是,10.2 牛顿法,去掉绝对值符号,有,根
5、据Schwartz不等式,得到,10.2 牛顿法,即,10.2 牛顿法,若取,则牛顿法的搜索方向实际上是关于向量椭球范数,10.2 牛顿法,10.2 牛顿法,例 用牛顿法求解下列问题,第1次迭代,10.2牛顿法,第2次迭代,10.2 牛顿法,第3次迭代,继续下去,第4次迭代,得到点列收敛于(1,0),此为最优解.,10.2 牛顿法,10.2.2 局部收敛性,10.2 牛顿法,证明:根据(10.2.2),牛顿算法映射定义为,下证(x)是关于解集合和算法A的下降函数.,10.2 牛顿法,于是可得,从而(x)是关于解集合和算法A的下降函数,10.2 牛顿法,10.2 牛顿法,当牛顿法收敛时,有下列关
6、系,特别的,对于二次凸函数,用牛顿法求解,经一次迭代即达到极小点.设有二次凸函数,其中A是对称正定矩阵,10.2 牛顿法,先用极值条件求解.令,得最优解,下用牛顿法解,任取一初始点x(1),定义:若一个算法用于求解严格二次凸函数极小值问题时从任意初始点出发,算法在有限次迭代后可到达函数的极小值点,称此算法具有二次终止性.,于是牛顿法具有二次终止性,10.2 牛顿法,注意,当初始点远离极小点时,牛顿法可能不收敛,阻尼牛顿法,基本思想:增加了沿牛顿方向的一维搜索.,迭代公式为,10.2 牛顿法,算法(阻尼牛顿法),10.2 牛顿法,10.2.3 修正牛顿法,例 用阻尼牛顿法求解下列问题,牛顿方向,
7、10.2 牛顿法,显然,用阻尼牛顿法不能产生新点,而点x(1)=(0,0)T并不是问题极小点.可见从x(1)出发,用阻尼牛顿法求不出问题的极小点,原因在于 Hessian 矩阵 2f(x(1)非正定,再令,10.2 牛顿法,考虑(10.2.2),记搜索方向d(k)=x-x(k),阻尼牛顿法所用搜索方向是上述方程的解,此处假设逆矩阵 存在,10.2 牛顿法,再沿此方向作一维搜索,10.2 牛顿法,算法 修正牛顿法,10.2 牛顿法,10.3共轭梯度法,1 共轭方向与扩张子空间定理,定义 设A是nn对称矩阵,若Rn 中的两个方向d 1 和d2满足(d 1)T Ad 2=0()则称这两个方向关于A共
8、轭,或称它们关于A正交.,10.3 共轭梯度法,几何意义,f(x)的等值面,由于,10.3共轭梯度法,设 x(1)是在某等值面上一点,此面在点x(1)处的法向量,又设d(1)是在该等值面在点x(1)处的一切向量.,即等值面上一点x(1)处的切向量与由这点指向极小点的向量关于A共轭.,10.3共轭梯度法,10.3共轭梯度法,10.3共轭梯度法,10.3共轭梯度法,用归纳法证之,为方便,用g j表示函数f(x)在x(j)处的梯度,即,10.3共轭梯度法,利用上式可以将 gm+2 和d(i)的内积写成,当i=m+1时,由一维搜索定义,知,当1im+1时,由归纳假设知,由二次函数梯度的表达式和点x(k
9、+1)的定义,有,10.3共轭梯度法,即,由10.3.8-11,知,10.3共轭梯度法,上述定理表明,对于二次凸函数,若沿一组共轭方向(非零向量)搜索,经有限步迭代必到达极小点.,2 线性共轭梯度法与二次终止性,Hesteness和Stiefel于1952年为解线性方程组而提出,基本思想:把共轭性与最速下降法相结合,利用已知点处的梯度构造一组共轭方向,并沿着这组方向进行搜索,求出目标函数的极小点,10.3共轭梯度法,先讨论对于二次凸函数的共轭梯度法,考虑问题,求解方法,10.3共轭梯度法,10.3共轭梯度法,10.3共轭梯度法,综上分析,在第一个搜索方向取负梯度的前提下,重复使用公式就能伴随计
10、算点的增加,构造出一组搜索方向.,10.3共轭梯度法,定理 对于正定二次函数(10.3.12),具有精确一维搜索的Fletcher-Reeves法在mn次一维搜索后即终止,并且对所有i(1 i m),下列关系成立:,证明:显然m1,下用归纳法(对i)证之.,10.3共轭梯度法,设对某个im,这些关系均成立,我们证明对于i+1也成立.先证2),由迭代公式两端左乘A,再加上b,得,其中 由式(10.3.17)确定,即,10.3共轭梯度法,考虑到(10.3.20)和(10.3.18),则,10.3共轭梯度法,当ji时,根据归纳假设,式(10.3.22)等号右端各项均为0,再证1),运用(10.3.1
11、8)和(10.3.20),则,当j=i时,把(10.3.19)代入上式第一个等号的右端,立得,10.3共轭梯度法,当ji时,由前面已经证明的结论和归纳假设,式中第2个等号右端显然为0,因此,最后证3),易知,综上,对i+1,上述三种关系成立,10.3共轭梯度法,注意,初始搜索方向选择最速下降方向十分重要,如果选择别的方向作为初始方向,其余方向均按FR方法构造,则极小化正定二次函数时,这样构造出来的一组方向并不能保证共轭性.,例 考虑下列问题,取初始点和初始搜索方向分别为,10.3共轭梯度法,显然,不是目标函数在 处的最速下降方向.,下面,我们用FR法构造两个搜索方向.,令,10.3共轭梯度法,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 北邮最优化课件 10使用导数的最优化方法 北邮最 优化 课件 10 使用 导数 方法

链接地址:https://www.31ppt.com/p-6380242.html