运筹学-非线性规划.ppt
《运筹学-非线性规划.ppt》由会员分享,可在线阅读,更多相关《运筹学-非线性规划.ppt(192页珍藏版)》请在三一办公上搜索。
1、高级运筹学,非线性规划,教材及参考书,指定教材:沈荣芳,运筹学高级教程(第二版),高等教育出版社,2008.8参考资料:1.韩伯棠,管理运筹学(第三版),高等教育出版社,2013.122.FREDERICK S.HILLIER GERALD J.LIEBERMAN,INTRODUCTION TO OPERATIONS RESEARCH,Ninth Edition,20103.吴祈宗,运筹学与最优化方法(第二版),机械工业出版社,20124.David G.Luenberger,Linear and Nonlinear Programming,Springer,2008,非线性规划,非线性规划
2、在科学管理和其他领域中,大量应用问题可以归结为线性规划问题,但是,也有另外一些问题,其目标函数和(或)约束条件很难用线性函数表达。如果目标函数和(或)约束条件中包含有自变量的非线性函数,则这样的规划问题就属于非线性规划。一般来说,求解非线性规划问题比线性规划问题困难得多。而且,也不象线性规划那样有单纯形法这一通用的方法,非线性规划目前还没有适合于各种问题的一般算法,这是需要深入研究的一个领域。,非线性规划研究核心问题:最优性条件(必要条件,充分条件,Lagrange乘子理论,灵敏性分析,对偶理论)迭代算法,解:设投资决策变量为,问题归结为总资金的限制条件下,极大化总收益和总投资之比,数学模型为
3、,例:投资决策问题某企业有n个项目可供选择投资,并且至少要对其中一个项目投资.已知该企业拥有总资金A元,投资于第i(i=1,2,n)个项目需要花资金ai 元,并预计收益为bi元,试选择最佳投资方案使得总收益和总投资之比最大.,一般地,非线性规划的数学模型为,其中 X称为可行域,可行域中的点 称为可行点,f(x)称为目标函数,当 时,非线性规划模型称为无约束问题;当 时,非线性规划模型称为有约束问题,使f(x)在X上取得最小值的点称为最优解,对应的目标函数值称为最优值,定义:如果目标函数或约束条件中至少有一个是非线性函数,则称这种规划为非线性规划问题。,为统一起见,称以下模型 min f(x)s
4、.t.gi(x)0 i=1,2,m(1)hj(x)=0 j=1,2,l为标准的非线性规划模型,其中f(x),gi(x),hj(x)中至少有一个是x的非线性函数.称gi(x)0为不等式约束,hj(x)=0为等式约束.,满足所有约束条件的x称为可行解,所有可行解构成的集合称为可行域。,例:考虑如下非线性规划问题:min f(x)=(x14)2+(y15)2 1/2 s.t.(x-8)2+(y-9)2 49 x 2,x 13 x+y 24,非线性规划的最优解未必在顶点处达到;非线性规划的最优解是一组同心圆最先与可行域相交的点,在可行域的边界上达到,二维非线性规划问题的图解分析,例:请考虑如下非线性规
5、划问题:min f(x)=(x8)2+(y8)2 s.t.(x-8)2+(y-9)2 49 x 2,x 13 x+y 24,非线性规划的最优解在可行域内部达到,可以看出,x2,x3,x4是局部最优解,且x3还是全局最优解,x1,x2,x3,x5是严格局部最优解,x4不是严格局部最优解.,一个全局最优解一定是局部最优解,反之不真。对求极小化非线性规划问题,如果目标函数为凸函数,可行域为凸集,则局部最优解一定为全局最优解。,与线性规划不同,非线性规划有局部最优解和全局最优解之分.,凸集定义非空集合D称为凸集,如果对于任意的x1,x2D及任意实数a,0a1,有ax1+(1a)x2D.,凸集的几何意义
6、:若一个集合是凸的,则该集合中任意两点的线段也必包含在此集合中。,凸集,不是凸集,凸集、凸函数和凸规划,(1)集合D=xEn|Axb,x0是凸集。,例:,定理:设D1,D2是En中的凸集,则,凸函数与凹函数定义:D为凸集,若对任意x1,x2D及任意实数a,0a1有f(ax1+(1a)x2)a f(x1)+(1a)f(x2)则称 f(x)为凸函数;若变为,称f(x)为严格凸函数。,若上式中的(),则称f(x)为凹函数/严格凹函数。,凸函数的特征是,曲线上任意两点的连线总是位于这两点间曲线的上方。,凸函数的判定(一阶条件):设 f(x)在凸集D上有一阶连续导数,则 f(x)是D上凸函数的充要条件是
7、对任意两点x,z D,x z,必有,如果上式严格成立,则是严格凸函数的充要条件。,几何意义:凸函数 f(x)在曲线上任何一点做曲线的切线,那么f(x)都在切线上方。,(二阶条件):设D是一个非空开凸集,设f在D上二次可微,则 f(x)是凸函数,当且仅当对所有xD,Hessian 矩阵 是半正定矩阵;,注意:Hesse矩阵在D中的每一点都是正定的,则f是严格凸的;可是,如果f是严格凸的,则Hesse矩阵在S中的每一点都是半正定的。,上述定理在检验函数的凹凸性是有效的,特别是当函数为二次函数时,Hesse矩阵不依赖点x,因此检验其凸性简化为检验一个单一矩阵的特征值的非负性。,例:检验函数f(x1,
8、x2)=2x1+6x2-2x12-3x22+4x1x2是凸的,凹的。或者两者都不是。,解:将f 改写为下面更方便的形式:,以下通过解下面的方程来计算特征值,方程的解为,凸规划定义:已知非线性规划 若可行域D是凸集,且f(x)是定义在D上的凸函数,则该非线性规划称为凸规划。,定理:对非线性规划,如果gj(x)(i=1,2,m)是En 上的凸函数,hj(x)(j=1,2,p)为线性函数,且f(x)为可行域D上的凸函数,则该非线性规划问题是凸规划。(作业1),定理1:设D为非空凸集,f(x)连续,考虑如下问题(1)如果 f 是凸函数,则局部最优解也是全局最优解;(2)如果 f 是严格凸函数,则 x*
9、为唯一的全局最优解。,定理(最优性条件):考虑凸规划,(1)x*是最优解的充要条件是对xX,有(2)若D是开集,x*是最优解的充要条件是,由定理结论(1)可知,如果某点x*是最优解,则对任意xD,向量x-x*与函数f在点x*处的梯度向量 所成的角度小于90。.,分析:题意是要求验证非线性规划的最优解x*满足,解:显然,目标函数是凸函数,且约束条件为线性函数,故此规划问题为凸规划.,点x*=(1,3)T是唯一最优解.由于f在点(1,3)的梯度为从图中可以看出,向量与 所成的角度小于等于90。.,而对点(0,0)T而言,显然不是最优解。因为,对任意非零点xD,有-3x1-10 x20,即向量(x1
10、-0,x2-0)T 与 所成角度大于90。,不满足最优性条件,原点不会是最优解。为使目标函数值下降,最好的局部下降方向是,思考题:如果某凸规划的可行域为D=x|x0,请讨论此凸规划问题的最优解的充要条件的形式。,无约束问题 一阶二阶必要和充分条件等式约束问题 Lagrange 乘子理论一般约束问题 一阶二阶必要和充分条件,最优性条件,二阶必要条件:设f:RnR1在点x*Rn 处二阶可微,如果x*是局部极小解,则f(x*)=0,且2f(x*)为半正定矩阵.,对无约束极值问题 min f(x),x Rn(1)一阶必要条件:设f:Rn R1在点x*Rn处可微,如果x*是局部极小点,则 f(x*)=0
11、.,定义:设 f:En E1在点x*处可微,若f(x*)=0,称x*函数f的驻点.,对无约束极值问题 min f(x),x Rn(1)定理(一阶必要条件):设f:Rn R1在点x*Rn处可微,如果x*是局部极小点,则 f(x*)=0.,推论:设f:Rn R1在点x*Rn处可微,f是Rn上的凸函数,如果f(x*)=0,则x*是无约束问题的全局最优解。,定理(二阶必要条件):设f:RnR1在点x*Rn 处二阶可微,如果x*是局部极小解,则f(x*)=0,且2f(x*)为半正定矩阵.,注意:该定理仅是必要的,而不是充分的。,定理(二阶充分条件I):设f:RnR1在点x*Rn 处二阶可微,如果f(x*
12、)=0,且2f(x*)为正定矩阵,则x*是无约束问题的严格局部极小解,证明:设 为 的最小特征值.利用二阶Taylor展式有,定理(二阶充分条件II):设f:EnE1在点x*En 的一个邻域 处二阶连续可微,如果 f 满足f(x*)=0,且2f(x)在 内半正定,则 x*是无约束问题的局部极小解.,思考题:考虑二次函数的无约束极小化问题,其中Q为n阶对称矩阵,b为n维列向量。,等式约束极值问题min f(x),x Rns.t.hi(x)=0,i=1,2,m,最优性条件,(必要条件):定理:设等式约束问题中函数f与hi(x)(i=1,m)是连续可微函数,x*为局部最优解且为正则点(即 线性无关,
13、则存在实数组,使得,如果函数f与hi(x)(i=1,m)是二次连续可微,则,注:等式约束问题的一阶必要条件的直观的几何意义:,注1:定理中给出的一阶必要条件仅当约束函数满足一定条件时才成立,该条件称为约束规格,注:该定理表明等式约束极值问题的极值点处的目标函数与约束函数梯度之间通过Lagrange乘子向量存在的关系,是Lagrange乘子法的出发点.,引入拉格朗日函数L(x,V),其中参数向量 称为拉格朗日乘子.,n+p个方程解n+p个未知量可得L的驻点,但是否驻点就是此非规划模型的极小解,还需要充分条件的判断;但是对于特殊的如二次规划问题,可以通过计算L对X的Hesse矩阵判定该驻点是极大值
14、点还是极小值点.,练习:求等式约束极值问题(书61-62页),(充分条件):定理:设等式约束问题中函数f与hi(x)(i=1,m)是二次连续可微函数,则x*是一个极小点。,1.含不等式约束的极值问题min f(x),x Rns.t.gi(x)0,i=1,2,m(3),最优性条件,设x*是问题(3)的可行解,约束条件gi(x)0可分为两类,x*点的起作用约束(active constraints):gi(x*)=0;x*点的不起作用约束(inactive constraints):gi(x*)0.,记点x*处所有起作用约束下标的集合为I(x*),即,如何找到在点x0处的可行方向?,如果x*为局部
15、最优解,则在该点处不可能存在可行下降方向.,几何意义说明如下:设A1,A2,A3是三个二维向量.,若A1,A2,A3不在任一条直线的同一侧,就无法找到使AiTp0(i=1,2,3)均满足的向量p.这时总可以适当缩小或放大各向量Ai的长度,使它们合成为零向量,即可找到不全为零的非负实数,使,若均位于某直线H的同一侧,则总可找到某一向量p,使AiTp0(i=1,2,3);,此处的(1)(2)两式称为Krush-Kuhn-Tucker条件,简称K-K-T条件;满足K-K-T条件的点称为K-K-T点。,K-K-T条件的几何意义,2.一般约束极值问题的KT条件min f(x),x Rns.t.gi(x)
16、0,i=1,2,m(3)hj(x)=0,j=1,2,p,最优性条件,最优性条件,前面的定理表明,如果局部最优解满足约束规格,则K-K-T条件成立;如果局部最优解不满足约束规格,则K-K-T条件可能不存在解.,Krush-Kuhn-Tucker条件是确定某点为最优解的必要条件,只要是最优解,且此处起作用约束的梯度线性无关,就一定满足K-K-T条件,但一般来说它并不是充分条件.因而,满足这个条件的点不一定是最优点.下面的定理说明,对于凸规划,Krush-Kuhn-Tucker条件不但是最优点存在的必要条件,同时也是充分条件.,定理:设f(x),gi(x)(i=1,2,m),hj(x)(j=1,2,
17、p)在x*处连续可微,且f(x),gi(x)(i=1,2,m)是凸函数,hj(x)是线性函数,若x*是非线性规划模型的K-K-T点,则x*是其全局极小点。,最优性条件,最优性条件,二次规划及其应用,二次规划是一个有二次目标函数和线性约束条件的优化问题,其数学模型如下:,二次规划的K-K-T条件,引入松弛变量S,使之成为等式S=b-AX,并分别设与条件AXb和X0对应的Lagrange乘子向量为u和v,则二次规划的K-K-T条件为,二次规划及其应用,由于二次规划是凸规划,故点X*是最优解的充要条件是存在u,v,S,X共同满足以上K-K-T条件.于是,原问题的最优解等价于找以上K-K-T条件的可行
18、解.,二次规划及其应用,至此,对二次规划的求解已经转化为线性互补问题,可以用互补转轴算法找出二次规划的K-K-T点。,例:写出二次规划的K-K-T条件:,称为互补松弛条件,即u1,s1不能同时为零,vi和xi不能同时为零。,二次规划及其应用,例:考虑二次规划问题,解:设与约束条件x1+x22,-x1+2x22,x10,x20对应的Lagrange乘子向量分别用u=(u1,u2)T和v=(v1,v2)T表示,,二次规划及其应用,于是,可得K-K-T条件如下:,二次规划及其应用,线性互补问题,如何解决线性互补问题?,线性互补问题,线性互补问题,线性互补问题,1,0,0,0,0,1,0,0,0,0,
19、1,0,0,0,0,1,0,0,-1,-1,0,0,1,-2,1,-1,-2,2,1,2,2,-4,-1,2,2,-2,-6,-1,-1,-1,(),线性互补问题,1,0,0,0,0,1,0,0,0,0,1,0,-1,-1,-1,-1,1,1,0,1,2,2,3,2,-1,-3,-4,-2,5,6,6,-4,0,8,8,4,6,0,0,1,(),线性互补问题,1,0,0,0,0,1,0,0,-5/6,-1,1/6,-2/3,-1/6,0,-1/6,-1/3,1,1,0,1,-1/2,-1,1/2,0,7/3,1,-2/3,2/3,0,0,1,0,0,14/3,4,2/3,10/3,0,0,1,
20、(),线性互补问题,3/7,-3/7,2/7,0,1,0,0,-5/14,-3/7,-1/14,-3/14,-2/7,-3/14,-11/14,5/14,1/7,1,0,0,1,0,0,14/3,4,2/3,10/3,0,0,1,(),-2/7,-9/14,-1/14,1/14,3/7,4/7,2/7,5/7,0,0,0,线性互补问题,对于可微函数 f(x)来说,为了求最优解,可以令梯度由此求得驻点,然后再利用充分条件进行判别。但是,对于一般的n元函数 f(x)来说,令 得到的常是一个非线性方程组,求解相当困难;此外,很多实际问题往往很难求出或根本求不出目标函数对各自变量的偏导数,从而使得一阶
21、必要条件很难应用。因此,除个别情形外,一般都是采用迭代法而不是从令 求解的。,搜索算法概述,迭代算法的基本思想:首先,确定目标函数f(x)的极小点 x*的一个初始估计点 x(0),然后按照一定的迭代规则(即所谓算法),先找到一个比 x(0)更好的点 x(1),即 f(x(1)f(x(0),再找比 x(1)更好的点x(2),如此继续下去,得到点列x(k),k=1,2,使得当点列x(k)是有穷点列时,其最后一个点是非线性规划问题的最优解;当点列x(k)是无穷点列时,它有极限点 x*,且极限点 x*就是非线性规划问题的最优解.,下降迭代算法的一般迭代格式:,使用迭代算法求解非线性规划问题的关键在于如
22、何构造每一轮的搜索方向和确定适当的步长!,(1)选取某一初始迭代点 x(0);,(2)确定搜索方向:若已得一迭代点 x(k),且 x(k)不是极小点,就从 x(k)出发确定一搜索方向 p(k),沿这一方向找到使目标函数值下降的点.,(3)确定步长:沿 p(k)方向前进一个步长,得到下一迭代点 xk+1),即在由点 x(k)出发的射线 x=x(k)+tp(k)(t0),选定步长 t=tk,得到下一迭代点 x(k+1)=x(k)+tkp(k),使得 f(x(k+1)f(x(k).,(4)检验新的迭代点是否为要求的极小点或近似极小点,如果满足要求,迭代停止;否则令 k=k+1,转步骤(2)继续迭代.
23、,当已知迭代点和下降方向时,要确定适当的步长,按照对步长选取的不同原则,可分为两种类型:(1)最优一维搜索:用一定方法求得步长 tk,使目标函数 f 从当前点 x(k)出发沿方向 p(k)取得最优值,即,即求步长 tk,使得,(2)可接受一维搜索:即寻找步长,精确一维搜索的重要性质:,图:精确一维搜索时搜索方向与最优点处函数等值面相切,常用的终止迭代准则有:(1)根据相继两次迭代结果的绝对误差:(2)根据相继两次迭代结果的相对误差:(3)根据函数梯度的模足够小:,算法的收敛性常同初始点选择有关。(1)当点x0充分接近于最优解x*时,由某方法产生的点列才收敛于x*,则该方法叫做具有局部收敛性;(
24、2)对任意初始点x0,由某方法产生的点列都收敛到x*,则该方法叫做具有全局收敛性;(3)若某方法经过有限轮迭代就可达到目标函数为二次函数的无约束非线性规划模型的最优解,此方法叫做具有二次收敛性.,通常,一个非线性规划算法还要求具有收敛性:设由该算法产生的迭代点列为,当点列为有穷点列时,其最后一个点是最优解,当点列为无穷点列时,在某种模的意义下它收敛于问题的最优解,即,各种迭代算法的迭代过程是相同的,无论是求解无约束极值问题或是求解约束极值问题,在确定最优步长的过程中往往都会遇到一元函数极值问题,以下将介绍一元函数求极值的直接方法一维搜索法,一维搜索法,对一维极小化问题,设 a,b是目标函数 的
25、单峰区间。其本思路是:找出已知包含最优解点的单峰区间,通过迭代逐渐缩小单峰区间的长度以达到任何所需的精度来近似确定最优点的位置。,一维搜索法主要用于严格单峰函数的一元函数。,一个区间是某函数的单峰区间意味着该区间中函数只有一个极小值.,在单峰区间上的函数,即单峰函数如下图(1)所示:,单峰函数的重要性质通过单峰区间内相异两点函数值的计算,可以划定极小值点所在位置。,设 a,b是目标函数 的单峰区间。以下介绍的两种方法不是直接找出最优点,而是通过不断缩短单峰区间长度来搜索并得到一维极小化问题的两种近似求解方法二分法、黄金分割法与斐波那契法。,对一维极小化问题,设已知单峰函数 的峰点t*(最小点)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹学 非线性 规划

链接地址:https://www.31ppt.com/p-6028268.html