最优控制的计算方法.ppt
《最优控制的计算方法.ppt》由会员分享,可在线阅读,更多相关《最优控制的计算方法.ppt(46页珍藏版)》请在三一办公上搜索。
1、1,最优控制的计算方法,一、直接法,二、间接法,2,最优控制的计算方法,在前面讨论变分法、极小值原理和动态规划时,我们列举了一些例子。为了易于说明问题,这些例子都是非常简单的,可以用手算来解决问题。但是在实际工作中所遇到的最优控制问题,一般都是很复杂的,必须用计算机求解。,因此,最优控制的计算方法就变得十分重要了。这方面的内容十分丰富,由于篇幅所限,我们只介绍几种典型的算法。,3,最优控制的计算方法,直接法的特点是,在每一步迭代中,U(t)不一定要满足H 取极小的必要条件,而是逐步改善它,在迭代终了使它满足这个必要条件,而且,积分状态方程是从t0到tf,积分协态方程是从tf到t0,这样就避免了
2、去寻找缺少的协态初值(t0)的困难。常用的直接法有梯度法,二阶梯度法,共轭梯度法。,间接法的特点是,在每一步迭代中都要满足H取极小的必要条件,而且要同时积分状态方程和协态方程,两种方程的积分都从从t0到tf或从tf到t0。常用的间接法有边界迭代法和拟线性化法。,4,最优控制的计算方法,(U无约束),(ii)哈密顿函数H取极小的必要条件,或,由极小值原理可知,最优控制问题的解必须满足以下几个条件:,(iii)边界条件(包括横截条件),(i)正则方程,(U有约束),最优控制的计算方法一般是先求出满足上面三个条件中某两个的解,然后用合适的迭代计算形式逐次改变这个解,以达到满足剩下的另一个条件的解(即
3、最优解)。,5,一、直接法,1、梯度法,这是一种直接方法,应用比较广泛。它的特点是:先猜测任意一个控制函数U(t),它可能并不满足H 取极小的必要条件,然后用迭代算法根据H 梯度减小的方向来改善U(t),使它最后满足必要条件。,计算步骤如下:,1、先猜测t0,tf中的一个控制向量UK(t)=U0(t),K是迭代步数,初始时K=0。U0 的决定要凭工程经验,猜得合理,计算收敛得就快,2、在第K步,以估计值UK和给定的初始条件X(t0),从t0到tf 顺向积分状态方程,求出状态向量XK(t)。,6,1、梯度法,3、用UK(t)、XK(t)和横截条件求得的终端值(tf),从tf到t0反向积分协态方程
4、,求出协态向量K(tf)。,表示在、处取值。当这些量非最优值时,。,4、计算哈密顿函数H对U的梯度向量,7,1、梯度法,是一个步长因子,它是待定的数。选择 使指标达到极小。这是一维寻优问题,有很多现成的优化方法可用。如分数法,0.618法,抛物线法,立方近似法等。上式表明迭代是沿着梯度的负方向进行的。,5、修正控制向量,6、计算是否满足下列指标,是指定小量,若满足则停止计算,否则,令,转步骤2。另一停止计算的标准是,8,1、梯度法,例、考虑下面的一阶非线性状态方程,用梯度法寻找最优控制使下面的指标最小,因x(1)自由,由横截条件得,解:哈密顿函数为,协态方程为,9,1、梯度法,1、选初始估计。
5、,代入初始条件:,确定积分常数,2、将 代入状态方程可得,积分上式可得,可得,10,4、由,得,1、梯度法,3、将 代入协态方程,且由边界条件 从t=1倒向积分可得,这里选步长因子。如此继续下去,直至指标函数随迭代变化很小为止。,5、,11,1、梯度法,右图表示了控制和状态的初始值和第一次迭代值,可以看到第一次迭代 就几乎收敛到最优值,与最优值还有差异,而且一般说来愈接近最优值收敛愈慢。,图b 最优状态的求解,图a 用梯度法寻找最优控制,12,1、梯度法,梯度法应用得比较多,它的优点是:(1)简单,编制程序容易;(2)计算稳定可靠。缺点是:(1)在接近最优解时,迭代收敛很慢,为改善收敛性可用共
6、轭梯度法和二阶变分法等;(2)不能区分局部极小和全局极小;(3)对控制变量受约束,终端状态受约束的情 况不能直接处理。对于这种有约束的情况可用约束梯度法或惩罚函数法加以处理。,13,2、共轭梯度法,用共轭梯度法寻找最优控制时是沿着所谓共轭梯度向量的方向进行的。为了说明共轭梯度的意义,我们先从求函数极值问题的共轭梯度法开始,再推广到求泛函极值问题。,(1)求函数极值的共轭梯度法,其中,,C为常数,Q为正定阵。,要求寻找X使F(X)取极值。,设F(X)是定义在Rn空间中的二次指标函数,是X和QX的内积。,14,2、共轭梯度法,则称X和Y是Q共轭的。Q=I(单位阵)时,共轭就变为通常的正交。,定义:
7、若Rn中两个向量X和Y满足,设向量,是两两Q共轭的,以 为寻找方向,可得共轭梯度法的迭代寻优程序:,与梯度法不同处仅在于用共轭梯度PK代替负梯度gK=(F/X)K。问题是如何产生共轭梯度方向。,15,2、共轭梯度法,值由 和 对 共轭的关系来确定,即,令,即初始时共轭梯度与梯度方向相反、大小相等。以后的共轭梯度可如下递归产生:,于是,得,称为共轭系数。,故,16,2、共轭梯度法,K的计算是不方便的,因为要用到二阶导数阵Q。而,分别为X 的第i个和第j个分量,右端表示由Q 的第i行第j列元素构成的矩阵。计算这个二阶导数阵非常困难。为此,有必要推导不用Q来计算K 的公式。,通过推导(略),可得,上
8、式计算K,只用到F(X)在XK和XK1两处的梯度,因此非常方便。上式对二次函数是精确的,对非二次函数,它只是一个近似公式。,17,2、共轭梯度法,将共轭梯度法求F(X)的极小解的算式归纳如下:,(d)递推逼近极值点解,(b)计算共轭系数,(a)计算梯度,(c)计算共轭梯度,K用一维寻优决定。,18,2、共轭梯度法,(2)用共轭梯度法解最优控制问题,求解最优控制问题的直接法是用迭代方法逐步改善控制量u(t),使它最后满足哈密顿函数H 取极小的必要条件,故梯度向量为,除了这些以外,其它在形式上与求函数极值的共轭梯度法一样。,这里梯度向量 是时间的函数,向量时间函数的内积定义为,19,2、共轭梯度法
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最优 控制 计算方法
链接地址:https://www.31ppt.com/p-5749283.html