欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    优控制的计算方法.ppt

    • 资源ID:5224196       资源大小:863.50KB        全文页数:102页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    优控制的计算方法.ppt

    第七章 最优控制的计算方法,本章主要内容7.1 直接法 7.2 间接法 7.3 小结,返回主目录,在前面讨论变分法、极小值原理和动态规划时,我们列举了一些例子。为了易于说明问题,这些例子都是非常简单的,可以用手算来解决问题。但是在实际工作中所遇到的最优控制问题,一般都是很复杂的,必须用计算机求解。,因此,最优控制的计算方法就变得十分重要了。这方面的内容十分丰富,由于篇幅所限,我们只介绍几种典型的算法。,由极小值原理可知,最优控制问题的解必须满足以下几个条件,(iii)边界条件(包括横截条件),最优控制的计算方法一般是先求出满足上面三个条件中某两个的解,然后用合适的迭代计算形式逐次改变这个解,以达到满足剩下的另一个条件的解(即最优解)。,通常把最优控制的计算方法分成两类:直接法和间接法。,直接法,它的特点是,在每一步迭代中,不一定要满足 取极小的必要条件,而是逐步改善它,在迭代终了使它满足这个必要条件,而且,积分状态方程是从 到,积分协态方程是从 到,这样就避免了去寻找缺少的协态初值 的困难。常用的直接法有梯度法,二阶梯度法,共轭梯度法。,间接法,它的特点是,在每一步迭代中都要满足 取极小的必要条件,而且要同时积分状态方程和协态方程,两种方程的积分都从 到 或从 到。常用的间接法有边界迭代法和拟线性化法。,7.1 直接法,(一)梯度法,这是一种直接方法,应用比较广泛。它的特点是:先猜测任意一个控制函数,它可能并不满足 取极小的必要条件,然后用迭代算法根据 梯度减小的方向来改善,使它最后满足必要条件。,计算步骤如下:,1,先猜测 中的一个控制向量,是迭代步数,初始时。的决定要凭工程经验,猜得合理,计算收敛得就快。,2,在第 步,以估计值 和给定的初始条件,从 到 顺向积分状态方程,求出状态向量。,3,用、和横截条件求得的终端值,从 到 反向积分协态方程,求出协态向量。,4,5、,是一个步长因子,它是待定的数。选择 使指标达到极小。这是一维寻优问题,有很多现成的优化方法可用。如分数法,0.618法,抛物线法,立方近似法等。(7-3)表明迭代是沿着梯度的负方向进行的。,6、,例7-1,解,因 自由,由横截条件得,、选初始估计。,代入初始条件:,确定积分常数,3将 代入协态方程(7-9),且由边界条件 从t=1倒向积分可得,5。这里选步长因子。如此继续下去,直至指标函数随迭代变化很小为止。,4由,图7-1用梯度法寻找最优控制 图7-2 最优状态的求解,图7-1和图7-2表示了控制和状态 的初始值和第一次迭代值,可以看到第一次迭代 就几乎收敛到最优值,与最优值还有差异,而且一般说来愈接近最优值收敛愈慢,梯度法应用得比较多,它的优点是:(1)简单,编制程序容易;(2)计算稳定可靠。缺点是:(1)在接近最优解时,迭代收敛很慢,为改善 收敛性可用共轭梯度法和二阶变分法等;(2)不能区分局部极小和全局极小;(3)对控制变量受约束,终端状态受约束的情 况不能直接处理。对于这种有约束的情况可用约束梯度法或惩罚函数法加以处理。,显然,当满足约束时,中后两项为零。当不满足约束时,后两项将使 增大,故称为惩罚函数。在迭代过程中,逐次增大 和。显然当 和 很大时,所求得的 的无约束最优控制近似于 的有约束最优控制。,(二)共轭梯度法,用共轭梯度法寻找最优控制时是沿着所谓共轭梯度向量的方向进行的。为了说明共轭梯度的意义,我们先从求函数极值问题的共轭梯度法开始,再推广到求泛函极值问题。,1求函数极值的共轭梯度法,定义,则称 和 是 共轭的。(单位阵)时,共轭就变为通常的正交。,与梯度法不同处仅在于用共轭梯度 代替负梯度。问题是如何产生共轭梯度方向。,令,即初始时共轭梯度与梯度方向相反、大小相等。以后的共轭梯度可如下递归产生:,将(7-26)代入(7-27),得,用(7-28)式计算 是不方便的,因为要用到二阶导数阵。由(7-22)和(7-23)知,分别为 的第 个和第 个分量,右端表示由 的第 行第 列元素构成的矩阵。计算这个二阶导数阵非常困难。为此,有必要推导不用 来计算 的公式。,(7-29),性质1,若 是 空间中彼此 共轭的向量,则它们是线性独立的。,在这个推导中要用到共轭梯度的下列性质:,证明:,因为 正定,上式对每一个 成立,所以必须有 与假设矛盾,这说明 是线性独立的,它们构成了 空间中的一组基向量。,其中,可这样来求:作内积,性质2,式中,。(7-34)说明,在 处函数 的梯度 与前一步的寻找方向 必正交。,若不然,不妨先设。再设,即 是最优步长。在 附近选一个,将 在 处展开,保留一阶项后,有,证明:,(7-35),这与 为极小相矛盾。,若设 则可取,同样得出矛盾,于是必有(7-34)成立。,性质3,(7-36)说明,在 处的梯度 与以前各步的共轭梯度寻找方向都正交。,证明,重复使用,由性质2知 再由 与是 共轭的定义可知(7-42)右端第二项也为零,,因此(7-36)得证。,但 是线性无关的,它们构成 中一组基,与所有基正交,而 中只有 个基,故。这说明 处的梯度为零,即 为二次函数 的极小点。,如果一个算法能在有限步内求出二次函数的极小点,就称这个算法具有二阶收敛性或有限步收敛性。,由此可见,在 空间中,对二次函数 用(7-25)式所示的共轭梯度法寻优,迭代至多 步就可达到极小点。,性质4,若,则,(7-44),证:,下面根据这四个性质来推出 的一个简单的计算公式。在(7-41)中令,可导出,再利用(7-26)式,可得,用(7-46)计算,只用到 在 和 两处的梯度,因此非常方便。,(7-46)对二次函数是精确的,对非二次函数,它只是一个近似公式,将共轭梯度法求 的极小解的算式归纳如下:,(4)递推逼近极值点解 用一维寻优决定。,(2)算共轭系数,,(1)算梯度,(3)算共轭梯度,2、用共轭梯度法解最优控制问题,前面已说过,最优控制计算的直接法是用迭代方法逐步改善控制量,使它最后满足哈密顿函数 取极小的必要条件。,除了这些以外,其它在形式上与求函数极值的共轭梯度法一样。,共轭梯度法求最优控制步骤为(1)(2)(3),设已求出第K步估计的控制函数 可任选。,以 为初值,从 到 积分状态方程,得出状态轨迹。,以 为终值,从 到 反向积分协态方程,求得协态轨迹。,(4)(5)(6),计算梯度向量,(7)(8),例7-2,解,(1),积分可得,梯度向量,共轭梯度。,(2),时,用一维寻优来决定。将 代入状态方程(7-54)、(7-55)和协态方程(7-62)、(7-63),得,积分得,由(7-62)式,积分上式可得,共轭系数,共轭梯度,(3),时,控制量为,同以上步骤,将 代入状态方程和协态方程,求出,所以这个例子只要两步迭代即可得到最优解。一般说来,共轭梯度法比梯度法收敛快,但接近最优解后收敛性仍是较慢的。一个补救办法是重新启动,即找出几个共轭梯度方向 后,令,再用(7-50)重新迭代,寻找共轭梯度方向。,7.2 间接法,(一)边界迭代法,这个方法的特点是逐步改善对缺少的初始条件的估计,以满足规定的边界条件。它的原理如下。,因 估计得不一定准确,故 一般不等于给定值.将(7-68)在 处展开为台劳级数,保留一次项,得,其中,是迭代次数,是松驰因子,可改善收敛性,收敛到最后时,将 取为1。在第 步,用 作为估值,积分正则方程,求得,,计算步骤如下(1)(2),由 解出,代入状态和协态方程。,设已求出 的第 步估计值 和给定的合在一起,从 积分正则方程,求出 抽出 个要求的分量的终值,若,停止计算,否则进行下一步。,(3)(4)(5),按(7-73)计算。,令 回到步骤2。,求敏感矩阵,这种方法的缺点是:(1)(2)(3),第一次估计 很困难,,终端值对 非常敏感时,与 相差很大,线性关系(7-70)不成立。,敏感矩阵难于确定得很精确,对它求逆的运算也容易引入误差。,例7-3,解,因终端,自由,故,设 的初始估计值为零,迭代结果见表7-1。可见在第7次迭代时,、已为零,满足了边界条件。,表7-1,这个方法的特点是用迭代算法来改善对正则方程解的估计,使它逐步逼近正则方程的精确解。和前面一样,将正则方程写成。,(二)拟线性化法,设已知 个初始条件 和 个终端条件,拟线性化法将非线性两点边值问题转化为线性两点边值问题,因此变得容易求解。,设在迭代的第 步获得近似解,将正则方程(7-78)在展开,保留一次项,可得到 步的近似解,有,(7-80),满足给定边界条件,(7-80)可写成下面的线性非齐次方程,例7-4,解,根据(7-85)、(7-86)可得,于是线性化后的正则方程(7-84)中的系数阵 和驱动项 都已确定,解这个非齐次时变微分方程,并用边界条件 和 以决定通解中的未定常数,就完全确定了,这就完成了一次迭代。当满足(7-87)式时,停止计算,求解结束。,7.3 小结,1,最优控制的计算方法可分为直接法和间接法两大类。直接法中我们列举了梯度法和共轭梯度法。间接法中列举了边界迭代法和拟线性化法。,2,直接法的特点是:在每步迭代中并不满足哈密顿函数 取极小的必要条件,只是在迭代终了才满足这个条件;另外积分状态方程时是从,而积分协态方程时是从。由于状态和协态的稳定性是相反的,所以这种双向积分,可使最优化过程非常稳定。这可举一简单例子来说明。,例 7-5,解:,(7-100),设,则从,收敛,而 发散。若从,则 就变为收敛了。,3,梯度法是利用梯度信息 来不断改善对控制函数 的估计,最后满足 的必要条件。这是一种简单又稳定的算法,几乎对所有的 的初始估计都有很好的收敛性。但在远离最优解时收敛速度快,在接近最优解时收敛得慢(原因在于)。,共轭梯度法比梯度法稍微复杂些,但收敛速度也快些。同样,在接近最优解时,共轭梯度法收敛速度变慢。要加速接近最优解时的收敛速度可用二阶变分法,不过这种方法的计算复杂程度要增加很多。,4,间接法的特点是:在每步迭代中都满足 取极小的必要条件;另外,它同时从一个方向(从 或从)积分状态和协态方程。,由于状态和协态的稳定性相反,这就使得对边界条件的初始估计非常敏感。尤其当终端时刻远远大于系统的最小时间常数时,收敛性可能很差。,5,边界迭代法是在每步迭代中不断改善对缺少的初始条件的估计去满足给定的终端条件(也可改善对缺少的终端条件的估计去满足给定的初始条件),这种方法对初始估计(如)是非常敏感的,只有在能获得良好的初始估计时,才建议使用这种方法。,拟线性化法将非线性正则方程围绕上一步的估计解轨迹 线性化,递推解出 最后满足正则方程。这种方法对初始估计 可能不如边界迭代法对初始估计 那么敏感。并且求线性微分方程的解也比较容易。,

    注意事项

    本文(优控制的计算方法.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开