《优控制理论》PPT课件.ppt
《《优控制理论》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《优控制理论》PPT课件.ppt(120页珍藏版)》请在三一办公上搜索。
1、最优控制理论,主讲:罗文广,授课内容,1、最优控制概述2、最优控制中的变分法3、极小值原理及其应用4、动态规划5、线性最优状态调节器6、线性最优输出调节器与跟踪系统,考核方式,一、小设计论文(30)1、选题:每人自选一个与最优控制相关的实际小问题,在小组讨论中初步确定选题。小组45人,自行成立。2、解题:通过建模、编程和仿真,获得问题的最优解;或者通过制作实物、编程,对对象实现最优控制。3、论文:通过以上工作,完成一篇小论文。论文撰写格式按照广西工学院学报的格式要求。4、报告和答辩:每人约用10分钟对所做选题进行汇报和答辩5、时间要求:题目确定:第6周,个人上交自拟的题目。答辩时间:12周以后
2、。最后完成时间:本学期最后一周。6、上交材料:(1)编制的程序、仿真结果,或制作的实物;(2)小论文。由班长统一上交(含统计表)二、考试(70)开卷方式,第1章 导论 1.1 引言,一、现代控制理论 现代控制理论是研究系统状态的控制和观测的理论,主要包括5个方面:1、线性系统理论:研究线性系统的性质,能观性、能控性、稳定性等。以状态空间法为主要工具研究多变量线性系统的理论。2、系统辨识:根据输入、输出观测确定系统数学模型。3、最优控制:寻找最优控制向量u(t)。根据给定的目标函数和约束条件,寻求最优的控制规律的问题。4、最佳滤波(卡尔曼滤波、最优估计):存在噪声情况下,如何根据输入、输出估计状
3、态变量。5、适应控制:利用辨识系统动态特性的方法随时调整控制规律以实现最优控制,即在参数扰动情况下,控制器的设计问题。把鲁棒控制、预测控制均纳入到现代控制理论的范畴。,第1章 导论 1.1 引言,二、最优控制的发展简史先期工作:1948年,维纳(N.Wiener)发表控制论,引进了信息、反馈和控制等重要概念,奠定了控制论(Cybernetics)的基础。并提出了相对于某一性能指标进行最优设计的概念。1950年,米顿纳尔(Medona1)首先将这个概念用于研究继电器系统在单位阶跃作用下的过渡过程的时间最短最优控制问题。1954年,钱学森编著工程控制论(上下册),作者系统地揭示了控制论对自动化、航
4、空、航天、电子通信等科学技术的意义和重大影响。其中“最优开关曲线”等素材,直接促进了最优控制理论的形成和发展。,第1章 导论 1.1 引言,理论形成阶段:自动控制联合会(IFAC)第一届世界大会于1960年召开,卡尔曼(Kalman)、贝尔曼(R.Bellman)和庞特里亚金(Pontryagin)分别在会上作了“控制系统的一般理论”、“动态规划”和“最优控制理论”的报告,宣告了最优控制理论的诞生,人们也称这三个工作是现代控制理论的三个里程碑。19531957年,贝尔曼(R.E.Bellman)创立“动态规划”原理。为了解决多阶段决策过程逐步创立的,依据最优化原理,用一组基本的递推关系式使过程
5、连续地最优转移。“动态规划”对于研究最优控制理论的重要性,表现于可得出离散时间系统的理论结果和迭代算法。,第1章 导论,19561958年,庞特里亚金创立“极小值原理”。它是最优控制理论的主要组成部分和该理论发展史上的一个里程碑。对于“最大值原理”,由于放宽了有关条件的使得许多古典变分法和动态规划方法无法解决的工程技术问题得到解决,所以它是解决最优控制问题的一种最普遍的有效的方法。同时,庞特里亚金在最优过程的数学理论著作中已经把最优控制理论初步形成了一个完整的体系。此外,构成最优控制理论及现代最优化技术理论基础的代表性工作,还有不等式约束条件下的非线性最优必要条件(库恩图克定理)以及卡尔曼的关
6、于随机控制系统最优滤波器等。,第1章 导论 1.2 最优控制问题,一、问题的描述已知被控系统的状态方程以及给定的初始状态规定的目标集为S(例如)求一容许控制,使系统在该控制的作用下由初态出发,在某个大于t0 的终端时刻tf 达到目标集S上,并使性能指标 达到最小。,第1章 导论 1.2 最优控制问题,从以上最优控制问题的描述中可见:1、有一个被控对象(系统数学模型)它通常由常微分方程组描述的动态模型来表征,即 其初态一般是给定的,即2、有一目标集及边界条件 目标集:在控制u的作用下,把被控对象的初态x0在某个终端时刻转移到某个终端状态x(tf)。x(tf)通常受几何约束。例如考虑它是一个点集,
7、在约束条件 下 目标集为,第1章 导论 1.2 最优控制问题,边界条件:初始状态:初始时刻t0和x(t0),通常是已知的。末端状态:末端时刻tf和x(tf),通常是未知的。3、容许控制集控制向量u的各个分量ui往往是具有不同物理属性的控制量。在实际控制问题中,大多数控制量受客观条件的限制只能取值于一定的范围,将控制约束条件的点集称为控制域,则将在闭区间t0,tf上有定义,且在控制域内取值的每个控制函数u(t)称为容许控制,记做,第1章 导论 1.2 最优控制问题,4、性能指标 为了能在各种控制律中寻找到效果最好的控制,需要建立一种评价控制效果好坏或控制品质优劣的性能指标函数。又称代价(成本,目
8、标)函数或泛函,记做,它是一个依赖于控制的有限实数,一般的表达式为:该表达式包括了依赖于终端时刻tf和终端状态x(tf)的末值型项,以及依赖于这个控制过程的积分型项。因此,可将最优控制问题的性能指标分为:混合型、末值型和积分型。不同的控制问题,应取不同的性能指标:,第1章 导论 1.2 最优控制问题,(1)积分型性能指标:a.最短时间控制:b.最少燃烧控制:c.最小能量控制:(2)末值型性能指标(3)混合型性能指标,第1章 导论 1.2 最优控制问题,二、对最优控制问题的进一步说明 如果最优控制问题有解,即:使 达到极小值的控制函数存在,记为,称为最优控制;相应的状态轨迹x*(t)称为最优轨迹
9、;性能指标 称为最优性能指标。三、举例 月球上的软着陆问题(最小燃耗问题),飞船靠其发动机产生一与月球重力方向相反的推力u(t),以使飞船在月球表面实现软着陆,要寻求发动机推力的最优控制规律,以便使燃料的消耗为最少。,第1章 导论 1.2 最优控制问题,设飞船质量为m(t),高度为h(t),垂直速度为v(t),发动机推力为u(t),月球表面的重力加速度为常数g。设不带燃料的飞船质量为M,初始燃料的总质量为F初始高度为h0,初始的垂直速度为v0,那么飞船的运动方程式可以表示为:,初始条件,终端条件,性能指标是使燃料消耗为最小,即,约束条件,达到最大值,第2章 最优控制中的变分法,变分法是求解泛函
10、极值的一种经典方法,因此也是研究最优控制问题的一种重要工具。本章的中心内容是介绍经典变分法的基本原理,并加以推广,用以求解某些最优控制问题。尽管经典变分法有其局限性,但本章所涉及的有关内容,在最优控制理论中是最基本的东西。,第2章 最优控制中的变分法 2.1 泛函与变分,(1)泛函定义:给定函数空间U,若对于任何函数x(t)U,总有一个确定的值J(x(t)与之对应,则称J(x(t)是函数x(t)的泛函。这里x(t)常被称做宗量。从定义中可以发现,泛函是变量与函数之间的关系,常称之为“函数的函数”。例:是一个泛函,当x(t)=t时,J=0.5;而不定积分 不是一个泛函。,第2章 最优控制中的变分
11、法 2.1 泛函与变分,函数:对于变量t的某一变域中的每一个值,x都有一个值与之相对应,那么变量x称作变量t的函数。记为:x=f(t)t称为函数的自变量自变量的微分:dt=t-t0(增量足够小时),泛函:对于某一类函数x()中的每一个函数x(t),变量J都有一个值与之相对应,那么变量J称作依赖于函数x(t)的泛函。记为:J=J x(t)x(t)称为泛函的宗量宗量的变分:,函数与泛函比较:,第2章 最优控制中的变分法 2.1 泛函与变分,关于变分,可将泛函的变分概念看成是函数微分概念的推广,其作用如同微分在函数中的作用。(2)变分定义:若连续泛函J(x(t)的增量可表示为 其中第一项是 的连续线
12、性泛函,第二项是关于 的高阶无穷小,则称上式第一项为泛函的变分,记做 如同函数的微分是函数增量的线性主部一样,泛函的变分就是泛函增量的线性主部。,第2章 最优控制中的变分法 2.1 泛函与变分,显然,直接用定义求泛函的变分 很困难。因此必须寻求一种计算方法。(3)计算泛函变分的公式定理21 如果连续泛函J(x(t)的变分存在,则证明:(见P12)例子:(见P12)为了确定泛函的极小值或极大值,需要考察泛函的二次变分:(4)二次变分定义:P12(5)求解二次变分定理:P12,第2章 最优控制中的变分法 2.1 泛函与变分,例:求下列泛函的变分,第2章 最优控制中的变分法 2.1 泛函与变分,(6
13、)泛函极值定义:定义215对于与x0(t)接近的曲线x(t),泛函Jx(t)的增量(7)泛函极值的必要条件:定理23(8)泛函极小值的充要条件:定理24(9)变分引理:定理25,则泛函Jx(t)在曲线x0(t)上达到极值。,泛函极值定理:若可微泛函Jx(t)在x0(t)上达到极值,则在x=x0(t)上的变分为零。即,第2章 最优控制中的变分法 2.2 欧拉方程,主要讨论:(1)无约束和有约束情况下,泛函极值存在的必要条件欧拉方程;(2)泛函极小值的充分条件勒让德条件。2.2.1 无约束泛函极值的必要条件这里所提到的约束或无约束是指状态x(t)的约束问题。无约束:指求解最优控制解时状态无约束,即
14、无状态方程的约束。1、所定义的问题问题2-1:无约束泛函极值问题为,问题为:确定一个函数x(t),使Jx(t)达到极小(大)值。这条能使泛函Jx(t)达到极值的曲线称为极值曲线(轨线),记作:x*(t),见图2-2。对于端点固定的情况,容许轨线x(t)应满足下列边界条件:,第2章 最优控制中的变分法 2.2 欧拉方程,2、极值的必要条件定理26:极值轨线x(t)满足欧拉方程证明:P16.注意名词:横截条件(第3节讨论)例22:(求极值轨线)2.2.2 有等式约束的泛函极值的必要条件在最优控制问题中,泛函Jx(t)所依赖的函数x(t)往往会受到一定约束条件的限制。在动态最优化问题中,由于受控系统
15、的数学模型往往用微分方程来描述,所以等式约束就是系统的状态方程。等式约束:系统的运动微分方程,第2章 最优控制中的变分法 2.2 欧拉方程,1、定义的问题问题描述:问题222、极值的必要条件解决有约束问题方法:将有约束问题转化为无约束问题,利用无约束的结论。通过引入拉格朗日乘子向量,解决这个问题。定理27:(主要的问题:将有约束问题转化为无约束问题后的拉格朗日乘子向量定义、计算)这里,为了将有约束条件的泛函极值问题转化为无约束条件的泛函极值问题,应用拉格朗日乘子法。为此,引入待定的n维拉格朗日乘子向量(t),即证明:P18例2-3:,第2章 最优控制中的变分法 2.2 欧拉方程,2.2.3 泛
16、函极小值的充分条件(1)无约束情况定理2-8:(2)有约束情况定理2-9:例2-4:,第2章 最优控制中的变分法 2.3 横截条件,横截条件:两点边界满足的条件。例如式(226)前面讨论的是最简单的情况:两端固定(初始状态和末端状态)且初始时刻和末端时刻都固定,在工程实际中存在许多复杂的情况,讨论如下:2.3.1 末端时刻固定时的横截条件末端时刻tf固定,存在以下几种情况:见表2-12.3.2 末端时刻自由时的横截条件横截条件:式(2-53)末端时刻tf自由,存在以下几种情况:见表2-22.3.3 初始时刻自由时的横截条件横截条件:式(2-62)初始时刻自由,存在以下几种情况:见表2-2,横截
17、条件:,第2章 最优控制中的变分法 2.4 用变分法解最优控制问题,用变分法求解连续系统最优控制问题:(1)具有等式约束条件的泛函极值问题,只要把受控系统的数学模型看成是最优轨线x(t)应满足的等式约束条件即可;(2)控制变量不受约束;(3)末端时刻固定和末端时刻自由时最优解的必要条件和充分条件。一、可用变分法求解的最优控制问题一般描述,非线性时变系统状态方程为,初始状态,其中,x 为n 维状态向量;u 为m 维控制向量;f 为n 维向量函数。,要求在控制空间中寻求一个最优控制向量(不受约束),使以下性能指标,沿最优轨线 取极小值。,目标集(末端状态集),第2章 最优控制中的变分法 2.4 用
18、变分法解最优控制问题,二、末端时刻固定时的最优解问题的描述:P301、末端受约束情况两个约束:状态受系统状态方程约束,末端状态受目标集约束。引入两个拉格朗日乘子向量(t)、(t),构造广义泛函(无条件极值):,定义哈密顿函数(关于该函数的说明P31),代入上式得,式中的第三项进行分部积分,得,当泛函J 取极值时,其一次变分等于零。即,第2章 最优控制中的变分法 2.4 用变分法解最优控制问题,可以变分的量:,求出J 的一次变分并令其为零,广义泛函取极值的必要条件是(定理210)正则方程:边界条件:极值条件(控制方程):,第2章 最优控制中的变分法 2.4 用变分法解最优控制问题,几点说明:,1
19、)实际上,(2-73)式和(2-74)式为欧拉方程。,因为,推导过程:如果令(广义泛函的积分内的函数),简记成,由欧拉方程得到,即,第2章 最优控制中的变分法 2.4 用变分法解最优控制问题,而(275)式和初始条件(266)就是横截条件。,2)是泛函取极值的必要条件,是否为极小值还需要二次变分 来判断,则泛函J 取极小值。,第2章 最优控制中的变分法 2.4 用变分法解最优控制问题,3)哈密顿函数沿最优轨线随时间的变化率,在最优控制、最优轨线 下,有 和,(270)式的哈密顿函数对 求偏导,结果为,于是,第2章 最优控制中的变分法 2.4 用变分法解最优控制问题,即哈密顿函数H 沿最优轨线对
20、时间的全导数等于它对时间的偏导数。记为 则,对上式积分,得到,当哈密顿函数不显含 t 时,得,第2章 最优控制中的变分法 2.4 用变分法解最优控制问题,2、末端自由情况广义泛函取极值的必要条件是(定理211)正则方程:边界条件:极值条件:,3、末端固定情况广义泛函取极值的必要条件是(定理212)正则方程:边界条件:极值条件:末端时刻固定时最优解的充分条件:定理213,第2章 最优控制中的变分法 2.4 用变分法解最优控制问题,三、末端时刻自由时的最优解推导过程与末端时刻固定时一样,只不过不同在于,可以变分的量:,不可以变分的量:,末端受约束情况:定理214末端自由情况:定理215末端固定时情
21、况:定理216注意与末端时刻固定的情况不同。,第3章 极小值原理及其应用 3.1 连续系统的极小值原理,问题的提出,用变分法求解最优控制时,认为控制向量 不受限制。但是实际的系统,控制信号都是受到某种限制的。,因此,应用控制方程来确定最优控制,可能出错。,a)图中所示,H 最小值出现在左侧,不满足控制方程。b)图中不存在,第3章 极小值原理及其应用 3.1 连续系统的极小值原理,一、自由末端的极小值原理定理3-1:对应如下定常系统、末值型性能指标、末端自由、控制受约束的最优控制问题,及,满足下述正则方程:,对于最优解和最优末端时刻、最优轨线,存在非零的n维向量函数 使,第3章 极小值原理及其应
22、用 3.1 连续系统的极小值原理,式中哈密顿函数,及,满足边界条件,哈密顿函数相对最优控制为极小值,哈密顿函数沿最优轨迹线保持为常数,固定时,当,自由时,当,第3章 极小值原理及其应用 3.1 连续系统的极小值原理,上述极小值原理与变分法主要区别在于条件。当控制无约束时,相应条件为;,不再成立,而代之为,当控制有约束时,,极小值原理的重要意义:(P51)(1)容许控制条件放宽了。(2)最优控制使哈密顿函数取全局极小值。(3)极小值原理不要求哈密顿函数对控制的可微性。(4)极小值原理给出了最优控制的必要而非充分条件。例31:,说明:1)极小值原理给出的只是最优控制应该满足的必要条件。2)极小值原
23、理与用变分法求解最优问题相比,差别仅在于极值条件。3)这里给出了极小值原理,而在庞德里亚金著作论述的是极大值原理。因为求性能指标J的极小值与求J的极大值等价。4)非线性时变系统也有极小值原理。,第3章 极小值原理及其应用 3.1 连续系统的极小值原理,二、极小值原理的一些推广形式1、时变问题定义:描述最优控制问题的相关函数显含时间,称为时变问题。解决办法:引入新状态变量,将时变问题转为定常问题,利用定理3-1。,定理3-2:,满足下述正则方程:,及,式中哈密顿函数,第3章 极小值原理及其应用 3.1 连续系统的极小值原理,及,满足边界条件,哈密顿函数相对最优控制为极小值,在最优轨线末端哈密顿函
24、数应满足,沿最优轨线哈密顿函数变化率,定理32与定理31的区别:P61,第3章 极小值原理及其应用 3.1 连续系统的极小值原理,2、积分型性能指标问题,定理3-3:,满足下述正则方程:,及,式中哈密顿函数,及,满足边界条件,第3章 极小值原理及其应用 3.1 连续系统的极小值原理,哈密顿函数相对最优控制为极小值,哈密顿函数沿最优轨迹线保持为常数,固定时,当,自由时,当,第3章 极小值原理及其应用 3.1 连续系统的极小值原理,例3-2:试求:时的,解:定常系统、积分型,固定,自由,受约束。取哈密顿函数,由协态方程,由边界条件,注:控制的切换点为(ts)=1,第3章 极小值原理及其应用 3.1
25、 连续系统的极小值原理,控制的切换点处,根据边界条件继续求出:,代入状态方程得,第3章 极小值原理及其应用 3.1 连续系统的极小值原理,第3章 极小值原理及其应用 3.1 连续系统的极小值原理,最优性能指标为:,例3-3:3、末端受约束的情况做法与前面得一样,引入两个拉格朗日乘子向量,构造广义泛函,在满足末端约束条件下,泛函取得极值是等价的。定理3-4:(定常系统)定理3-5:(时变系统)4、复合型性能指标情况定理36:表3-1,3-2例35:,第3章 极小值原理及其应用 3.2 离散系统的极小值原理,一、离散欧拉方程控制序列不受约束时,利用离散变分法求解离散系统的最优控制问题。,设系统的差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 优控制理论 控制 理论 PPT 课件

链接地址:https://www.31ppt.com/p-5678272.html