线性二次型最优控制问题课件.ppt
《线性二次型最优控制问题课件.ppt》由会员分享,可在线阅读,更多相关《线性二次型最优控制问题课件.ppt(130页珍藏版)》请在三一办公上搜索。
1、第六章 线性二次型最优控制问题,6.1 线性二次型最优控制问题的提法6.2 有限时间的状态调节器问题6.3 无限时间的状态调节器问题6.4 输出调节器问题6.5 跟 踪 问 题*6.6 具有指定稳定度的最优调节器问题* 6.7 在阶跃干扰作用下的状态调节器问题* 6.8 带有观测器的最优调节器问题,1,2019-8-3,线性二次型最优控制问题是指线性系统具有二次型性能指标的最优控制问题,它呈现如下重要特性:性能指标具有鲜明的物理意义。最优解可以写成统一的解析表达式。所得到的最优控制规律是状态变量的反馈形式,便于计算和工程实现。 可以兼顾系统性能指标的多方面因素。例如快速性、能量消耗、终端准确性
2、、灵敏度和稳定性等。在理论上,线性二次型最优控制问题是其它许多控制问题的基础,有许多控制问题都可作为线性二次型最优控制问题来处理。 线性二次型最优控制问题,在实践上得到了广泛而成功的应用。可以说,线性二次型最优控制问题是现代控制理论及其应用领域中最富有成果的一部分。,2,2019-8-3,6.1 线性二次型最优控制问题的提法,问题6.1.1 给定线性时变系统的状态方程和输出方程 其中,X(t)是n维状态变量,U(t)是m维控制变量,Y(t)是l维输出变量,A(t)是nn时变矩阵,B(t)是nm时变矩阵。假设1lmn,U(t)不受约束。若Yr(t)表示预期输出变量,它是l维向量,则有 e(t)=
3、 Yr(t)Y(t) 称为误差向量。现在的问题是,选择最优控制U*(t)使下列二次型性能指标 (6.1.2),(6.1.1),3,2019-8-3,为最小,这就是线性二次型最优控制问题。其中S是ll半正定对称常数矩阵,Q(t)是ll半正定对称时变矩阵,R(t)是mm正定对称时变矩阵,终端时间tf是固定的,终端状态X(tf)自由。性能指标(6.1.2)的物理意义 式(6.1.2)中的第一部分 称作终端代价,用它来限制终端误差e(tf) ,以保证终端状态X(tf)具有适当的准确性。式(6.1.2)中的第二部分 称作过程代价,用它来限制控制过程的误差e(t),以保证系,4,2019-8-3,统响应具
4、有适当的快速性。式(6.1.2)中的第三部分 称作控制代价,用它来限制控制U(t)的幅值及平滑性,以保证系统安全运行。同时,它对限制控制过程的能源消耗也能起到重要的作用,从而保证系统具有适当的节能性。 说明: (1)二次型性能指标是一种综合型性能指标。它可以兼顾终端状态的准确性、系统响应的快速性、系统运行的安全性及节能性各方面因素。线性二次型最优控制问题(6.1.1)、(6.1.2)的实质是:用不大的控制能量,来保持较小的输出误差,以达到控制能量和误差综合最优的目的。,5,2019-8-3,(2)在这些不同目标之间,往往存在着一定矛盾。例如,为能尽快消除误差并提高终端准确性,就需较强的控制作用
5、及较大的能量消耗;而抑制控制作用的幅值和降低能耗,必然会影响系统的快速性和终端准确性。如何对这些相互冲突的因素进行合理折衷,是系统设计者必须认真对待的课题。 (3)性能指标由三项组成,若各项出现不同符号,将发生相互抵消的现象。这样,尽管各项单独的数值较大,但J的数值可能很小,性能指标就无法反映各项指标的优劣。为防止出现这种情况,应保证在各种实际运行情况下,无论容许控制如何选择,性能指标中各项的数值始终具有相同的符号。又因是以极小值作为最优标准,结合问题的物理性质,各项符号均取正值。 (4)控制时间的起点t0及终点tf,可能是由实际问题决定的客观参数,也可能是由设计者决定的主观参数。对后者而言,
6、设计者必须把希望达到的目标和t0 、 tf的选择联系起来。,6,2019-8-3,课前预习和讨论,1、已经学过的最优控制问题的求解方法有哪些?它们之间有何联系和区别?2、什么样的最优控制问题称为线性二次型最优控制?3、线性二次型最优控制问题有何特点?4、你认为问题6.1.1所描述的线性二次型最优控制问题应该用什么方法求解? 为什么?5、目标泛函中的各项反映了什么样的控制要求和性能?请具体说明!6、目标泛函中的加权矩阵S,Q(t)和R(t)意味着什么?7、你认为二次型最优控制问题的难点在哪儿?,7,2019-8-3,上式所示的性能指标中加权矩阵S,Q(t)和R(t) (1)加权矩阵中的各个元素之
7、间的数值比例关系,将直接影响系统的工作品质。例如,提高S阵中某一元素的比重,说明更加重视与该元素对应的状态分量的终端准确性;提高Q(t)阵中某一元素的比重,说明希望与之对应的状态分量具有较好的快速响应特性;而提高R(t)阵中某一元素的比重,意味着需要更有效地抑制与之相应的控制分量的幅值及由它引起的能量消耗。这只是大致趋势,实际情况十分复杂。因此,如何安排各加权阵的各个元素之间的关系,乃是一件十分重要而又十分困难的工作 。 (2)将S阵取为半正定,以便保证终端代价的非负性,但容许在e(tf)不为零时的终端代价为零,这相当于不考虑与之相应的终端误差。出于同样理由,Q(t)亦取半正定。但R(t)必须
8、取正定,这是因为控制代价实际上可以反映控制过程的能量,8,2019-8-3,消耗,而UT(t)R(t)U(t) 则反映各瞬间的控制功率,只要U(t) 不为零,控制功率当然就不应等于零。 (3)由于终端代价只表示终端时刻tf时的性能,因此, S应为常数阵。至于Q(t)及R(t),可能取为常数阵,也可能取为时变阵。后者是为了适应控制过程的特殊需要。例如,在控制过程的初期出现的较大误差,并非系统品质不佳所致,而是由系统的初始条件引起的,因此,不必过分重视这种误差,以免引起控制作用U(t)不必要的过大冲击,但控制过程的后期的误差直接与控制效果相关,必须给予足够的重视。只有把Q(t)和R(t)取为时变阵
9、,才能适应控制过程的这类时变需求。有时,为了防止模型的失调,也需要Q(t)及R(t)具有时变性质。,9,2019-8-3,对容许控制U(t)和终态X(tf)的说明 (1) 在线性二次型问题的定义中,并没有直接提出对控制作用U(t)的不等式约束,但这并不等于在物理上不需要对U(t)进行必要的限制。实际上,用适当选择Q(t)和R(t)数值比例的方法,同样可以把U(t)的幅值限制在适当的范围之内。这样,就可以在保持闭环系统线性性质的前提下,实现对U(t)的限制。 (2)在定义问题时,也没有直接提出对终态X(tf)的要求。实际上,对终态的要求,是利用性能指标的终端代价来反映的,性能指标中的终端代价用于
10、限制终端误差,它表明期望终态X(tf)尽量靠近误差信号e(t)=0所对应的状态。,10,2019-8-3,若C(t)=I(单位矩阵),Yr(t)=0,则 于是性能指标(6.1.2)变为 这时问题归结为:用不大的控制能量,使系统状态X(t)保持在零值附近,因而称为状态调节器问题。,线性二次型最优控制问题的几种特殊情况,状态调节器问题,11,2019-8-3,若Yr=0,则,于是性能指标(6.1.2)变为,这时问题归结为:用不大的控制能量,使系统输出Y(t)保持在零值附近,故称为输出调节器问题。,输出调节器问题,12,2019-8-3,若Yr(t)0,则 于是性能指标(6.1.2)可写为 这时问题
11、转化为:用不大的控制量,使系统输出Y(t)紧紧跟随Yr(t)的变化,故称为跟踪问题。,跟踪问题,13,2019-8-3,6.2 有限时间的状态调节器问题,问题6.2.1 给定线性定常系统的状态方程和初始条件 其中X(t)是n维状态变量,U(t)是m维控制变量,A是nn常数矩阵,B是nm常数矩阵。性能指标是 其中Q是nn非负定、对称的常数矩阵,R是mm正定、对称的常数矩阵,tf是给定的终端时刻,X(tf)是自由的终端状态,控制函数U(t)不受约束。,(6.2.1),(6.2.2),14,2019-8-3,现在的问题是,要求确定最优控制函数U*(t),使性能指标(6.2.2)达到最小值。这样的最优
12、控制问题是以较小的控制能量为代价,使状态变量X(t)保持在零值附近,故称为状态调节器问题。 又考虑到终端时间tf是有限的,故称为有限时间的状态调节器问题。相应的最优控制U*(t)称为最优调节作用或最优调节器。,15,2019-8-3,下面应用最小值原理来求解这个问题。 解: 构造Hamilton函数 因为控制函数U(t)本身不受约束,所以有,(6.2.3),16,2019-8-3,式(6.2.3)表明,最优调节作用是协态变量(t)的线性函数。但是,由于协态变量在实际系统中是不存在的,自然也无法检测到。因此式(6.2.3)的最优调节作用在工程上是难以实现的。为了便于在工程上实现,需将调节作用U(
13、t)表示成系统状态变量X(t)的函数。令: 其中P(t)是nn待定的时变矩阵。对上式两边求导数,得 规范方程 为:,17,2019-8-3,由于X(t)是任意的,所以有 由于终端状态X(tf)是自由 的,故相应的协态变量的 终端值为 所以,,矩阵黎卡提(Riccati)微分方程,矩阵黎卡提(Riccati)微分方程的边界条件,(6.2.4),18,2019-8-3,P(t)的3个重要性质由微分方程理论的存在与唯一性定理,可以证明P(t)存在而且唯一。对于任意的tt0,tf, P(t)均为对称阵,即 P(t)PT(t) 若R是正定矩阵,Q是半正定矩阵,则P(t)(t0ttf)是半正定矩阵;若R是
14、正定矩阵, Q是正定矩阵,则P(t)(t0ttf)是正定矩阵。证明略。,19,2019-8-3,命题6.2.1 问题6.2.1的最优调节作用必为如下形式的状态反馈 其中P(t)是矩阵黎卡提微分方程 满足边界条件 的对称解。并且状态最优轨线X*(t)是状态方程,20,2019-8-3,满足初始条件 的解。 若令 ,则有 其中K(t)称为反馈增益矩阵。这样就构成了一个状态反馈最优调节系统,如图61所示。,图6-1,21,2019-8-3,说明: 设U(t)是任意的控制作用,X(t)是相应于U(t)的状态轨线,性能指标(6.2.2)除了依赖于U(t)之外,还依赖于状态初值X(t0)。因此,性能指标可
15、记为 特别是当控制作用为最优值U*(t)时,性能指标记为,22,2019-8-3,命题6.2.2 有限时间状态调节器问题的最优控制U*(t)的充要条件是: 且性能指标的最小值为: 证明:命题6.2.2的前半部分,即关于最优调节作用的充分性,在第三章最大值原理的推论中已经证明了。在那里,我们曾经指出,对于线性系统(6.2.1)来说,最大(小)值原理是使性能指标(6.2.2)达到最小值的必要和充分条件。因此,下面只证明命题6.2.2的后半部分 因为,23,2019-8-3,将系统状态方程(6.2.1)和黎卡提微分方程(6.2.4)代入上式,经整理得 分别对上式两边进行积分,24,2019-8-3,
16、上式进一步整理得 所以, 性能指标的最小值为,25,2019-8-3,由于R是正定矩阵,上式最后一个等号的右端第二项是非负的,故当,26,2019-8-3,时,性能指标JX(t0),U(t)达到最小值,且为 QED 说明: 由命题6.2.2可知,若初始时刻为t,初始状态为X(t),则性能指标的最小值为,27,2019-8-3,命题6.2.3 有限时间状态调节器问题的最优控制U*(t)存在且唯一。 证明:1关于存在性由于U*(t)=R1BTP(t)X(t) ,而P(t)是存在的,故U*(t)亦存在。 2关于唯一性 应用反证法。设U*(t)不是唯一的,并设U*(t)和 均为最优控制,则由P(t)的
17、唯一性,得 将上述两个式子分别代入系统状态方程(6.2.1),得,28,2019-8-3,由此可知,X(t)及 乃是同一微分方程在同一边界条件下的解。根据微分方程在给定边界条件下解的唯一性,有 从而有 QED 综合命题6.2.1、命题6.2.2和命题6.2.3,可得如下定理: * 定理6.2.1 * 给定线性定常系统的状态方程 其中U(t)不受约束。初始条件X(t0)=X0和性能指标 则最优控制存在且唯一,最优控制的充要条件是,29,2019-8-3,其中P(t)是矩阵黎卡提微分方程 满足边界条件 的唯一对称解。并且,当Q为半正定对称矩阵时,P(t)(t0ttf)是半正定对称矩阵;而当Q为正定
18、对称矩阵时,P(t)是正定对称矩阵。性能指标的最小值为 状态最优轨线是下列状态方程 满足初始条件X(t0)=X0的解。,30,2019-8-3,例6.2.1 设调节对象的状态方程为: 性能指标为 其中q0,r0,要求确定最优调节作用和状态最优轨线。 解: 这是有限时间状态调节器问题,所以 其中p(t)满足方程,31,2019-8-3,利用分离变量法解此方程,得 由此得 其中 状态最优轨线是下列状态方程,(6.2.6),32,2019-8-3,的解。解此方程得 最优调节的闭环系统之方程图如图62所示。图中表示信号相乘。虚线部分表示p(t)的求解装置,p(0)可由式(6.2.6)求得。特别当tf=
19、1,x(0)=1,q=1,a=1,而r分别为1,0.1和0.02时,其最优调节作用u*(t),最优轨线x*(t)和黎卡提方程的解p(t)如图63所示。,33,2019-8-3,图6-2,34,2019-8-3,图6-3,35,2019-8-3,对图63的说明: 由图63(a)可见,当r很小时,意即控制作用的价值并不重要,控制轨线x(t)将迅速回到零;当r很大时,意即控制作用的价值十分重要,状态轨线x(t)将衰减得很慢。 如图63(b)可见,随着r的减小,在控制区间0,1起始部分的控制变量的幅值变得很大;当r趋于零时,控制变量逐渐演变成为t=0时的脉冲。 由图63(c)可见,随着r的减小,p(t
20、)在控制区间0,1的起始部分几乎是一常数;当r减小时,p(t)仅仅在控制区间的最后部分才表现出时变的性质;随着r的增大,p(t)就成为真正的时变了。,36,2019-8-3,本节几点说明 若性能指标为 其中S为半正定对称矩阵,Q、R假设同前,则定理6.2.1仍然成立,但是,边界条件应改为 这是由于在这种情况下 又考虑 所以,37,2019-8-3,如果给定的是时变系统 且性能指标为 假设A(t),B(t),Q(t)和R(t)的诸元素都是t(t0t tf)的连续函数,并且A(t),B(t),Q(t) ,R(t)和R-1(t)都是有界的,则定理6.2.1仍然成立,只要将A,B,Q和R分别改为A(t
21、),B(t),Q(t)和R(t),边界条件由P(tf)=0改为P(tf)=S即可。,38,2019-8-3,6.3 无限时间的状态调节器问题,在6.2节讨论的状态调节器问题中,所得到最优调节作用是状态变量的线性函数,可以实现状态反馈的闭环控制。但是,其反馈增益矩阵 却是时变的。这在工程实现上是极不方便的。如果我们能够得到定常的反馈增益矩阵,那将给工程实现带来极大的方便。从下面的讨论中将会看到,当线性定常系统是完全可控的,并且终端时刻tf趋于无限时,就可得到非时变的状态调节器,即这时的反馈增益矩阵是一个定常矩阵。,39,2019-8-3,问题6.3.1 给定完全可控线性定常系统的状态方程和初始条
22、件 以及性能指标 其中Q和R都是定常对称正定矩阵。假定U(t)不受约束,要求确定最优调节作用U*(t),使性能指标(6.3.2)达到最小值。该问题与上一节所讨论的问题相类似,也是一种状态调节器问题,但是,由于终端时刻 tf 为无限值,故称为无限时间的状态调节器问题,有时也称为非时变的状态调节器问题。,(6.3.1),(6.3.2),40,2019-8-3,对于无限时间的状态调节器问题,可以将它看成是在上一节所讨论的有限时间的状态调节器问题中,令tf时的极限情况来处理。即 由上节定理6.2.1可知,对于给定的系统(6.3.1),使性能指标 达到最小值的最优调节作用为,41,2019-8-3,其中
23、P(t)是下列矩阵黎卡提微分方程 满足边界条件 的正定对称解。 可以证明,正定对称矩阵P(t)的每个元素pij(t)( i,j=1,2,3,n)随时间变化的情况如图64所示。由图可见,当tf很大时,随着t的减小pij(t)将达到稳定值 ,并且随着tf的增加,此稳态值的时间区间将加宽。当tf时,此稳态值的时间区间也将趋于无穷大。所以当给定的系统(6.4.1)完全可控时 而,图6-4,42,2019-8-3,于是,当tf时,矩阵黎卡提微分方程就转化为如下矩阵黎卡提(Riccati)代数方程: 由于性能指标(6.3.2)可表示为 所以系统(6.3.1)在性能指标为(6.3.2)时的最优调节作用为,4
24、3,2019-8-3,* 定理6.3.1* 给定线性定常系统的状态方程和初始条件 其中A,B为定常矩阵,系统(A,B)是完全可控的,控制函数U(t)不受约束。性能指标为 其中Q,R是定常对称正定矩阵,则使性能指标J达到最小值的最优调节作用为 其中 是矩阵黎卡提代数方程 的唯一正定对称解。而状态最优轨线X*(t)是状态方程,44,2019-8-3,满足初始条件 的解。性能指标的最小值为 最优调节系统的方框图如图65所示。,图6-5,45,2019-8-3,说明: 对于无限时间状态调节器,终端状态必须为零,即X()=0。不然,性能指标值将为无穷大,问题将无解。由于X()=0,所以在性能指标中设置终
25、端代价是多余的。 定理6.3.2 定理6.3.1中的闭环最优调节系统 是渐进稳定的。 证明:利用反证法来证明该定理。为此令 假设系统(6.3.3)不是渐进稳定的,则A1必具有非负实部的特征根。于是,当tf时,状态变量X(t)不会趋于零,即,(6.3.3),46,2019-8-3,由于Q和R都是正定矩阵,故当tf时,性能指标的最优值J*X(t0),t0将趋于无穷大,即这与性能指标的最优值 为有限值相矛盾,所以系统(6.3.3)是渐进稳定的。,47,2019-8-3,定常矩阵 的计算方法直接求解黎卡提代数方程首先求解黎卡提微分方程 得到其解为 然后令tf,t=0或者tf=0,t= ,则可得到 。,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性 二次 最优 控制 问题 课件
链接地址:https://www.31ppt.com/p-1476677.html