线性二次型最优控制问题课件.ppt
第六章 线性二次型最优控制问题,6.1 线性二次型最优控制问题的提法6.2 有限时间的状态调节器问题6.3 无限时间的状态调节器问题6.4 输出调节器问题6.5 跟 踪 问 题*6.6 具有指定稳定度的最优调节器问题* 6.7 在阶跃干扰作用下的状态调节器问题* 6.8 带有观测器的最优调节器问题,1,2019-8-3,线性二次型最优控制问题是指线性系统具有二次型性能指标的最优控制问题,它呈现如下重要特性:性能指标具有鲜明的物理意义。最优解可以写成统一的解析表达式。所得到的最优控制规律是状态变量的反馈形式,便于计算和工程实现。 可以兼顾系统性能指标的多方面因素。例如快速性、能量消耗、终端准确性、灵敏度和稳定性等。在理论上,线性二次型最优控制问题是其它许多控制问题的基础,有许多控制问题都可作为线性二次型最优控制问题来处理。 线性二次型最优控制问题,在实践上得到了广泛而成功的应用。可以说,线性二次型最优控制问题是现代控制理论及其应用领域中最富有成果的一部分。,2,2019-8-3,6.1 线性二次型最优控制问题的提法,问题6.1.1 给定线性时变系统的状态方程和输出方程 其中,X(t)是n维状态变量,U(t)是m维控制变量,Y(t)是l维输出变量,A(t)是nn时变矩阵,B(t)是nm时变矩阵。假设1lmn,U(t)不受约束。若Yr(t)表示预期输出变量,它是l维向量,则有 e(t)= Yr(t)Y(t) 称为误差向量。现在的问题是,选择最优控制U*(t)使下列二次型性能指标 (6.1.2),(6.1.1),3,2019-8-3,为最小,这就是线性二次型最优控制问题。其中S是ll半正定对称常数矩阵,Q(t)是ll半正定对称时变矩阵,R(t)是mm正定对称时变矩阵,终端时间tf是固定的,终端状态X(tf)自由。性能指标(6.1.2)的物理意义 式(6.1.2)中的第一部分 称作终端代价,用它来限制终端误差e(tf) ,以保证终端状态X(tf)具有适当的准确性。式(6.1.2)中的第二部分 称作过程代价,用它来限制控制过程的误差e(t),以保证系,4,2019-8-3,统响应具有适当的快速性。式(6.1.2)中的第三部分 称作控制代价,用它来限制控制U(t)的幅值及平滑性,以保证系统安全运行。同时,它对限制控制过程的能源消耗也能起到重要的作用,从而保证系统具有适当的节能性。 说明: (1)二次型性能指标是一种综合型性能指标。它可以兼顾终端状态的准确性、系统响应的快速性、系统运行的安全性及节能性各方面因素。线性二次型最优控制问题(6.1.1)、(6.1.2)的实质是:用不大的控制能量,来保持较小的输出误差,以达到控制能量和误差综合最优的目的。,5,2019-8-3,(2)在这些不同目标之间,往往存在着一定矛盾。例如,为能尽快消除误差并提高终端准确性,就需较强的控制作用及较大的能量消耗;而抑制控制作用的幅值和降低能耗,必然会影响系统的快速性和终端准确性。如何对这些相互冲突的因素进行合理折衷,是系统设计者必须认真对待的课题。 (3)性能指标由三项组成,若各项出现不同符号,将发生相互抵消的现象。这样,尽管各项单独的数值较大,但J的数值可能很小,性能指标就无法反映各项指标的优劣。为防止出现这种情况,应保证在各种实际运行情况下,无论容许控制如何选择,性能指标中各项的数值始终具有相同的符号。又因是以极小值作为最优标准,结合问题的物理性质,各项符号均取正值。 (4)控制时间的起点t0及终点tf,可能是由实际问题决定的客观参数,也可能是由设计者决定的主观参数。对后者而言,设计者必须把希望达到的目标和t0 、 tf的选择联系起来。,6,2019-8-3,课前预习和讨论,1、已经学过的最优控制问题的求解方法有哪些?它们之间有何联系和区别?2、什么样的最优控制问题称为线性二次型最优控制?3、线性二次型最优控制问题有何特点?4、你认为问题6.1.1所描述的线性二次型最优控制问题应该用什么方法求解? 为什么?5、目标泛函中的各项反映了什么样的控制要求和性能?请具体说明!6、目标泛函中的加权矩阵S,Q(t)和R(t)意味着什么?7、你认为二次型最优控制问题的难点在哪儿?,7,2019-8-3,上式所示的性能指标中加权矩阵S,Q(t)和R(t) (1)加权矩阵中的各个元素之间的数值比例关系,将直接影响系统的工作品质。例如,提高S阵中某一元素的比重,说明更加重视与该元素对应的状态分量的终端准确性;提高Q(t)阵中某一元素的比重,说明希望与之对应的状态分量具有较好的快速响应特性;而提高R(t)阵中某一元素的比重,意味着需要更有效地抑制与之相应的控制分量的幅值及由它引起的能量消耗。这只是大致趋势,实际情况十分复杂。因此,如何安排各加权阵的各个元素之间的关系,乃是一件十分重要而又十分困难的工作 。 (2)将S阵取为半正定,以便保证终端代价的非负性,但容许在e(tf)不为零时的终端代价为零,这相当于不考虑与之相应的终端误差。出于同样理由,Q(t)亦取半正定。但R(t)必须取正定,这是因为控制代价实际上可以反映控制过程的能量,8,2019-8-3,消耗,而UT(t)R(t)U(t) 则反映各瞬间的控制功率,只要U(t) 不为零,控制功率当然就不应等于零。 (3)由于终端代价只表示终端时刻tf时的性能,因此, S应为常数阵。至于Q(t)及R(t),可能取为常数阵,也可能取为时变阵。后者是为了适应控制过程的特殊需要。例如,在控制过程的初期出现的较大误差,并非系统品质不佳所致,而是由系统的初始条件引起的,因此,不必过分重视这种误差,以免引起控制作用U(t)不必要的过大冲击,但控制过程的后期的误差直接与控制效果相关,必须给予足够的重视。只有把Q(t)和R(t)取为时变阵,才能适应控制过程的这类时变需求。有时,为了防止模型的失调,也需要Q(t)及R(t)具有时变性质。,9,2019-8-3,对容许控制U(t)和终态X(tf)的说明 (1) 在线性二次型问题的定义中,并没有直接提出对控制作用U(t)的不等式约束,但这并不等于在物理上不需要对U(t)进行必要的限制。实际上,用适当选择Q(t)和R(t)数值比例的方法,同样可以把U(t)的幅值限制在适当的范围之内。这样,就可以在保持闭环系统线性性质的前提下,实现对U(t)的限制。 (2)在定义问题时,也没有直接提出对终态X(tf)的要求。实际上,对终态的要求,是利用性能指标的终端代价来反映的,性能指标中的终端代价用于限制终端误差,它表明期望终态X(tf)尽量靠近误差信号e(t)=0所对应的状态。,10,2019-8-3,若C(t)=I(单位矩阵),Yr(t)=0,则 于是性能指标(6.1.2)变为 这时问题归结为:用不大的控制能量,使系统状态X(t)保持在零值附近,因而称为状态调节器问题。,线性二次型最优控制问题的几种特殊情况,状态调节器问题,11,2019-8-3,若Yr=0,则,于是性能指标(6.1.2)变为,这时问题归结为:用不大的控制能量,使系统输出Y(t)保持在零值附近,故称为输出调节器问题。,输出调节器问题,12,2019-8-3,若Yr(t)0,则 于是性能指标(6.1.2)可写为 这时问题转化为:用不大的控制量,使系统输出Y(t)紧紧跟随Yr(t)的变化,故称为跟踪问题。,跟踪问题,13,2019-8-3,6.2 有限时间的状态调节器问题,问题6.2.1 给定线性定常系统的状态方程和初始条件 其中X(t)是n维状态变量,U(t)是m维控制变量,A是nn常数矩阵,B是nm常数矩阵。性能指标是 其中Q是nn非负定、对称的常数矩阵,R是mm正定、对称的常数矩阵,tf是给定的终端时刻,X(tf)是自由的终端状态,控制函数U(t)不受约束。,(6.2.1),(6.2.2),14,2019-8-3,现在的问题是,要求确定最优控制函数U*(t),使性能指标(6.2.2)达到最小值。这样的最优控制问题是以较小的控制能量为代价,使状态变量X(t)保持在零值附近,故称为状态调节器问题。 又考虑到终端时间tf是有限的,故称为有限时间的状态调节器问题。相应的最优控制U*(t)称为最优调节作用或最优调节器。,15,2019-8-3,下面应用最小值原理来求解这个问题。 解: 构造Hamilton函数 因为控制函数U(t)本身不受约束,所以有,(6.2.3),16,2019-8-3,式(6.2.3)表明,最优调节作用是协态变量(t)的线性函数。但是,由于协态变量在实际系统中是不存在的,自然也无法检测到。因此式(6.2.3)的最优调节作用在工程上是难以实现的。为了便于在工程上实现,需将调节作用U(t)表示成系统状态变量X(t)的函数。令: 其中P(t)是nn待定的时变矩阵。对上式两边求导数,得 规范方程 为:,17,2019-8-3,由于X(t)是任意的,所以有 由于终端状态X(tf)是自由 的,故相应的协态变量的 终端值为 所以,,矩阵黎卡提(Riccati)微分方程,矩阵黎卡提(Riccati)微分方程的边界条件,(6.2.4),18,2019-8-3,P(t)的3个重要性质由微分方程理论的存在与唯一性定理,可以证明P(t)存在而且唯一。对于任意的tt0,tf, P(t)均为对称阵,即 P(t)PT(t) 若R是正定矩阵,Q是半正定矩阵,则P(t)(t0ttf)是半正定矩阵;若R是正定矩阵, Q是正定矩阵,则P(t)(t0ttf)是正定矩阵。证明略。,19,2019-8-3,命题6.2.1 问题6.2.1的最优调节作用必为如下形式的状态反馈 其中P(t)是矩阵黎卡提微分方程 满足边界条件 的对称解。并且状态最优轨线X*(t)是状态方程,20,2019-8-3,满足初始条件 的解。 若令 ,则有 其中K(t)称为反馈增益矩阵。这样就构成了一个状态反馈最优调节系统,如图61所示。,图6-1,21,2019-8-3,说明: 设U(t)是任意的控制作用,X(t)是相应于U(t)的状态轨线,性能指标(6.2.2)除了依赖于U(t)之外,还依赖于状态初值X(t0)。因此,性能指标可记为 特别是当控制作用为最优值U*(t)时,性能指标记为,22,2019-8-3,命题6.2.2 有限时间状态调节器问题的最优控制U*(t)的充要条件是: 且性能指标的最小值为: 证明:命题6.2.2的前半部分,即关于最优调节作用的充分性,在第三章最大值原理的推论中已经证明了。在那里,我们曾经指出,对于线性系统(6.2.1)来说,最大(小)值原理是使性能指标(6.2.2)达到最小值的必要和充分条件。因此,下面只证明命题6.2.2的后半部分 因为,23,2019-8-3,将系统状态方程(6.2.1)和黎卡提微分方程(6.2.4)代入上式,经整理得 分别对上式两边进行积分,24,2019-8-3,上式进一步整理得 所以, 性能指标的最小值为,25,2019-8-3,由于R是正定矩阵,上式最后一个等号的右端第二项是非负的,故当,26,2019-8-3,时,性能指标JX(t0),U(t)达到最小值,且为 QED 说明: 由命题6.2.2可知,若初始时刻为t,初始状态为X(t),则性能指标的最小值为,27,2019-8-3,命题6.2.3 有限时间状态调节器问题的最优控制U*(t)存在且唯一。 证明:1关于存在性由于U*(t)=R1BTP(t)X(t) ,而P(t)是存在的,故U*(t)亦存在。 2关于唯一性 应用反证法。设U*(t)不是唯一的,并设U*(t)和 均为最优控制,则由P(t)的唯一性,得 将上述两个式子分别代入系统状态方程(6.2.1),得,28,2019-8-3,由此可知,X(t)及 乃是同一微分方程在同一边界条件下的解。根据微分方程在给定边界条件下解的唯一性,有 从而有 QED 综合命题6.2.1、命题6.2.2和命题6.2.3,可得如下定理: * 定理6.2.1 * 给定线性定常系统的状态方程 其中U(t)不受约束。初始条件X(t0)=X0和性能指标 则最优控制存在且唯一,最优控制的充要条件是,29,2019-8-3,其中P(t)是矩阵黎卡提微分方程 满足边界条件 的唯一对称解。并且,当Q为半正定对称矩阵时,P(t)(t0ttf)是半正定对称矩阵;而当Q为正定对称矩阵时,P(t)是正定对称矩阵。性能指标的最小值为 状态最优轨线是下列状态方程 满足初始条件X(t0)=X0的解。,30,2019-8-3,例6.2.1 设调节对象的状态方程为: 性能指标为 其中q0,r0,要求确定最优调节作用和状态最优轨线。 解: 这是有限时间状态调节器问题,所以 其中p(t)满足方程,31,2019-8-3,利用分离变量法解此方程,得 由此得 其中 状态最优轨线是下列状态方程,(6.2.6),32,2019-8-3,的解。解此方程得 最优调节的闭环系统之方程图如图62所示。图中表示信号相乘。虚线部分表示p(t)的求解装置,p(0)可由式(6.2.6)求得。特别当tf=1,x(0)=1,q=1,a=1,而r分别为1,0.1和0.02时,其最优调节作用u*(t),最优轨线x*(t)和黎卡提方程的解p(t)如图63所示。,33,2019-8-3,图6-2,34,2019-8-3,图6-3,35,2019-8-3,对图63的说明: 由图63(a)可见,当r很小时,意即控制作用的价值并不重要,控制轨线x(t)将迅速回到零;当r很大时,意即控制作用的价值十分重要,状态轨线x(t)将衰减得很慢。 如图63(b)可见,随着r的减小,在控制区间0,1起始部分的控制变量的幅值变得很大;当r趋于零时,控制变量逐渐演变成为t=0时的脉冲。 由图63(c)可见,随着r的减小,p(t)在控制区间0,1的起始部分几乎是一常数;当r减小时,p(t)仅仅在控制区间的最后部分才表现出时变的性质;随着r的增大,p(t)就成为真正的时变了。,36,2019-8-3,本节几点说明 若性能指标为 其中S为半正定对称矩阵,Q、R假设同前,则定理6.2.1仍然成立,但是,边界条件应改为 这是由于在这种情况下 又考虑 所以,37,2019-8-3,如果给定的是时变系统 且性能指标为 假设A(t),B(t),Q(t)和R(t)的诸元素都是t(t0t tf)的连续函数,并且A(t),B(t),Q(t) ,R(t)和R-1(t)都是有界的,则定理6.2.1仍然成立,只要将A,B,Q和R分别改为A(t),B(t),Q(t)和R(t),边界条件由P(tf)=0改为P(tf)=S即可。,38,2019-8-3,6.3 无限时间的状态调节器问题,在6.2节讨论的状态调节器问题中,所得到最优调节作用是状态变量的线性函数,可以实现状态反馈的闭环控制。但是,其反馈增益矩阵 却是时变的。这在工程实现上是极不方便的。如果我们能够得到定常的反馈增益矩阵,那将给工程实现带来极大的方便。从下面的讨论中将会看到,当线性定常系统是完全可控的,并且终端时刻tf趋于无限时,就可得到非时变的状态调节器,即这时的反馈增益矩阵是一个定常矩阵。,39,2019-8-3,问题6.3.1 给定完全可控线性定常系统的状态方程和初始条件 以及性能指标 其中Q和R都是定常对称正定矩阵。假定U(t)不受约束,要求确定最优调节作用U*(t),使性能指标(6.3.2)达到最小值。该问题与上一节所讨论的问题相类似,也是一种状态调节器问题,但是,由于终端时刻 tf 为无限值,故称为无限时间的状态调节器问题,有时也称为非时变的状态调节器问题。,(6.3.1),(6.3.2),40,2019-8-3,对于无限时间的状态调节器问题,可以将它看成是在上一节所讨论的有限时间的状态调节器问题中,令tf时的极限情况来处理。即 由上节定理6.2.1可知,对于给定的系统(6.3.1),使性能指标 达到最小值的最优调节作用为,41,2019-8-3,其中P(t)是下列矩阵黎卡提微分方程 满足边界条件 的正定对称解。 可以证明,正定对称矩阵P(t)的每个元素pij(t)( i,j=1,2,3,n)随时间变化的情况如图64所示。由图可见,当tf很大时,随着t的减小pij(t)将达到稳定值 ,并且随着tf的增加,此稳态值的时间区间将加宽。当tf时,此稳态值的时间区间也将趋于无穷大。所以当给定的系统(6.4.1)完全可控时 而,图6-4,42,2019-8-3,于是,当tf时,矩阵黎卡提微分方程就转化为如下矩阵黎卡提(Riccati)代数方程: 由于性能指标(6.3.2)可表示为 所以系统(6.3.1)在性能指标为(6.3.2)时的最优调节作用为,43,2019-8-3,* 定理6.3.1* 给定线性定常系统的状态方程和初始条件 其中A,B为定常矩阵,系统(A,B)是完全可控的,控制函数U(t)不受约束。性能指标为 其中Q,R是定常对称正定矩阵,则使性能指标J达到最小值的最优调节作用为 其中 是矩阵黎卡提代数方程 的唯一正定对称解。而状态最优轨线X*(t)是状态方程,44,2019-8-3,满足初始条件 的解。性能指标的最小值为 最优调节系统的方框图如图65所示。,图6-5,45,2019-8-3,说明: 对于无限时间状态调节器,终端状态必须为零,即X()=0。不然,性能指标值将为无穷大,问题将无解。由于X()=0,所以在性能指标中设置终端代价是多余的。 定理6.3.2 定理6.3.1中的闭环最优调节系统 是渐进稳定的。 证明:利用反证法来证明该定理。为此令 假设系统(6.3.3)不是渐进稳定的,则A1必具有非负实部的特征根。于是,当tf时,状态变量X(t)不会趋于零,即,(6.3.3),46,2019-8-3,由于Q和R都是正定矩阵,故当tf时,性能指标的最优值J*X(t0),t0将趋于无穷大,即这与性能指标的最优值 为有限值相矛盾,所以系统(6.3.3)是渐进稳定的。,47,2019-8-3,定常矩阵 的计算方法直接求解黎卡提代数方程首先求解黎卡提微分方程 得到其解为 然后令tf,t=0或者tf=0,t= ,则可得到 。,48,2019-8-3,例6.3.1 二阶可控系统的状态方程: 最优控制u*(t)应使性能指标 取极小值。试求出最优控制u*(t) ,并绘出最优反馈系统的结构图。 解:已知,49,2019-8-3,故最优控制为 其中,P满足代数Riccati方程 经整理,并注意到p12=p21,得,50,2019-8-3,由此得 所以,最优控制为: 系统的最优反馈结构图如图66所示。,51,2019-8-3,图6-6,52,2019-8-3,6.4 输出调节器问题,问题6.4.1 给定完全可观测的线性定常系统的状态方程和输出方程 以及性能指标 其中,Q是定常半正定对称矩阵,R是定常正定对称矩阵,tf是有限的终端时刻,控制函数U(t)不受约束。要求确定最优调节作用U*(t),使性能指标(6.4.3)达到最小值。这类最优控制问题,称为输出调节器问题。其实质是用不大的控制能量,使输出变量Y(t)保持在零值附近。,(6.4.1),(6.4.2),(6.4.3),53,2019-8-3,考虑到输出方程(6.4.2),式(6.4.3)可写为 于是,加权矩阵为Q的有限时间的输出调节器问题就转化为加权矩阵为Q的有限时间的状态调节器问题。因此可以利用关于有限时间的状态调节器的定理6.2.1来求解这个问题。但是,这时要求系统(A,C)必须是完全可观测的,即要求,54,2019-8-3,55,2019-8-3,无限时间的输出调节器问题 问题6.4.1 所讨论的是终端时刻tf为有限值的情况。当tf时,性能指标为 这时,输出调节器问题称为无限时间的输出调节器问题。经过与上述相同的变换,即,56,2019-8-3,于是,无限时间的输出调节器问题就转化为无限时间的状态调节器问题。自然可以利用关于无限时间状态调节器问题的定理6.3.1来求解这个问题。但是,同时要求系统(A,B,C)是完全可控和完全可观测的。即,57,2019-8-3,例6.4.1 受控系统的传递函数为: 性能指标为: (r0),试求解并绘出最优反馈结构。 解:由式(6.4.4)得 令,(6.4.4),58,2019-8-3,则得系统的状态方程和输出方程为 所以 由于,59,2019-8-3,所以 故该系统(A,B,C)是完全可控和完全可观测的。又由于R=r0是正定的,所以根据定理6.3.1可知,最优调节作用为,60,2019-8-3,其中P是下列黎卡提代数方程的正定对称解 考虑到P为对称的,所以 。根据上面矩阵方程,可得下面代数方程组,61,2019-8-3,因为P是正定的,所以 解上面代数方程组,得到 故最优调节作用为,正定,各阶主子式大于零,62,2019-8-3,系统的最优反馈结构如图67所示,,图6-7,63,2019-8-3,6.5 跟 踪 问 题,跟踪问题又称为伺服机问题 问题6.5.1 给定完全可观测的线性定常系统的状态方程和输出方程 以及性能指标 其中Yr(t)是被跟踪的变量,U(t)不受约束。要求确定最优控制U*(t),使性能指标(6.5.3)达到最小值。这个问题的实质是,用不大的控制能量,使系统输出变量Y(t)跟踪Yr(t)的变化,故称为跟踪问题。,(6.5.1),(6.5.2),(6.5.3),64,2019-8-3,解:应用最小值原理来求解这个问题,首先构造Hamilton函数: 说明式(6.5.4)是使哈密顿函数H达到最小值的最优控制,当然也是使性能指标(6.5.3)达到最小值的最优控制。,(6.5.4),65,2019-8-3,规范方程为: 上述式子描述的两点边界值问题和调节器问题中的两点边界值问题相比,上式多了一项CTQYr(t)而成为非齐次微分方程。因此,设其解为 其中P(t)是待定的nn矩阵,(t)是待定的n维向量。对式(6.5.7)两边求导数,得,(6.5.5),(6.5.6),(6.5.7),66,2019-8-3,将式(6.5.5)式(6.5.7)代入式(6.5.8),消去其中的(t) 、 和 ,经整理得 上式左端是一个时间函数与状态变量的乘积,而右端单纯是一个时间函数,与状态X(t)无关,若使上式对所有的状态变量都成立则应满足 或者,(6.5.8),(6.5.9),(6.5.10),67,2019-8-3,由于 所以 由上述两个微分方程以及边界条件,可以解出P(t)和(t),则最优控制为: 说明: 跟踪问题的最优控制,实际上包括两项,一项是状态X(t)的线性函数,这与调节器问题的解相同,代表着负反馈的状态调节作用;另一项是(t)的线性函数, (t)受控于Yr(t),所以它代表着由被跟踪变量Yr(t)所引起的驱动作用。,68,2019-8-3,无限时间的跟踪问题 以上讨论的是终端时刻tf为有限值的情况。若tf为无穷大,则性能指标为 这时与无限时间的状态调节问题完全类似,有 这样,方程(6.5.9)和(6.5.10)就变成为 若系统(A,B,C)是完全可控和可观测的,即,(6.5.11),(6.5.12),69,2019-8-3,则最优控制为 其中 和 分别是代数方程(6.5.11)和(6.5.12)的解。,70,2019-8-3,例6.5.1 给定二阶系统的状态方程和输出方程 以及性能指标 要求确定最优控制u*(t),使性能指标达到最小值。 解:由给定条件知,71,2019-8-3,由于 所以,系统(A,B,C)是完全可控和完全可观测的,故系统存在最优控制,且为 其中,P和(t)是下列代数方程的解,72,2019-8-3,所以, 根据P的正定性,得,73,2019-8-3,于是 闭环系统的方框图如图68所示。,74,2019-8-3,图6-8,75,2019-8-3,6.6 具有指定稳定度的最优调节器问题,*在6.3节中的定理6.3.2表明闭环最优调节系统是渐进稳定的,即 但没有讨论X(t)0的衰减速度问题。 *若衰减速度愈快,则它的稳定性愈好。在这一节里,针对调节对象(6.3.1),设计一个调节器,使得闭环系统具有指定的稳定度0,也就是说,X(t)0的衰减速度不低于 的数量级。,76,2019-8-3,问题6.6.1 设调节对象的状态方程为 并假定(A,B)是完全可控的。性能指标为 其中Q和R都是对称正定矩阵,0。试确定最优调节作用U*(t),使性能指标(6.6.2)达到最小值。这个问题称为改进的最优调节器问题。 解:若令,(6.6.1),(6.6.2),77,2019-8-3,则有 于是 将式(6.6.3)和(6.6.4)代入式(6.6.1)中,并化简整理得 再将式(6.6.3)代入式(6.6.2)中,经化简整理得 这样,我们就将系统(6.6.1),性能指标为(6.6.2)的改进的最优调节器问题,转化为系统为(6.6.5),性能指标为(6.6.6)的规范型的最优调节器问题。并要求(A+I,B)是完全可控的。关于(A+ I,B)的可控性问题,存于如下命题。,(6.6.3),(6.6.4),(6.6.5),(6.6.6),78,2019-8-3,命题6.6.1 系统(A+I,B)完全可控的充要条件是系统(A,B)完全可控。 证明: 由于 其中fk(A)是次数低于K的A的多项式,所以 由于系统(A,B)是完全可控的,所以上面最后一个等式成立,因而系统(A+I,B)是完全可控的,命题6.6.1得证。,79,2019-8-3,新系统(6.6.5)的最优控制问题 由于系统(A+I,B)是完全可控的,并且Q和R都是正定的,故对于系统(6.6.5)来说,使性能指标(6.6.6)达到最小值的最优调节作用为 其中 满足下列黎卡提代数方程 对于系统(6.6.1),性能指标为(6.6.2)的最优调节作用为 其中 是式(6.6.7)的对称正定解。最优轨线为 由于,(6.6.7),(6.6.8),80,2019-8-3,而 所以X*(t)比 衰减得更快。也就是说,系统(6.6.1)在调节器(6.6.8)的作用下,其闭环系统 具有指定的稳定度 0。,81,2019-8-3,定理6.6.1 对于系统 使性能指标达到最小值的最优调节作用为其中 是黎卡提代数方程 的对称正定解。并且,在此最优调节作用下的闭环系统具有指定的稳定度0。,82,2019-8-3,例6.6.1 给定单输入单输出调节对象的微分方程 要求确定最优调节作用u*(t),使性能指标 达到最小值。 解:这是一个改进的无限时间的输出调节器问题。令 则对象的状态方程和输出方程为,83,2019-8-3,或者 由对象的状态方程、输出方程和性能指标可知: 由于,84,2019-8-3,所以,给定调节对象是完全可控和完全可观测的。将给定的性能指标进行变换 于是,我们便将改进的无限时间的输出调节器问题变成为改进的无限时间的状态调节器问题,并且,85,2019-8-3,根据本节定理6.6.1,可知其最优调节作用为 其中 P 为黎卡提代数方程 的正定对称解。解上面矩阵方程得,86,2019-8-3,解此方程组,得 因此,最优调节作用为,87,2019-8-3,亦即 下面来验证其闭环系统确有指定的稳定度1。闭环系统的状态方程为: 即,88,2019-8-3,其特征方程为 特征根的实数部分 故它具有指定的稳定度1。,89,2019-8-3,6.7 在阶跃干扰作用下的状态调节器问题,* 前面所讨论的调节器问题,都是假定系统的初始状态不在平衡位置上或者系统受到的外界干扰作用是脉冲式的。在这种情况下所设计的最优调节系统,一般来说,在外界阶跃干扰作用下,闭环系统是有静差的。本节将讨论如何选择性能指标的形式,使得所设计的最优调节系统能够克服阶跃干扰作用的影响,消除静态偏差。,90,2019-8-3,问题6.7.1 给定对象的状态方程 (6.7.1) 其中X(t)是n维状态变量,U(t)是m维控制变量,W(t)是m维阶跃干扰变量,A是nn常数阵,B是n m常数阵,对象(A,B)是完全可控的,B的秩为m。性能指标为 (6.7.2) 其中Q、S和R分别是nn , m m , m m对称正定常数阵。现在的问题是需要确定最优调节作用U*(t)使性能指标(6.7.2)达到最小值。 在性能指标(6.7.2)中,包含 这一项意味着对控制作用的变化速度也有所要求,即要求控制作用的变化速度也不宜过大。,91,2019-8-3,解:令 ,则 构成新的状态变量 是n+m维列向量,称为增广向量。令 作为新的控制向量,于是式(6.7.1),(6.7.3)和(6.7.4)可得一新的增广系统,其状态方程为 其中,(6.7.3),(6.7.4),(6.7.5),92,2019-8-3,分别为(n+m)(n+m)和( n+m ) m矩阵,而I为m m单位阵。相应地,性能指标也变成为 其中, 为(n+m)(n+m)对称正定矩阵。这样,本节开始所提出的最优调节器问题便转化为对于增广系统(6.7.5)、性能指标为(6.7.6)的最优调节器问题。求解该最优调节器问题,要求系统 是完全可控的,关于 的可控性问题存在下述命题。,(6.7.6),93,2019-8-3,命题6.7.1 完全可控的充要条件是(A,B)完全可控。 证明:由于,94,2019-8-3,所以 因此, 完全可控的充要条件是(A,B)完全可控。命题6.7.1得证。,95,2019-8-3,增广系统(6.7.5)的最优控制问题 由于系统(6.7.1)是完全可控的,所以增广系统(6.7.5)也是完全可控的。又考虑到Q、S和R都是对称正定阵,所以 和R也是对称正定阵,根据定理6.3.1可知,对于增广系统(6.7.5)来说,使性能指标(6.7.6)达到最小值的最优调节作用是,96,2019-8-3,其中 是黎卡提代数方程 的对称正定解。上式的分块形式为,97,2019-8-3,考虑到 为对称矩阵,则由上式可得: 由上式可得 。若令 则最优调节作用为:,(6.7.7),98,2019-8-3,其方框图如图69所示。,图6-9,99,2019-8-3,在最优调节(6.7.7)的作用下,闭环系统是渐进稳定的,即 利用式(6.7.1),可得 将上式代入式(6.7.7)中,得,(6.7.8),100,2019-8-3,若令 则有 将上式两边积分,得 上式即为调节对象(6.7.1)对于性能指标(6.7.2)的最优调节作用。在此最优调节作用下,由式(6.7.8)可知,其闭环系统是稳定的,且无静态偏差。调节作用U*(t)稳定在一W(t)上,可以完全克服阶跃干扰的影响,其方框图如图610所示。,(6.7.9),101,2019-8-3,由式(6.7.9)可见,最优调节作用是状态X(t)的比例积分的反馈形式,这一点与在经典自动调节理论中,常常采用比例积分反馈来克服外界阶跃干扰作用是一致的。,图6-10,102,2019-8-3,例6.7.1 已知调节对象的状态方程和输出方程为 其中u(t)为控制变量,w(t)为外界阶跃干扰。性能指标为 要求确定u*(t),使性能指标J达到最小值。,103,2019-8-3,解:这是一个具有阶跃干扰的输出调节器问题。由题设知: 容易验证调节对象(A,B,C)是完全可控和完全可观测的。即 令,104,2019-8-3,则有 增广系统的状态变量为 增广系统的状态方程和输出方程为 其中,105,2019-8-3,由于系统(A,B)是完全可控的,所以增广系统 也是完全可控的。这使性能指标可转化为 其中 由于,106,2019-8-3,而 所以 也是完全可观测的,于是系统的最优调节作用为,107,2019-8-3,其中P是黎卡提代数方程 的对称正定解,将具体数据代入上式,得,108,2019-8-3,考虑到矩阵P是对称的,上式化简整理得到下列方程组,109,2019-8-3,求解上列方程组得 所以增广系统的最优调节作用为,110,2019-8-3,由此得 由于 所以 将上式两边积分,得最优调节作用为它的闭环系统的方框图如611所示。图611又可化为图612。,111,2019-8-3,图6-11,112,2019-8-3,由图612可见,最终得到的最优调节作用为输出变量y(t)的比例、积分和微分反馈的形式。,图6-12,113,2019-8-3,6.8 带有观测器的最优调节器问题,如何获得系统状态变量的信息 利用卡尔曼滤波来估计状态; 建立状态观测器。 通过构造一个观测器,利用系统的输入变量V(t)和输出变量Y(t)的信息来估计状态变量X(t)。然后再利用状态变量的估计值Z(t)进行反馈,实现最优调节。如图613所示。,图6-12,114,2019-8-3,构造状态观测器 构造一个状态观测器,就是要建立一个渐近稳定的动态系统,使得该系统的状态变量Z(t)能够趋近于原系统的状态变量X(t),而它的输入信号是原系统的输入变量V(t)和输出变量Y(t)。 设系统的状态方程和输出方程为: 其中(A,C)是完全可观测的。对于系统(6.8.1)构造如下的系统 其中G是nl矩阵,它使得系统(6.8.2)是渐近稳定的。也就是使得(A+GC)的特征根的实部均为负的。下面来证明当t时,Z(t) X(t),即,(6.8.1),(6.8.2),115,2019-8-3,用(6.8.1)的第一式减去式(6.8.2),得 (6.8.3) 由于(A+GC)的特征根的实部都是负的,所以系统(6.8.3)是渐近稳定的,即 因此,Z(t)可以作为状态X(t)的估计值。这样,我们所构造的系统(6.8.2)就是系统(6.8.1)的一个状态观测器。,116,2019-8-3,带有状态观测器的最优调节器 若系统的状态能够全部被检测得到,则系统(6.8.1)的最优调节闭环系统的方框图如图614所示。图中W(t)是系统的外界输入作用。这时闭环系统的状态方程和输出方程为,图6-14,117,2019-8-3,将上面的第三式代入第一式,得 由上式得到的闭环系统的传递函数阵为 利用状态观测器的观测值Z(t)代替原系统的状态变量X(t)进行反馈,构成带有观测器的闭环最优调节系统,其方框图如图615所示,该系统的状态方程和输出方程为,118,2019-8-3,图6-15,119,2019-8-3,将上面的第四式代入第一式,并合并前三式,得 写成矩阵形式:,120,2019-8-3,上面闭环系统的传递函数阵为,利用分块矩阵的求逆公式,121,2019-8-3,分块矩阵的求逆公式 若 则 其中,122,2019-8-3,说明: (1)不带观测器的状态反馈调节系统与带观测器的状态反馈调节系统的传递函数阵是相同的。也就是说,仅从输入输出的传递函数关系来看,这两个系统是完全相同的。 (2)如系统(A,C)是完全可观测的,则观测器一定存在。因此,对于一个完全可控和完全可观测的系统(A,B,C)来说,可以通过构造观测器的办法来实现状态反馈的最优调节。,123,2019-8-3,例6.8.1 已知对象的传递函数为 其方框图如图616所示。图中w(t)是外界输入变量,u(t)是控制变量。,图6-16,124,2019-8-3,其状态方程和输出方程为 性能指标为,125,2019-8-3,要求在外界输入w(t)=0的情况下,确定u*(t),使性能指标J达到最小值。 解:由状态方程,输出方程和性能指标可知 容易验证系统(A,B,C)是完全可控和完全可观测的,又考虑到Q和R都是正定的,故最优调节作用为 其中P是矩阵黎卡提代数方程 的对称正定解,解得,126,2019-8-3,于是,最优调节作用为 由于系统状态不能全部检测得到,所以构造一个状态观测器 通过选择G,使观测器的两个极点都为3。由于 它的特征方程为,127,2019-8-3,由于它的两个特征根都是3,故 因此状态观测器应为 利用Z(t)代替X(t),得到最优调节作用为 闭环调节系统的状态方程为,128,2019-8-3,对象的方框图616可化为617所示的形式。带有观测器的闭环调节系统的方框图如图618所示。 说明:在观测器中,G的选择不是唯一的。观测器极点是闭环系统极点的一部分,常常通过选择G,使观测器有满意的极点配置,从而使闭环系统也有满意的动态特性。