《线性二次型最优控制问题ppt课件.ppt》由会员分享,可在线阅读,更多相关《线性二次型最优控制问题ppt课件.ppt(94页珍藏版)》请在三一办公上搜索。
1、1,第五讲 线性二次型最优控制问题,2,主 要 内 容,5.1 线性二次型性能指标5.2 状态调节器问题有限时间状态调节器问题无限时间状态调节器问题5.3 输出调节器问题5.4 跟踪问题,3,5.1 线性二次型性能指标,性能指标具有鲜明的物理意义。最优解可以写成统一的解析表达式。所得到的最优控制规律是状态变量的反馈形式,便于计算和工程实现。 可以兼顾系统性能指标的多方面因素:快速性、能量消耗、终端准确性、灵敏度和稳定性等。许多控制问题都可作为线性二次型最优控制问题来处理。,线性二次型最优控制问题:线性系统具有二次型性能指标的最优控制问题,具有以下特性:,线性二次型最优控制问题在实践上得到了广泛
2、而成功的应用!,4,问题5.1.1 给定线性时变系统的状态方程和输出方程,Yr(t)表示预期输出变量,则有 e(t)= Yr(t)Y(t) 称为误差向量。,其中,X(t)是n维状态变量,U(t)是m维控制变量,Y(t)是r维输出变量,A(t)是nn时变矩阵,B(t)是nm时变矩阵。假设1rmn,U(t)不受约束。,(5.1.1),5,选择最优控制U*(t)使下列二次型性能指标,为最小线性二次型最优控制问题。,其中,S:rr半正定对称常数矩阵,Q(t):rr半正定对称时变矩阵,R(t):mm正定对称时变矩阵.终端时间tf是固定的,终端状态X(tf)自由。,(5.1.2),6,若C(t)=I(单位
3、矩阵),Yr(t)=0,则 于是性能指标变为,线性二次型最优控制问题的几种特殊情况,问题归结为:,用不大的控制能量,使系统状态X(t)保持在零值附近状态调节器问题。,7,线性二次型最优控制问题的几种特殊情况,若Yr=0,则 于是性能指标变为,这时问题归结为:用不大的控制能量,使系统输出Y(t)保持在零值附近输出调节器问题。,8,若Yr(t)0,则 于是性能指标可写为,这时问题转化为:用不大的控制量,使系统输出Y(t)紧紧跟随Yr(t)的变化跟踪问题。,9,性能指标的物理意义 性能指标中的第一部分 称作终端代价,用它来限制终端误差e(tf) ,以保证终端状态X(tf)具有适当的准确性。性能指标中
4、的第二部分 称作过程代价,用它来限制控制过程的误差e(t),以保证系统响应具有适当的快速性。,10,性能指标中的第三部分 称作控制代价,用它来限制控制U(t)的幅值及平滑性,以保证系统安全运行。同时,它对限制控制过程的能源消耗也能起到重要的作用,从而保证系统具有适当的节能性。,整个性能指标物理意义:使系统在控制过程中的动态误差与能量消耗,以及控制结束时的系统稳态误差综合最优.,11,(1)二次型性能指标是一种综合型性能指标,它可以兼顾终端状态的准确性、系统响应的快速性、系统运行的安全性及节能性各方面因素。,说明:,(2)线性二次型最优控制问题的实质是:用不大的控制能量,来保持较小的输出误差,以
5、达到控制能量和误差综合最优的目的。,(3)控制时间的起点t0及终点tf,可能是由实际问题决定的客观参数,也可能是由设计者决定的主观参数设计者必须把希望达到的目标和t0 、 tf的选择联系起来。,12,(3)不同目标之间,往往存在着一定矛盾。 为能尽快消除误差并提高终端准确性,就需较强的控制作用及较大的能量消耗;而抑制控制作用的幅值和降低能耗,必然会影响系统的快速性和终端准确性合理折衷。,(4)无论容许控制如何选择,性能指标中各项的数值始终具有相同的符号。以极小值作为最优标准,结合问题的物理性质,各项符号均取正值。,13,性能指标中加权矩阵S,Q(t)和R(t) (1)加权矩阵中的各个元素之间的
6、数值比例关系,将直接影响系统的工作品质。提高S阵中某一元素的比重,说明更加重视与该元素对应的状态分量的终端准确性;提高Q(t)阵中某一元素的比重,说明希望与之对应的状态分量具有较好的快速响应特性(较小的暂态误差);提高R(t)阵中某一元素的比重,意味着需要更有效地抑制与之相应的控制分量的幅值及由它引起的能量消耗。,安排各加权阵的各个元素之间的关系,十分重要且十分困难!,14,(2) S取半正定, Q(t) 取半正定, R(t)必须取正定。,将S阵取为半正定,以便保证终端代价的非负性,但容许不考虑与之相应的终端误差。Q(t) 取半正定,以便保证暂态误差总和的非负性,但容许不考虑与之相应的暂态误差
7、。R(t)必须取正定,因为控制代价实际上反映控制过程的能量消耗。只要U(t) 不为零,控制过程中能量消耗当然不应等于零。,15,(3)由于终端代价只表示终端时刻tf时的性能,因此, S应为常数阵。至于Q(t)及R(t),可能取为常数阵,也可能取为时变阵为了适应控制过程的特殊需要。,在控制过程的初期出现的较大误差,并非系统品质不佳所致,而是由系统的初始条件引起的,因此,不必过分重视这种误差,以免引起控制作用U(t)不必要的过大冲击;控制过程的后期的误差直接与控制效果相关,必须给予足够的重视。只有把Q(t)和R(t)取为时变阵,才能适应控制过程的这类时变需求。,为了防止模型的失调,也需要Q(t)及
8、R(t)具有时变性质。,16,对容许控制U(t)和终态X(tf)的说明,(1) 在线性二次型问题的定义中,并没有直接提出对控制作用U(t)的不等式约束,但这并不等于在物理上不需要对U(t)进行必要的限制。实际上,用适当选择Q(t)和R(t)数值比例的方法,同样可以把U(t)的幅值限制在适当的范围之内。这样,就可以在保持闭环系统线性性质的前提下,实现对U(t)的限制。,(2)在定义问题时,也没有直接提出对终态X(tf)的要求。实际上,对终态的要求,是利用性能指标的终端代价来反映的,性能指标中的终端代价用于限制终端误差,它表明期望终态X(tf)尽量靠近误差信号e(t)=0所对应的状态。,17,5.
9、2 状态调节器问题,问题5.2.1 给定线性时变系统的状态方程和初始条件 其中X(t)是n维状态变量,U(t)是m维控制变量,A (t)是nn时变矩阵,B (t)是nm时变矩阵。性能指标是 其中,Q (t)是nn非负定对称的时变矩阵,R (t)是mm正定对称的时变矩阵,tf是给定的有限终端时刻,X(tf)是自由的终端状态,控制函数U(t)不受约束。,(5.2.1),一、有限时间状态调节器问题,(5.2.2),18,要求确定最优控制函数U*(t),使性能指标 达到最小值。,该最优控制问题是以较小的控制能量为代价,使状态变量X(t)保持在零值附近状态调节器问题;考虑到终端时间tf是有限的,故称为有
10、限时间状态调节器问题;相应的最优控制U*(t)称为最优调节作用或最优调节器。,19,解: 构造Hamilton函数 因为控制函数U(t)本身不受约束,所以有,(5.2.3),应用最小值原理来求解:,最优调节作用是协态变量(t)的线性函数。由于协态变量在实际系统中不存在,也无法检测到,式(5.2.3)的最优调节作用在工程上难以实现。,20,其中,P(t)是nn待定的时变矩阵。 对上式两边求导数,得,为了便于在工程上实现,需将调节作用U(t)表示成系统状态变量X(t)的函数。,令:,规范方程 为:,21,由于X(t)是任意的,所以有 由于终端状态X(tf)是自由的,故相应的协态变量的 终端值为 所
11、以,,矩阵黎卡提(Riccati)微分方程,矩阵黎卡提(Riccati)微分方程的边界条件,(5.2.4),又考虑,22,P(t)的3个重要性质,由微分方程理论的存在与唯一性定理,可以证明P(t)存在而且唯一。,对于任意的tt0,tf, P(t)均为对称阵,即P(t)PT(t)。,若R(t)是正定矩阵,Q(t)是半正定矩阵,则P(t)(t0ttf)是半正定矩阵; 若R(t)是正定矩阵, Q(t)是正定矩阵,则P(t)(t0ttf)是正定矩阵。,证明附后,23,对于任意的tt0,tf, P(t)均为对称阵,即P(t)PT(t),证明:将矩阵Riccati微分方程(5.2.4)两边转置,得:且边界
12、条件为:,也就是说,待定的时变矩阵P(t)及其转置PT(t)满足相同的微分方程和相同的边界条件。根据微分方程解的唯一性定理,得P(t)PT(t)。 由P(t)的对称性可知,式(5.2.4)中虽包含有n个标量方程,但是,其中只有n(n+1)/2个方程是独立的。,24,若R是正定矩阵,Q是半正定矩阵,则P(t)(t0ttf)是半正定矩阵;若R是正定矩阵, Q是正定矩阵,则P(t)(t0ttf)是正定矩阵。 证明:对于任意非零的初态X(t)(t0ttf),性能指标的最小值为 : 由于R是正定的,若Q是半正定的,则式(5.2.5)右端大于等于零,于是 故P(t)是半正定的。,(5.2.5),若Q是正定
13、矩阵,则式(5.2.5)右端大于零,于是 所以P(t)是正定的。,25,命题5.2.1 问题5.2.1的最优调节作用必为如下形式的状态反馈,其中,P(t)是矩阵黎卡提微分方程 满足边界条件 的对称解。,满足初始条件,的解。,并且状态最优轨线X*(t)是状态方程,26,若令 ,则有 其中,K(t)称为反馈增益矩阵。 构成一个状态反馈最优调节系统,如图所示。,27,说明: 设U(t)是任意的控制作用,X(t)是相应于U(t)的状态轨线,性能指标 除了依赖于U(t)之外,还依赖于状态初值X(t0)。因此,性能指标可记为,特别是当控制作用为最优值U*(t)时,性能指标记为,28,命题5.2.2 有限时
14、间状态调节器问题的最优控制U*(t)的充要条件是: 且性能指标的最小值为:,(证明略),命题5.2.3 有限时间状态调节器问题的最优控制U*(t)存在且唯一。,证明:1存在性由于U*(t)=R1BTP(t)X(t) ,而P(t)是存在的,故U*(t)亦存在。 2唯一性 应用反证法。(略),29,定理5.2.1 给定线性时变系统的状态方程 其中,U(t)不受约束。,其中,P(t)是矩阵黎卡提微分方程,满足边界条件,的唯一对称解。,则最优控制存在且唯一,最优控制的充要条件是:,初始条件X(t0)=X0,性能指标为:,30,并且,当Q为半正定对称矩阵时,P(t)(t0ttf)是半正定对称矩阵;而当Q
15、为正定对称矩阵时,P(t)是正定对称矩阵。,满足初始条件X(t0)=X0的解。,状态最优轨线是下列状态方程,性能指标的最小值为,31,定理5.2.1的几点说明:,线性二次型最优控制律是一个线性状态反馈控制律,便于实现闭环最优控制;只要时间区间 t0, tf是有限的,Riccati方程的解P(t)就是时变的,最优反馈系统为线性时变系统,即使矩阵A,B,Q,R为常数矩阵线性定常系统且Q,R为常数矩阵, P(t)仍时变.,32,如果给定线性时变系统,定理5.2.1应作如何调整?,性能指标为:,边界条件由P(tf)=S改为P(tf)=0即可。,33,Riccati方程为非线性矩阵微分方程P(t)的解析
16、解P(t)的数值解,34,例5.2.1 泛函求极值,试求矩阵Riccati微分方程的解析解P(t)以及Kalman增益K(t)。,s.t.,35,例5.2.2 泛函求极值,试求Kalman增益K(t),并观察tf对K(t)的影响。,s.t.,36,(1),(2),(3),37, % (1) tf=10,P(tf)=k=0 S=dsolve(Dp=p+p2-2,p(10)=0) t=0:0.1:10; K=double(subs(S); plot(t,K,k);axis(0,10,0,2) xlabel(t(sec.) ylabel(K(t) gtext(t_f=10,k=0) hold on,
17、用MATLAB绘制K(t):,38,例5.2.3 设调节对象的状态方程为:,其中s0,q0,r0,要求确定最优调节作用和状态最优轨线。,性能指标为,39,由积分方程得其中,40,最优调节作用:,状态最优轨线:,41,最优调节的闭环系统方框图:,42,P(t)变化曲线,43,x(t)变化曲线,44,u(t)变化曲线,45,不同终端时刻tf下的p(t)曲线,tf越大,P(t)保持恒定值的时间区间越大。只要把tf取得足够大,在t0,tf的大部分时间内, P(t)可视为恒定。,46,例5.2.4 设调节对象的状态方程为:,求最优控制u*(t)使得性能指标为最小。,性能指标为:,初始条件为:,并通过Si
18、mulink画出x1, x2及u在0,3s内变化曲线。,求矩阵Riccati微分方程的解P(t)。,47,Riccati方程为非线性矩阵微分方程,通常无法获得其解析解,只能采用计算机逆时间方法求数值解!,微分方程个数?,48,例5.2.5 泛函求极值,s.t.,试求矩阵Riccati微分方程的解P(t) 。,49,1、在已定义好的用户目录下,建立M文件,用来存入微分方程(组),无初始条件。2、把用户目录设置为当前目录。3、建立M文件,用函数ode45求解微分方程,并画出P(t)。,在MATLAB中求解上述微分方程步骤:,50,51,二、无限时间状态调节器问题,有限时间状态调节器问题中,所得到最
19、优调节作用是状态变量的线性函数,可以实现状态反馈的闭环控制。但是,其反馈增益矩阵却是时变的。,工程实现上是极不方便的。定常的反馈增益矩阵,易于工程实现。当线性定常系统是完全可控的,并且终端时刻tf趋于无限时,就可得到非时变的状态调节器,此时的反馈增益矩阵是一个定常矩阵。,1、无限时间定常状态调节器,52,问题5.2.2 给定完全可控线性定常系统的状态方程和初始条件 以及性能指标 其中Q和R都是定常对称正定矩阵。 假定U(t)不受约束,要求确定最优调节作用U*(t),使性能指标达到最小值。,注意:终端时刻tf为无限值,故称为无限时间状态调节器问题,也称为非时变状态调节器问题。,53,由定理5.2
20、.1可知,对于给定的系统 使性能指标 达到最小值的最优调节作用为,其中,P(t)是矩阵黎卡提微分方程满足边界条件 的正定对称解。,无限时间的状态调节器问题,可看作有限时间的状态调节器问题中,令tf时的极限情况来处理:,54,可以证明:正定对称矩阵P(t)的每个元素pij(t) ( i,j=1,2,3,n)随时间变化的情况如下图所示。当tf很大时,随着t的减小pij(t)将达到稳定值 ,并且随着tf的增加,此稳态值的时间区间将加宽。当tf时,此稳态值的时间区间也将趋于无穷大。,而,当给定的系统完全可控时,55,当tf时,矩阵黎卡提微分方程就转化为矩阵黎卡提(Riccati)代数方程:,所以系统
21、在性能指标为,性能指标可表示为,时的最优调节作用为,56,的唯一正定对称解。,定理5.2.2 给定线性定常系统的状态方程和初始条件,其中,A,B为定常矩阵,系统(A,B)完全可控,控制函数U(t)不受约束。性能指标为,使性能指标J达到最小值的最优调节作用为,其中, 是矩阵黎卡提代数方程,其中,Q和R是定常对称正定矩阵。,57,满足初始条件 的解。,而状态最优轨线X*(t)是状态方程,性能指标的最小值为,58,说明:,为保证积分值有限,x和u均要收敛到0。如果系统可控,则可通过状态反馈任意配置闭环极点,使系统AS,即:对于无限时间状态调节器,终端状态必须为零,即X()=0。,要求系统完全可控,
22、是为了为了保证性能指标的积分为有限值,从而保证最优解存在;,由于X()=0,所以在性能指标中设置终端代价是多余的。,线性定常系统无限时间状态调节器所构造的闭环系统是时不变的。,59,证明:利用反证法来证明该定理。,定理5.2.3 定理5.2.2中的闭环最优调节系统,是渐进稳定的。,假设系统不是渐进稳定的,则A1必具有非负实部的特征根。于是,当tf时,状态变量X(t)不会趋于零,令,60,定常矩阵 的计算方法直接求解黎卡提代数方程首先求解黎卡提微分方程 得到其解为 然后令tf,t=0或者tf=0,t ,则可得到 。,61,2、无限时间时变状态调节器,问题5.2.3 给定线性时变系统的状态方程和初
23、始条件,及性能指标,控制向量u(t)无约束.,确定最优控制u(t)使指标达到极小.,62,定理5.2.4,若系统A(t),B(t)完全可控,其中,则存在唯一的最优控制:,最优性能指标为:,P(t)满足Riccati矩阵微分方程:,正定对称,注意:对于有限和无限时间时变状态调节器,最优控制增益都是时变矩阵,最优控制都是时变的。,63,例5.2.6 二阶系统的状态方程: 最优控制u*(t)应使性能指标 取极小值。试求出最优控制u*(t) ,并绘出最优反馈系统的结构图。,64,最优控制为,最优控制为:,Riccati代数方程:,65,系统的最优反馈结构图:,66,例5.2.7 已知系统状态方程: 性
24、能指标,已知,求最优控制u*(t).,67,Riccati代数方程:,68,69,状态调节器稳定性能的改善引入积分作用,状态调节器是一个比例调节器,因而系统最后稳定时存在余差。,设线性定常系统状态方程为,设希望有积分作用的那些状态变量构成的一个p维向量,令,其中,E为元素为0或1的pn矩阵。利用构成一个n+p维的增广状态变量:,70,从而得到增广状态方程为,其中,性能指标为,最优状态调节器为:,从而引进了积分作用,使闭环系统稳态误差得以改善。,71,5.3 输出调节器问题,问题5.3.1 给定完全可观测的线性时变系统(LTV)的状态方程和输出方程 以及性能指标 其中,S、Q(t)是半正定对称矩
25、阵,R(t)是正定对称矩阵,tf是有限的终端时刻,控制函数U(t)不受约束。 要求确定最优调节作用U*(t),使性能指标达到最小值。,输出调节器问题:其实质是用不大的控制能量,使输出变量Y(t)保持在零值附近。,1、有限时间输出调节器问题,72,考虑到输出方程,性能指标可写为:,加权矩阵为S、Q(t)的有限时间输出调节器问题,加权矩阵为S 、 Q(t)的有限时间状态调节器问题,可以利用有限时间状态调节器定理5.2.1来求解!,73,注意: 要求系统A(t),C(t)在t0时刻必须是完全可观测的!,74,引理: 若系统 完全可观,且S、Q(t)是半正定对称矩阵,则有:,75,定理5.3.1 已知
26、线性时变系统的状态方程为:,性能指标为,则能使系统从初态 转移到终态 ,并使性能指标最小的最优控制 存在且唯一:,若系统A(t),C(t)在t0时刻必须是完全可观测的,,76,其中, 是nn对称矩阵,其值为黎卡提微分方程的唯一解,满足的边界条件为,系统的最优轨线是以下微分方程的解:,性能指标的最小值为,77,最优输出调节器系统的结构图,78,有限时间输出调节器问题:,(1)最优输出调节器仍是全状态反馈;,(2)若系统完全可观,则可由 经状态观测器复现;,(3)若系统不完全可观,则部分 无法复现,只能用输出反馈代之,这样必然会丢失部分信息,输出反馈能达到的最小性能指标总要大于状态反馈能达到的最小
27、性能指标,从而使设计出的调节器为次优调节器。,(4)状态调节器与输出调节器的Riccati方程不全相同,故其解 也不同,反馈增益矩阵 也不同。,(5)性能指标最小值也不能由输出向量来确定,只能由状态向量确定。,79,2、无限时间的输出调节器问题,性能指标为:,目标为:确定最优控制u,使要求的指标达到极小.,给定线性定常系统(LTI)的状态方程和输出方程,80,同时要求系统(A,B,C)是完全可控和完全可观测的!,无限时间的状态调节器问题,无限时间的输出调节器问题,81,线性定常 输出调节器,若系统是完全能控能观的,使性能指标,定理5.3.2 已知线性定常系统的状态方程及初始状态,取最小的最优控
28、制为,82,性能指标的最小值为,其中,Q和R是定常的正定对称矩阵,P满足以下Riccati代数方程:,最优轨线 是下列方程的解:,83,例5.3.1 受控系统的传递函数为: 性能指标为: 试求解并绘出最优反馈结构。 解: 令,(4.4.4),84,则得系统的状态方程和输出方程为 所以 由于,85,所以 故该系统(A,B,C)是完全可控和完全可观测的。又由于R=r0是正定的,最优调节作用为,86,其中P是下列黎卡提代数方程的正定对称解 考虑到P为对称的,所以 。根据上面矩阵方程,可得下面代数方程组,87,因为P是正定的,所以 解上面代数方程组,得到 故最优调节作用为,正定,各阶主子式大于零,88
29、,系统的最优反馈结构如图所示,,89,问题5.4.1 给定完全可观测的线性时变系统(LTV)的状态方程和输出方程,跟踪问题:用不大的控制能量,使系统输出变量Y(t)跟踪Yr(t)的变化,称为跟踪问题。,1、有限时间时变跟踪问题,5.4 跟踪问题,Yr(t)表示预期输出变量,则有 e(t)= Yr(t)Y(t) 称为误差向量。,其中,S、Q(t) 半正定对称矩阵,R(t) 正定对称矩阵, tf是有限的终端时刻,控制函数U(t)不受约束。,以及性能指标,要求确定最优调节作用U*(t),使性能指标达到最小值。,90,解:应用最小值原理来求解这个问题,首先构造Hamilton函数:,91,定理5.4.1 已知线性时变系统的状态方程为:,性能指标为,使性能指标最小的最优控制 存在且唯一:,若系统A(t),C(t) 是完全可观测的,,92,其中, 是nn半正定对称矩阵,其值为黎卡提微分方程,系统的最优轨线是以下微分方程的解:,的唯一解,满足的边界条件为,g(t)为n维伴随向量,满足如下方程:,边界条件为,93,若系统是完全能控能观的,使性能指标,定理5.4.2 已知线性定常系统的状态方程及初始状态,取最小的近似最优控制 为,2、无限时间定常跟踪问题,r,其中,,94,例5.4.1,已知状态方程:,性能指标:,求近似最优控制u(t), 其中e=a-y, a为常值.,
链接地址:https://www.31ppt.com/p-1358441.html