[工学]现代控制理论论文.doc
《[工学]现代控制理论论文.doc》由会员分享,可在线阅读,更多相关《[工学]现代控制理论论文.doc(38页珍藏版)》请在三一办公上搜索。
1、最优控制方法及其应用 最优控制方法及其应用摘要:主要阐述了关于最优控制问题的基本概念,最优控制是最优化方法的一个应用。最优化一般可以分为最优设计、最优计划、最优管理和最优控制四个方面。而最优控制理论是研究和解决从一切可能的控制方案中寻找最优解的一门学科,解决最优控制问题的主要方法有变分法、极大值原理和动态规划。常使用到的主要有时间最短控制问题和线性二次型最优控制问题等。通过以上知识的了解和应用可以使初学者能够快速掌握最优控制的问题。关键字:最优化 最优控制 极值 时间最优控制 线性二次型目 录第一章 最优控制的基础41.1 最优控制理论41.2 最优控制问题的一般形式51.3 最优控制方法6第
2、二章 变分法72.1 变分法基础72.2 变分法应用7第三章 极大值原理103.1 极大值原理的提出和形式10 3.2 极大值原理的应用11第四章 动态规划方法13 4.1 动态规划概念及意义134.2 动态规划算法的基本思想和结构134.3 动态规划算法的运用14第五章 时间最优控制问题16第六章 线性二次型最优控制问题206.1 线性二次型最优控制问题的提出206.2 应用MATLAB求解二次型最优控制问题(实验部分)22第七章 关于倒立摆的最优控制34结束语39参考文献39第一章 最优控制的基础 1.1 最优控制理论 最优控制理论是研究和解决从一切可能的控制方案中寻找最优解的一门学科。它
3、是现代控制理论的重要组成部分。最优控制是最优化方法的一个应用,如果想了解最优控制必须知道什么是最优化方法。所谓最优化方法为了达到最优化目的所提出的各种求解方法。从数学意义上说,最优化方法是一种求极值的方法,即在一组约束为等式或不等式的条件下,使系统的目标函数达到极值,即最大值或最小值。从经济意义上说,是在一定的人力、物力和财力资源条件下,使经济效果达到最大(如产值、利润),或者在完成规定的生产或经济任务下,使投入的人力、物力和财力等资源为最少。最优控制是现代控制理论的核心,它研究的主要问题是:在满足一定约束条件下,寻求最优控制策略,使得性能指标取极大值或极小值。这方面的开创性工作主要是由贝尔曼
4、(R.E.Bellman)提出的动态规划和庞特里亚金等人提出的最大值原理。 从数学上看,确定最优控制问题可以表述为:在运动方程和允许控制范围的约束下,对以控制函数和运动状态为变量的性能指标函数( 称为泛函 ) 求取极值( 极大值或极小值)。解决最优控制问题的主要方法有古典变分法(对泛函求极值的一种数学方法)、极大值原理和动态规划。最优控制已被应用于综合和设计最速控制系统、最省燃料控制系统、最小能耗控制系统、线性调节器等。Pontryagin 的最大值原理、Bellman 的动态规划方法和Kalman 的最优线性调节器的理论被公认为现代控制理论的三大里程碑,这些奠基性的成果标志着最优控制理论的正
5、式诞生。1 最优控制理论是经典变分学在现代的新发展,其研究基础涉及函数论、拓扑学、泛函分析、微分方程、变分学等多个数学分支的知识。时而至今,最优控制理论的研究无论在深度和广度上都有了很大的发展,例如对分布参数系统,随即系统,大系统的最优控制理论的研究等等。 1.2 最优控制问题的一般形式 假设一个控制系统的状态方程、控制域U、控制函数类 以及某些约束条件均已给定,且相应的容许控制类Uad.记全体容许对所成的集合为Aad. 任一映射 JAad;R 称为该控制系统的一个指标泛函。对于含有时滞的系统,在选取或设计指标泛函J时,有时也需要根据问题的实际意义将时滞因素考虑在内。最优控制问题就是:对于给定
6、的指标泛函J,寻求适当的 y,u Aad ,使得 Jy,u=Jinf Jy,u|y,uAad. (1.2.1)如果这样的容许对 y,u 存在,则称该最优控制问题有解;称满足(1.2.1)的任一个容许对y,u 为最优控制问题的一个最优对,其中的u 称为该最优控制问题的一个解或最优控制,y 称为该最优控制问题的一条最优轨线。1控制问题就是针对给定的控制系统和约束条件研究控制函数的不同选择对于系统某些方面的影响,例如系统是否稳定、是否能控、能观或能稳、是否存在某类反馈控制、在某种标准下是否能达到最优等,而且指出了明确的研究目的,才能说给定了一个控制问题。一般说来,在研究控制系统时,我们还需要将一些其
7、他的附加因素考虑在内,这些因素往往是由具体问题的实际背景或理论研究的必要前提确定的。最优控制应用举例:火车快速运行问题。设有一列火车从甲地出发,要求算出容许的控制使其到达乙地的时间最短。火车的运动方程 mx=ut (1.2.2) 式中,m 是火车的质量,x是火车的加速度。为使旅客舒适,其值有限制。ut是产生加速度的控制作用,其值也应有限制,设 |ut|M (1.2.3)初始条件 xt0=x0 xt0=0 (1.2.4) 中断条件 xtf=xf xtf=0 (1.2.5) 性能指标 Ju=t0tfdt=tf-t0 (1.2.6)选择ut使得 Ju为最小。 1.3 最优控制方法解决最优控制问题的主
8、要方法有古典变分法(对泛函求极值的一种数学方法)、极大值原理和动态规划。研究最优控制问题有力的数学工具是变分理论,而经典变分理论只能够解决控制无约束的问题,但是工程实践中的问题大多是控制有约束的问题,因此出现了现代变分理论。现代变分理论中最常用的有两种方法。一种是动态规划法,另一种是极小值原理。它们都能够很好的解决控制有闭集约束的变分问题。值得指出的是,动态规划法和极小值原理实质上都属于解析法。此外,变分法、线性二次型控制法也属于解决最优控制问题的解析法。最优控制问题的研究方法除了解析法外,还包括数值计算法和梯度型法。第二章 变分法 2.1 变分法基础 变分法(calculus of vari
9、ations)是处理函数的函数的数学领域,和处理数的函数的普通微积分相对。譬如,这样的泛函可以通过未知函数的积分和它的导数来构造。变分法最终寻求的是极值函数:它们使得泛函取得极大或极小值。有些曲线上的经典问题采用这种形式表达:一个例子是最速降线,在重力作用下一个粒子沿着该路径可以在最短时间从点A到达不直接在它底下的一点B。在所有从A到B的曲线中必须极小化代表下降时间的表达式。 变分法的关键定理是欧拉拉格朗日方程。它对应于泛函的临界点。在寻找函数的极大和极小值时,在一个解附近的微小变化的分析给出一阶的一个近似。它不能分辨是找到了最大值或者最小值(或者都不是)。 变分法在理论物理中非常重要:在拉格
10、朗日力学中,以及在最小作用原理在量子力学的应用中。变分法提供了有限元方法的数学基础,它是求解边界值问题的强有力工具。它们也在材料学中研究材料平衡中大量使用。而在纯数学中的例子有,黎曼在调和函数中使用狄利克雷原理。 同样的材料可以出现在不同的标题中,例如希尔伯特空间技术,莫尔斯理论,或者辛几何。变分一词用于所有极值泛函问题。微分几何中的测地线的研究是很显然的变分性质的领域。极小曲面(肥皂泡)上也有很多研究工,称为Plateau问题。 最优控制的理论是变分法的一个推广。 2.2 变分法应用如果变量J 对于某一函数类中的每一个函数xt,都有一个确定的值与之对应,那么就称变量J 为依赖于函数xt的泛函
11、,记为:J=Jxt。 (2.2.1)xt Rn, JR 函数 xt tx泛函 Jxt xtJ;xt又称为泛函的宗量,也可以理解为“函数的函数”说明:泛函是映射,是从函数空间到数域的映射。泛函的自变量是函数,泛函的自变量称为泛函的宗量。容许函数空间是满足泛函的规定条件的宗量的全体所构成的函数空间。求函数的极值时,微分或导数起着重要的作用。求泛函的极值时,变分起着类似的作用。我们将求泛函的极值问题称为变分问题,其相应的方法称为变分法。特别是对无约束的最优控制,通常用变分法求解。2泛函的变分(相当于函数的微分) (2.2.2) (2.2.3) (2.2.4)由于泛函J所依赖的函数总要受到受控系统状态
12、方程的约束,应用拉格朗日乘子法,将有约束泛函极值问题转化为无约束的泛函极值问题。这是引入哈密顿函数的拉格朗日型最优控制问题。 (2.2.7) (2.2.8) (2.2.9) (2.2.10)2、求解最优控制的步骤第三章 极大值原理 3.1 极大值原理的提出和形式为了解决古典变分法在求解最优控制问题中所暴露出来的一些无法避免的问题,许多学者进行了各种探索,其中以苏联学者 Pontryagin 的最大值原理于美国学者贝尔曼的动态规划较为成功,应用也比较广泛,现已经成为求解最优控制问题的强有力的工具。 极大值原理的基本形式对于定常系统的最优控制问题的极大值原理可表述如下:如果最优控制问题的数学模型为
13、:受控系统 Xt=fXt,Ut,t (3.1.1)其初态 xt0=x0, tt0,tf (3.1.2)目标集 g1xtf=0 , g2xtf0 (3.1.3)容许控制 uU性能指标 反映和评价系统性能优劣的指标。性能指标的形式由实际问题来决定,通常有两种类型:表示系统在末时刻状态的性能指标称为末值型性能指标,记为 Sxtf,tf。在这里,设性能指标为 JXt= Sxtf JXt 为控制函数的泛函 (3.1.4)末时刻 tf自由 则U*(t)为最优控制, X*(t)为最优轨线和 tf为最优的末时刻的必要条件有五项。3 X*t 满足方程 X*=fx*,u*, x*t0=x0, tt0,tf* (3
14、.1.5) t 满足方程 =-Hx*,u*,x (3.1.6)式中 Hx*,u*,=Ttfx,u 称为给定问题的哈密顿函数,Tt为t的转置。t称为状态xt的伴随状态,而其方程称为伴随方程。tf满足方程 tf= -0Sx*tfx-g1x*tfx-g2x*tfx (3.1.7)式中00为标量,和为向量,它们是不全为零的待定量,且有 g2x*tf=0, 通常称此条件为横截条件。 u*(t) 满足条件 Hx*,u*,=umaxHx*,u*, (3.1.8) 确定tf 的方程为 Hx*t,u*t,*t=Hx*tf,u*tf,*tf=0 (3.1.9) 3.2 极大值原理的应用 极大值原理是对古典变分法的
15、发展。它不仅可以用来求解函数Ut不受约束或只受开集性约束的最优控制问题,而且也可以用来求解控制函数Ut受到闭集性约束条件的最优控制问题。这就意味着极大值原理放宽了对控制问题Ut的要求。 极大值原理没有提出哈密顿函数H对控制函数Ut的可微性的要求,因此,其应用条件进一步也放宽了。由极大值原理求得的最优控制Ut使得哈密顿函数H达到全局、绝对最大值,而古典变分法的极值条件HU=0所得的解是H的局部、相对最大值或驻值。因此,极大值原理将古典变分法求解最优控制问题的极值条件作为一个特例概括在自己之中。 极大值原理是最优控制问题的必要条件,并非充分条件。也就是说,由极大值原理所求的的解能否使性能泛函J达到
16、极小值,还需要进一步分析与判定。但是,如果根据物理意义已经能够断定给定所讨论的最优控制问题的解是存在的,而极大值原理所得到的解只有一个,那么,该解就是最优解。实际上,我们遇到的问题往往就是属于这种情况。1利用极大值原理和古典变分法求解最优控制问题时,出来控制方程的形式不同之外,其余条件是相同的。一般来说,根据极大值原理确定最优控制U*(t)和最优轨线X*(t)仍然需要求解两点边界值问题。极大值原理一般由对偶方程、非平凡性条件、横截条件和最大值条件几部分构成。对于不同类型的最优控制问题,其对偶方程、横截条件等形式也将不同,从而其极大值原理的表述形式也将不同。其中有:半线性发展系统的最大值原理、拟
17、线性时滞抛物系统的最大值原理以及约束最大值原理等。2一般型最优控制问题的极大值原理分为终端时刻固定,终端状态自由和受限两种。在此就不一一举例进行运用说明。第四章 动态规划方法 4.1 动态规划概念及意义动态规划(dynamic programming)是运筹学的一个分支,是求解决策过程(decision process)最优化的数学方法。20世纪50年代初美国数学家R.E.Bellman等人在研究多阶段决策过程(multistep decision process)的优化问题时,提出了著名的最优化原理(principle of optimality),把多阶段过程转化为一系列单阶段问题,利用各
18、阶段之间的关系,逐个求解,创立了解决这类过程优化问题的新方法动态规划。1957年出版了他的名著Dynamic Programming,这是该领域的第一本著作。动态规划问世以来,在经济管理、生产调度、工程技术和最优控制等方面得到了广泛的应用。例如最短路线、库存管理、资源分配、设备更新、排序、装载等问题,用动态规划方法比用其它方法求解更为方便。虽然动态规划主要用于求解以时间划分阶段的动态过程的优化问题,但是一些与时间无关的静态规划(如线性规划、非线性规划),只要人为地引进时间因素,把它视为多阶段决策过程,也可以用动态规划方法方便地求解。 4.2 动态规划算法的基本思想和结构动态规划算法通常用于求解
19、具有某种最优性质的问题。在这类问题中,可能会有许多可行解。每一个解都对应于一个值,我们希望找到具有最优值的解。动态规划算法与分治法类似,其基本思想也是将待求解问题分解成若干个子问题,先求解子问题,然后从这些子问题的解得到原问题的解。与分治法不同的是,适合于用动态规划求解的问题,经分解得到子问题往往不是互相独立的。若用分治法来解这类问题,则分解得到的子问题数目太多,有些子问题被重复计算了很多次。如果我们能够保存已解决的子问题的答案,而在需要时再找出已求得的答案,这样就可以避免大量的重复计算,节省时间。我们可以用一个表来记录所有已解的子问题的答案。不管该子问题以后是否被用到,只要它被计算过,就将其
20、结果填入表中。这就是动态规划法的基本思路。具体的动态规划算法多种多样,但它们具有相同的填表格式。动态规划程序设计是对解最优化问题的一种途径、一种方法,而不是一种特殊算法。不像前面所述的那些搜索或数值计算那样,具有一个标准的数学表达式和明确清晰的解题方法。动态规划程序设计往往是针对一种最优化问题,由于各种问题的性质不同,确定最优解的条件也互不相同,因而动态规划的设计方法对不同的问题,有各具特色的解题方法,而不存在一种万能的动态规划,可以解决各类最优化问题。因此在学习时,除了要对基本概念和方法正确理解外,必须具体问题具体分析处理,以丰富的想象力去建立模型,用创造性的技巧去求解。根据上例分析和动态规
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 工学 现代 控制 理论 论文
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-4533306.html