《毕业设计(论文)二次型性能指标单神经元控制.doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)二次型性能指标单神经元控制.doc(74页珍藏版)》请在三一办公上搜索。
1、摘 要PID控制由于其算法简单、鲁棒性好及可靠性高,被广泛应用于过程控制和运动控制中,尤其适用于可建立精确数学模型的确定性系统。然而实际工业生产过程往往具有非线性、时变不确定性,难以建立精确的数学模型,应用常规PID控制器不能达到理想的控制效果。为了克服传统PID控制的弱点,控制界已经提出了大量的对PID控制的改进方案。但这些方案一般是针对某些具体问题,缺乏通用性,附加的结构或算法也增加了控制器的复杂性,使它们的广泛应用受到限制。近年来,随着神经元网络的研究和应用,人们开始采用神经元网络和PID控制相结合,以便改进传统PID控制的性能,这种将神经元网络和PID控制相结合的研究已经得到了一些结果
2、。由具有自学习和自适应能力的单神经元构成的单神经元自适应智能PID控制器,不但结构简单,而且能适应环境变化,有较强的鲁棒性。借助最优控制中二次型性能指标的思想,在加权系数的调整中引入二次型性能指标,使输出误差和控制增量加权平方和为最小来调整加权系数,从而间接实现对输出误差和控制增量加权的约束控制。关键词:二次型,单神经元,PID控制,自适应Quadratic Performance Control via Single NeuronABSTRACTPID control is widely used in motion control and process control because o
3、f its simple algorithm, good robust and reliability, particularly applicable to the certain systems of establish a precise mathematical model. Nevertheless, the actual production process are often nonlinear, uncertain time-varying, it is difficult to establish a precise mathematical model, the conve
4、ntional PID control can not achieve the desired effect. To overcome the weaknesses of traditional PID control, a lot of improve projects of the PID control have been put forward in the control industry. However, these projects are generally targeted at certain specific issues, the lack of universali
5、ty. Additional structural or algorithm increased the complexity of the controller, restrict their wide use.Recently, with the research and application of neural networks, neural networks and PID controller have been combined to improve the performance of conventional PID control, the research of com
6、bination of neural networks and PID control has some results.Single neuron adaptive intelligent PID controller combined with self-learning and adaptive capacity of single neurons is not only simple structure and adapt to changing environments, has good robust. By dint of the idea of quadratic perfor
7、mance indicators in optimization control, the quadratic performance indicators are imported in the adjustment coefficient to decrease the square sum of the error of output and increment control into least, to restrict the error of output and increment control indirectly.Key words: quadratic, single
8、neuron, PID control, self-adaption二次型性能指标单神经元控制0 引言自20世纪40年代以来,传统控制理论得到了快速的发展,形成了完整的理论体系和控制系统的大规模产业化。20世纪70年代以来的近30年,为了解决航天、军事、工业、社会系统等复杂的控制任务,控制理论以科学史上前所未有的速度经历了现代控制理论和大系统理论两个重要的发展阶段,但是,他对精确数学模型的依赖性,使其应用受到很大的限制。无论是现代控制理论还是大系统理论,其分析、综合和设计都是建立在严格和精确的数学模型基础之上的。而在科学技术和生产力水平高速发展的今天,人们对大规模、复杂和不确定性系统实行自动控
9、制的要求不断提高。因此,传统的基于精确数学模型的控制理论的局限性日益明显。在传统的控制中,往往只考虑控制系统和受控对象所组成的“独立”体系,忽略了环境所施予的影响,而现在的大规模复杂的控制和决策问题,必须把外界环境和对象,以及控制系统作为一个整体来进行分析和设计。传统的控制理论虽然也有办法对付控制对象的不确定性和复杂性,如自适应控制和鲁棒(Robust)控制也可以克服系统中所包含的不确定性,达到优化控制的目的。但是自适应控制是以自动调节控制器的参数,使控制器与被控对象和环境达到良好的“匹配”,以削弱不确定性的影响为目的。从本质上来说,自适应和自校正控制都是通过对系统某些重要参数的估计,以补偿的
10、方法来克服干扰和不确定性。在实际应用中,尤其在工业过程控制中,由于被控对象的严重非线性,数学模型的不确定性,系统工作点变化剧烈等因素,自适应和鲁棒控制存在着难以弥补的严重缺陷,其应用的有效性受到很大的限制,这就促使人们提出新的控制技术和方法。智能控制与传统的控制理论相比,它对于环境和任务的复杂性有更大的适配程度。它不仅是对建立的模型,而且对环境和任务能抽取有多级的描述精度,进而发展了自学习、自适应和自组织等概念,所以能在更广泛的领域中获得应用。神经元网络是智能控制的一个重要分支,神经元网络是以大脑生理研究成果为基础,模拟大脑的某些机理与机制,由人工建立的以有向图为拓扑结构的网络,它通过对连接或
11、断续的输入做状态响应而进行信息处理;神经元网络是本质性的并行结构,并且可以用硬件实现,它在处理对实时性要求很高的自动控制问题显示出很大的优越性;神经元网络是本质的非线性系统,多层神经元网络具有逼近任意函数的能力,它给非线性系统的描述带来了同意的模型;神经元网络具有很强的信息之间的冗余问题,能恰当地协调互相矛盾的输入信息,可以处理那些难以用模型或规则描述的系统信息。神经元网络的复杂系统的控制方面具有明显的优势,神经元网络控制和辨识的研究已经成为智能控制研究的主流。随着人工神经元网络(ANN)研究的进展,神经元网络越来越多地应用于控制领域的各个方面。它在系统的辨识、建模、自适应控制中特别受到重视,
12、尤其是它较好地解决了具有不确定性、严重非线性、时变和滞后的复杂系统的建模和控制问题。但是,不能不看到,在ANN实际应用的同时,有关系统的稳定性、能控性、能观性等理论问题,有关ANN控制系统系统化设计方法问题,ANN的拓扑结构问题,以及ANN与基于规则的系统有机结合问题,还有待于进一步研究和发展,一般神经元网络的弱点,制约了其在控制系统中的广泛应用。综上所述,传统控制方法和传统的神经元网络均不能单独胜任复杂系统的控制任务,需要研究新的更有效的控制方法。新方法产生的一个重要途径就是将现有的多种方法进行综合,通过它们的有机结合来取长补短。比例积分微分(PID)控制器是在工业过程控制中最常见的一种控制
13、调节器,它广泛应用于化工、冶金、机械、热工和轻工等工业过程控制系统中。PID有几个重要的功能:比例部分产生与偏差成正比的输出信号,以便消除偏差;积分部分产生与偏差的积分值成正比的输出信号,以便消除系统的静态误差;微分部分产生与偏差的变化率成正比的输出信号,以便加快控制器的调节速率,缩短过渡多成时间,减少超调。如果这三个部分配合适当,便可得到快速敏捷、平稳准确的调节效果。PID控制器特别适用于过程的动态性能是良性的而且控制性能要求不太高的情况。PID控制是分布式控制系统的一个重要组成部分,它也包含在许多特殊目的的控制系统中。在工业过程控制中,95以上的控制回路具有PID结构,而大多数回路实际上都
14、是PI控制。PID控制器的许多有用的特性由于被认为是商业秘密而没有被广泛传播,典型的例子如模式切换和防止积分饱和等技术。 PID控制器的设计关键问题是如何选择比例、积分和微分系数,而这些参数的整定的困难使PID控制器的应用受到限制。实际上,PID控制规律是一种线性的控制规律,它也具有传统控制理论的弱点,仅在简单的线性单变量系统中有较好的控制效果,而在复杂系统的控制中效果不佳。 近年来,随着神经元网络的研究和应用,人们开始采用神经元网络和PID控制相结合,以便改进传统PID控制的性能,这种将神经元网络和PID控制相结合的研究已经得到了一些结果。本文主要分五个章节,第一章着重介绍神经网络,神经网络
15、的发展、人工神经网络的概述。第二章是PID和神经网络控制,PID控制和神经网络控制的简单介绍。第三章为神经PID控制,是神经网络控制和PID控制的结合,主要介绍基于二次型性能指标的单神经元控制。第四章是编程和设计,首先是对MATLAB以及SIMULINK进行介绍,然后以MATLAB作为操作平台,应用最优二次型性能指标学习算法进行仿真研究。第五章介绍了二次型性能指标的PSD控制。最后第六章进行了全文的小结。1 神经网络1.1 生物神经元的结构神经元即神经细胞是神经系统的基本单元,复杂的神经网络就是由数目众多的、各种类型的神经元按不同的结合方式构成的。通过神经元的可塑性,将使人脑具有学习、记忆和认
16、识等各种智能。人体内神经元的结构形式之间存在着很大差异,但它们都具有图1.1所示的一些共同形式。它是由细胞体和细胞体发出的一个或多个突起所组成,其中,大部分突起起着感受作用,用来接受其它神经元传来的信息,这些突起称为树突:通常还有一个突起用来传递和输出信息,这个突起称为轴突。图1.1 生物神经元结构树突可以看作是细胞体的延伸部,它自细胞体发出后逐渐变细,其全长各点都可以接受其它神经元的轴突末梢,形成突触。突触是一个神经元的轴突末梢与另一个神经元所形成的功能性接触界面,它决定了神经元之间的联接强度与性质.由于轴突神经末梢与树突一一对接,从而把众多的神经元构成了神经元网络。从生物控制论的观点,神经
17、元作为控制和信息处理的基本单元,具有诸如时空整合、兴奋与抑制、脉冲与电位转换、学习与遗忘等功能和特性。1.2 人工神经网络人工神经网络是受人脑和神经元细胞的启发而构成的一类信息处理系统。目前人们对人脑细胞间相互作用原理(即人类思考问题的机理)尚未十分清楚所以说人工神经网络只是人脑结构和功能的非常低级的模拟和近似。处理单元Processing Element(简称PE)就是人工神经元,其结构和功能与生物神经元有类似之处,可以说它是生物神经元的一阶近似,这是因为处理单元只模拟了生物神经元所能执行的150多个处理功能中的3个。PE的功能是:对每个输入信号进行处理以确定其强度(加权);确定所有输入信号
18、的组合效果(求和);确定其输出(转移特性)。就像生物神经元中有很多输入(激励)一样,PE也应有很多输入信号,并且同时加到PE上;PE以输出作为响应,PE的输出就象实际神经元那样,不但受输入信号的影响,同时也受内部其它因素的影响,这可用门限来等效;PE的每一输入都经过相关的加权,以影响输入的激励作用,这就象生物神经元中突触的可变强度,它确定了输入信号的强度;PE的初始加权可根据某确定规则进行调节修正,这也象生物神经元中的突触强度可受外界因素影响一样。1.2.1 人工神经网络的结构(1)前馈网络如图1.2所示,前馈网络具有分层的结构,通常包括输入层、隐层(也称中间层,可有若干层)和输出层。每一层的
19、神经元只接受上一层神经元的输入,并且该层神经元的输出分别有一个输出送给下一层的各神经元。输入信息经过各层的顺次传递后,直到输出层输出。神经网络按照拓扑结构属于以神经元为节点,以节点间有向连接为边的一种图。在前向网络中有计算功能的节点称为计算单元,而输入节点没有计算功能。图1.2 前馈网络(2)反馈网络如图1.3所示,从输出层到输入层有反馈的网络称为反馈网络。在反馈网络中,任意一个节点既可接收来自前一层各节点的输入,同时也可接收来自后面任一节点的反馈输入。另外,由输出节点引回到其本身的输入而构成的自环反馈也属反馈输入。反馈网络的每个节点都是一个计算单元。图1.3 反馈网络1.2.2 人工神经网络
20、的弱点随着人工神经元网络(ANN)研究的发展,神经元网络越来越多地应用于控制领域的各个方面。从过程控制、机器人控制、生产制造、模式识别直到决策支持都有许多应用神经元网络的例子。它在系统的辨识、建模、自适应控制中特别受到重视,尤其是它较好地解决了具有不确定性、严重非线性、时变和滞后的复杂系统的建模和控制问题。但是,不能不看到,在ANN实际应用的同时,有关系统的稳定性、能控性、能观性等理论问题,有关ANN控制系统系统化设计方法问题,ANN的拓扑结构问题,以及ANN与基于规则的系统有机结合问题,还有待于进一步研究和发展,一般神经元网络的弱点,制约了其在控制系统中的广泛应用,包括以下问题:(1) 一般
21、神经元网络的收敛速度很慢,训练和学习时间很长,这是大多数控制系统所不能接受的。(2) 在构成控制器时,一般神经元网络的结构选取,特别是隐含层单元个数的选取的无定则,还需要通过反复实验才能确定,这给实际应用带来困难。(3) 一般神经元网络连接权重初值多被取为随机数,存在陷入局部极小值的可能,使控制性能难以达到预期的效果;特别是由于连接权重值的随机性,很难保证控制系统初始运行的稳定性,而如果控制系统初始运行不稳定,失去了应用的基础。(4) 传统神经元网络的结构、参数和机能,难以与控制系统所要求的响应快、超调小、无静差等动态和静态性能指标相联系。(5) 传统神经元网络在构成控制器时,为了满足系统性能
22、要求,大量增加隐含层神经元个数,网络的计算量很大,使在当前的技术水平下很难保证控制的实时性。(6) 具有任意函数逼近能力的多层前向神经元网络是应用最多的一种神经元网络,但传统的多层前向神经元网络的神经元仅具有静态输入-输出特性,在用它构成控制系统时必须附加其他动态部件。1.2.3 人工神经网络的应用20世纪80年代以来,神经网络和控制理论与控制技术相结合,发展为自动控制领域的一个前沿学科。它是智能控制的一个重要分支,为解决复杂的非线性、不确定系统的控制问题开辟了一条新的途径。神经网络用于控制系统,已取得以下主要进展:(1) 系统辨识 在自动控制问题中,系统辨识是为了建立被控对象的数学模型。多年
23、来控制领域对于复杂的非线性对象的辨识,一直未能很好的解决。神经网络所具有的非线性特性和学习能力,使其在系统辨识方面有很大的潜力。基于神经网络的系统辨识是以神经网络作为被辨识对象的模型,利用其非线性特性,可建立非线性系统的静态或动态模型。(2) 神经控制器 控制器在实时控制系统中起者“大脑”作用,神经网络具有自学习和自适应等特点,因而非常适合于做控制器。对于复杂非线性系统,神经网络所达到的控制效果往往明显好于常规控制器。近年来,神经网络控制在工业、航空以及机器人等领域的控制系统应用中已取得许多可喜的成就。(3) 智能检测所谓智能检测一般包括干扰量的处理、传感器输入输出的非线性特性补偿、量程的自动
24、校正以及自动诊断等。这些智能检测功能可以通过传感元件和信号处理元件的功能集成来实现。随着智能化程度的提高,功能集成型已逐渐发展为功能创新型,如复合检测、特征提取及识别等,而这类信息处理问题正是神经网络的强项。在对综合指标的检测中,以神经网络作为智能检测中的信息处理单元便于对多个传感器的相关信息进行复合、集成、联想等数据融合处理,从而实现单一传感器所不具备的功能。2 PID与神经网络控制2.1 PID控制按偏差的比例、积分、微分(PID)控制是历史悠久、生命力最强的控制方式,尽管出现了很多新的控制方法,但目前正在运行的控制回路中,90%以上还是PID控制器。PID控制系统的结构如图2.1所示。P
25、ID控制器的输出值取决于系统给定值和系统输出值的偏差、偏差的积分、偏差的微分的线性加权组合,即 (2.1)式中:为积分时间常数;为微分时间常数;为比例系数;为积分系数;为微分系数。yve-+r被控 对 象图2.1 PID控制系统结构框图2.1.1 PID控制算法1 位置式PID控制算法: (2.2)式中,为时刻的偏差值,为被控量的设定值,为被控量时刻的测试值,为时刻的控制量输出,为偏差为0时的控制量输出,分别为采样时间。执行系统自身的积分时间和微分时间为比例控制系数。2 增量算式: (2.3)在实际控制系统中,由于增量算式只需保存,两次最近的测试值,占用资源少,运算简单,且运算相对较少,控制方
26、便,故应用更为广泛。实际上,增量控制算式和位置算式的物理意义是有区别的。因为增量式本身已具有对时间微分的意义,所以等式右边与位置算式相对应的项都分别具有了单位时间内增量的意义。因而所对应的项分别相当于微分,比例,二次微分的意义,分别实现对响应速度,偏差比例,响应加速度的控制作用。2.1.2 PID控制的特点(1)比例控制作用的特点系统误差一旦产生,控制器立即就有控制作用,使被PID控制的对象朝着减小误差的方向变化,控制作用的强弱却决于比例系数。缺点是对于具有自平衡(即系统阶跃响应终值为一有限值)能力的被控对象存在静差。加大可减小静差,但过大,会导致系统超调增大,使系统的动态性能变坏。(2)积分
27、控制作用的特点能对误差进行记忆并积分,有利于消除系统的静差。不足之处在于积分作用具有滞后特性,积分作用太强会使被控对象的动态品质变坏,以至于导致闭环系统不稳定。(3) 微分控制作用的特点通过对误差进行微分,能感觉出误差的变化趋势,增大微分控制作用可加快系统响应,使超调减小。缺点是对干扰同样敏感,使系统对干扰的抑制能力降低。2.1.3 PID控制中存在的问题到目前为止对PID的机理、适用范围、鲁棒性等问题还没有彻底的全面的分析研究。事实上,Pill并非万能的控制器,在存在多变量祸合、时变、大时滞、强干扰等复杂动态特性的系统中,PID很难获得理想的控制效果,甚至产生不稳定。因此,有必要对PID的控
28、制机理进行全面的分析,并对在上述场合中的应用提出改进的办法。PID控制中的一个关键问题是PID参数整定,传统的整定方法是在获得被控对象数学模型的基础上按照某种整定原则来进行PID参数值的整定。而实际的工业生产过程往往具有非线性,时变不确定性,难以建立精确的数学模型,应用常规的PID控制不能达到理想的控制效果。另外,在实际生产现场中,PID参数整定与自整定的方法很多,但往往难以实施或不太理想,常规PID控制器参数常常整定不良,性能欠佳,对运行工况的适应性差。因此,在PID参数的整定及自整定方面还有待进一步深入研究。另外,从结构上看PID控制器最简单,但并非最优,在克服较大扰动影响,提高系统动态品
29、质等方面,光靠调整参数难以获得满意的控制效果。因此,还有必要在全面分析的基础上,对PID控制器进行结构上的改进。2.2 PID神经网络PID神经网络(PIDNN),是一种新的神经元网络。PIDNN不是神经元网络和传统PID控制规律的简单组合,不是用神经元网络选择和整定PID参数。PIDNN的基础是分别定义了具有比例、积分、微分功能的神经元,从而将PID控制规律融合进神经元网络之中。PIDNN是一种多层前向神经元网络,它的形式与一般多层前向神经元网络类似,但它与一般多层前向神经元网络有所不同,主要不同之处在隐含层。一般多层前向神经元网络中的全部神经元的输入-输出特性都是相同的和静态的,而PIDN
30、N的隐含层是由比例元、积分元、微分元组成的,这些神经元的输入-输出函数分别为比例、积分和微分函数,既有静态的,又有动态的。PIDNN的各层神经元个数、连接方式、连接权重初值是按PID控制规律的基本原则确定的。PIDNN采用误差反向传播算法修改连接权重值,通过在线训练和学习,使系统目标函数达到最优值。2.2.1 PID神经网络的特点PIDNN不是PID控制和神经元网络的简单组合,它是将PID控制规律融合进神经元网络之中,因此它具有神经元网络和PID控制的优点,克服了传统控制方法和一般神经元网络的缺点,它的主要特点如下:(1) PIDNN属于多层前向神经元网络的范畴,因此它具备多层前向神经元网络的
31、任意函数逼近能力和其他优良的性能。(2) PIDNN参照PID控制规律的要求构成,它的结构比较简单和规范。它的结构由网络的输出量个数决定,而网络输出量个数和被控制的变量个数相等。(3) PIDNN的连接权重初值按PID控制规律的基本原则确定,在此初值的基础上进行网络的训练、学习和调整,使网络的收敛速度很快且不易陷入局部极小点。更重要的是,可以利用现有PID控制的大量经验数据确定网络权重初值,从而使控制系统保持初始稳定,使系统的全局稳定成为可能。(4) PIDNN中包含了具有微分和积分动态特性的处理单元,因此它是一种本质性动态网络,容易适应控制系统的要求,在构成控制系统时不必再附加其他部件,它的
32、输入信号无需经过网络外部的微分和积分处理。(5) 比例元、积分元、微分元的存在,使PIDNN控制系统的响应快、超调小、无静差。(6) PIDNN采用无“教师”的自学习方式,根据控制效果进行在线自学习和调整,使系统具备较好的性能。(7) PIDNN可以适用于多种类型的单变量系统和多变量系统的控制,无需测量或辨识被控对象的内部结构和参数。2.3 单神经元网络目前,神经网络的应用研究虽然很广,但深度不够实际应用就更少了。其主要有两方面原因:1.有许多理论问题有待于研究解决。2.硬件实现技术尚未完全解决。可以预见,如果在这两方面有突破的话,神经网络的应用会有一个更大的发展。人工神经网络应用于自动控制主
33、要有两种形式:一是利用其学习功能识别对象参数,按某种方法设计最优控制器:二是直接构成控制器,在线学习,按某种最优准则修改控制器参数。由于目前尚缺乏相应的神经网络计算机硬件支持(或难以被实际应用所接受),试图利用串行处理方式模拟神经网络并行机制,用于实时控制,显然很难满足实际需要。受到工程上应用广泛且结构简单的常规PID调节器的启发,利用具有自学习和自适应能力的单神经元来构成单神经元自适应智能控制器,不但结构简单,且能适应环境变化,有较强的鲁棒性。2.3.1 单神经元模型图2.2表示单神经元的基本结构,它有n个输入状态,为相应于的权重,y为输出信息,另外,考虑到内部门限,用的固定偏值输入表示,其
34、权重(即连接强度)。于是,可得输入的加权和为: (2.4)如果权重向量W和输入向量X分别包含了,即 (2.5) (2.6)式(1-1)可表示为向量w和x的内积: (2.7)显然这一结果是标量。单神经元的激励电平s通过一转移函数,可得到PE的最后输出值: (2.8)图2.2 单神经元的基本结构2.3.2 单神经元的学习规则 学习是神经元的主要特征之一。学习规则是修改神经元之间连接强度或加权系数的算法,使获得的知识结构适应周围环境的变化。在学习过程中,执行学习规则,修改加权系数。在工作期内,由学习所得的连接加权系数参与计算神经元的输出。学习算法可分为有监督学习和无监督学习两类。有监督学习是通过外部
35、教师信号进行学习,即要求同时给出输入和正确的期望输出的模式对,当计算结果与期望输出有误差时,网络将通过自动调节机制调节相应的连接强度,使之向误差减小的方向改变,经过多次重复训练,最后与正确的结果相符合。无监督学习则没有外部教师信号,其学习表现为自适应于输入空间的检测规则,其学习过程为对系统提供动态输入信号,使各个单元以某种方式竞争,获胜神经元本身或其相邻域得到增强,其他神经元则进一步被抑制,从而将信号空间分为有用的多个区域。几种典型的学习规则有:(1)无监督Hebb学习规则Hebb学习是一类相关学习,其基本思想是,如果两个神经元同时被激活,则它们之间的连接强度的增强与它们激活的乘积成正比,以表
36、示神经元的激活值,表示神经元的激活值,表示神经元的连接权值,则Hebb学习规则可表示为: (2.9)式中,为学习速率。(2)有监督的Delta学习规则 在Hebb学习规则中,引入教师信号,即将换成希望输出与实际输出之差,就构成有监督学习的Delta学习规则: (2.10) 上式表明,两神经元间的连接强度的变化量与教师信号和网络实际输出之差成正比。(3)有监督的Hebb学习规则 将无监督的Hebb学习规则和有监督的Delta学习规则两者结合起来就构成有监督的Hebb学习规则: (2.11)这种学习规则使神经元通过关联搜索对未知的外界作出反应,即在教师信号的指导下,对环境信息进行相关学习和自组织,
37、使相应的输出增强或削弱。3 神经PID控制3.1 单神经元自适应PID控制单神经元自适应PID控制结构如图3.1所示。状态转换器单神经元被控对象图3.1 单神经元自适应PID控制结构 图中转换器的输入反映被控过程及控制设定的状态,设为设定值,为输出值,经转换器后转换成为神经元学习控制所需要的状态量这里,为性能指标或递进信号,为对应于的加权系数,为神经元的比例系数,。神经元通过关联搜索来产生控制信号,即: (3.1) (3.2)单神经元自适应控制器是通过对加权系数的调整来实现自适应、自组织功能的,权系数的调整是按有监督的Hebb学习规则实现的。它与神经元的输入、输出和输出偏差三者的相关函数有关,
38、即: (3.3) (3.4)式中,递进信号,随过程逐渐衰减 输出误差信号,学习速率,常数,将式(3.4)代入(3.3)后有: (3.5)式中,如果存在一函数,有:则式(3.5)可写为: (3.6) 上式表明:加权系数的修正按函数对应于的负梯度方向进行搜索。应用随机逼近理论可以证明:当充分小时,使用上述学习算法,可收敛到某一稳定值,且与期望值的偏差在允许范围之内。为保证上述单神经元自适应PID控制器学习算法式(3.3)、式(3.6)的收敛性和鲁棒性,对上述学习算法进行规范化处理后可得: (3.7) (3.8) (3.9)式中,分别为积分、比例、微分的学习速率,为神经元的比例系数,。对积分、比例、
39、微分分别采用了不同的学习速率,以便对不同的权系数分别进行调整。值的选择非常重要。越大,则快速性越好,但超调量大,甚至可能使系统不稳定。当被控对象时延增大时,值必须减少,以保证系统稳定。值选择过小,会使系统的快速性变差。3.2 改进的单神经元自适应PID控制在大量的实际应用中,通过实践表明,PID参数的在线学习修正主要与和有关。基于此可将单神经元自适应PID控制算法中的加权系数学习修正部分进行修改,即将其中的改为,改进后的算法如下: (3.10) 式中,。采用上述改进算法后,权系数的在线修正就不完全是根据神经网络学习原理,而是参考实际经验制定的。3.3 改进的单神经元自适应PID控制的数整定规则
40、(1)增益是系统最敏感的参数。对阶跃输入,若输出有大的超调,甚至出现震荡,应减小,维持不变,若上升时间长,无超调,应增大,不变。(2)对阶跃输入,若被控对象产生多次正弦衰减现象,应减少,其它参数不变。(3)若被控对象响应特性出现上升时间短,有过大超调,应减少,其它参数不变。(4)若被控对象上升时间长,增大,又导致超调过大,可适当增加,其它参数不变。(5)在开始调整时,选择较小值,当调整,和使被控对象具有良好特性时,再逐渐增加,而其它参数不变,使系统稳态输出基本无波纹。3.4 基于二次型性能指标学习算法的单神经元自适应PID控制在最优控制理论中,采用二次型性能指标来计算控制律可以得到所期望的优化
41、效果。在神经元学习算法中,也可借助最优控制中二次型性能指标的思想,在加权系数的调整中引入二次型性能指标,使输出误差和控制增量加权平方和为最小来调整加权系数,从而间接实现对输出误差和控制增量加权的约束控制。(1)以输出误差平方为性能指标的单神经元自适应PID控制器设性能指标为: (3.11)令加权系数的调整沿着对的负梯度方向进行搜索,可求得 (3.12)式中,为学习速率,将(3.2)代入(3.12)式后得: (3.13)式中,分别表示积分、比例和微分的学习速率。 在PID控制算法中通常未知,可近似用取代,即 (3.14)上述代替后所带来的影响可通过适当调整学习速率来补偿。这样采用二次性能指标规范
42、化后学习算法可归纳如下: (3.15)(2)以为性能指标的单神经元自适应控制.设性能指标为: (3.16)式中,输出误差和控制增量的加权系数; 时刻系统参考输入的时延; 时刻系统输出;与上一节不同的是在优化指标中增加了限制控制增量过大的加权项,且考虑了系统的时延。设被控过程方程为: (3.17)神经元加权系数的调整按下式计算:= = = = (3.18)式中是零初态时在过程输入端加单位阶跃时输出响应的第一个值,可由实验求得,推导上式时使用了未规范化前的(3.1)式,单神经元的输出为 (3.19)这样采用二次型性能指标学习算法可归纳如下: (3.20)式中,为输出响应的第一个值,且有: (3.2
43、1)3.5 二次型性能指标单神经元自适应PID控制的参数调整规则上述两种单神经元自适应PID学习算法的运行效果与可调参数等的选取有关。通过大量实例仿真与实控结果,参数调整有下列规律:(1)初始权系数可任意选取。(2)增益值的选择: 是系统最敏感的参数,可先确定一个增益,再根据仿真与实控结果调整,对阶跃输入,若输出有大的超调,甚至出现震荡,应减小,维持不变,若上升时间长,无超调,应增大,不变。(3)学习速率的选择:由于采用了规范化学习算法,学习速率可取得较大。选取使过程的超调不太长,若此时过程从超调趋向平稳时间太长,可增大。若超调迅速下降低于给定值,此后又缓慢上升到稳态的时间太长,则可减少,增强
44、积分项的作用。对于大时延系统,为了减少超调,应选大一些。(4)加权系数选择:加权系数的大小决定了输出误差项在优化指标中所占的比重,对系统的稳定也有直接的影响,其值由仿真和实控决定。系用来限制控制增量的剧烈变化,但其值也不宜选的太大,以免使过程时间拖长,一般常选的比较小。3.6 单神经元自适应控制器稳定性理论分析在控制系统的设计中,首先关心的是系统的稳定性问题,不解决系统的稳定性,就谈不上系统的其它品质指标。对于线性系统,稳定性问题已经得到较为完善的解决,如Routh判据、Nyquist判据等;然而,对于非线性系统,分析系统的稳定性却是一项相当困难的任务,一般而言,人工神经网络控制系统就属于这一
45、类。可幸的是,对于单神经元自适应控制传动系统,它可以说是一种特殊的人工神经网络控制系统:一方面,被控对象具有相对明确的数学模型并且可以近似为低阶的线性系统;另一方面,人工神经网络己“退化”为一个单神经元。Laypunorv关于运动的稳定性理论,特别是Laypunorv第二方法(也称直接法)为非线性系统的稳定性分析,提供了一个有效且方便的工具,可以说,Laypunorv这一理论已经成为近代控制理论的坚实基础。Laypunorv首先给稳定性下了一个精确的数学定义,然后构成一个相当于“能量”的正定泛函,最后判定这个泛函在沿着描述系统的微分方程运动时的导数是否随着时间的增长而衰减,即这个泛函的导数是否为一个负定的泛函,从而对这个系统的稳定性作出结论,这一泛函又称为Laypunorv函数。若某一系统存在一个Laypunorv函数,可以充分肯定这个系统是稳定的,而不必去求解描述这个系统的微分方程。这个方法既适用于线性系统,又适用于非线性系统。但必须指出,Laypunorv直接法给出的是系统稳定的充分条件,未必是充要条件。可见,寻找一个系统的Laypunorv函数是应用这个定性方法的关键。下面从单神经元的学习速率和
链接地址:https://www.31ppt.com/p-3977486.html