毕业设计(论文)RBF神经滑模控制.doc
摘 要简单的介绍了径向基函数(RBFRadial Basis Function),包括它的结构、性能、基本的模型、一些训练算法和学习算法以及MATLAB仿真。RBF径向基神经网络在工程中,尤其是各种智能控制中的应用十分广泛,其具有良好的非线性映射能力、自学习和泛化能力,是一种局部逼近网络,能任意精度逼近任意连续函数。在此主要研究RBF网络逼近,神经网络的等效滑模控制以及滑模控制器的设计。利用其良好的逼近性能以切换函数作为RBF神经网络的输入,滑模控制器作为RBF神经网络的输出, 实现单入单出的神经滑模控制。滑模控制与神经网络相结合,解决了控制系统跟踪性能和鲁棒性能之间的矛盾.系统中的滑模控制器保证了系统的快速跟踪性能,而神经网络具有很强的自学习功能,通过学习能够保证系统的稳定性,并且可对扰动和参数变化进行有效的抑制补偿,从而在不牺牲系统鲁棒性的同时达到削弱抖振。以上内容通过MATLAB仿真表明最终结果. 关键词:径向基函数,滑模控制,网络逼近,MATLAB仿真RBF Sliding Mode ContralABSTRACTRadial Basis Function (RBF-Radial Basis Function), including its structure, performance, the basic model, some training and learning algorithm and MATLAB simulation is introduced in this paper. Radial Basis Neural Networks is widely used in a project, particularly intelligent control, it has good nonlinear mapping ability, self-learning and generalization and it is a local network, can approximate any continuous function by Arbitrary precision.RBF approximation, the equivalent sliding mode control of neural network and the design of sliding controller are the main research content. For its good Approximation, we can make the switching function as the input of RBF network and a sliding controller as the output, then we can achieve a single-input single-output sliding mode control .Sliding mode control combined with neural network can resolve the contradiction between the tracking performance and Robust performance of the system. Sliding controller of the system satisfy the tracking performance. the self-learning function of neural network is very strong, it can satisfy the stability of the system,and inhibit and compensate forthe disturbance and the change of the parameters effectively, so that it can weaken the buffeting without reduce the Robust performance. All above will be timulate by MATLAB to show the results.Keywords: radial basis function, sliding mode control, Network Approximation, MATLAB simulationRBF神经滑模控制0 引言复杂的系统,因其具有模型的不精确性或者不确定性,因而用很多通常的控制方法是难以有效的进行控制的。而人工神经网络(简称神经网络)由于其具有学习能力和非线性映射能力,利用它可以有效的解决一些复杂系统的控制。近年来,随着人工智能和智能控制的迅速发展,神经网络越来越广泛的应用在控制领域的很多方面。神经网络首先成功的应用在信号处理领域,包括图像处理、机器视觉、故障诊断、目标检测、自适应滤波和信号压缩等方面。这些成功,使得神经网络的应用领域不断的扩展。许多用通常的方法难于解决的问题,都趋向于用神经网络来寻求解决方法。BP网络是一种应用较为广泛的人工神经网络,而近年来有很多人经过实验研究表明,在很多情况下,RBF神经网络具有比BP网络更优的性能,尤其是具有更好的局部自相关特性和更快的收敛速度。目前得到了较多的关注和应用。神经网络最初多采用软件实现,而在一些控制中,要作为控制设备使用,神经网络的硬件化是具有十分重要的意义的。在RBF网络的隐含层激活函数,经常采用高斯径向基函数。这一函数具有指数函数的结构,是一个非线性函数,传统的用硬件快速实现的方法是查表法6。这种方法在计算精度和空间的占用之间存在着极大的矛盾,改进的方法是查表法与折线近似相结合的方法,这种方法在一定程度上缓解了上述的矛盾,但是计算精度还是不够精确。RBF神经元网络(Radial Basis Function Neural Network)的产生具有很强的生物学背景。在人的大脑皮层区域中,局部调节及交叠的感受野 (Receptive Field)是人脑反应的特点。基于感受野的这一特点,Moody和Darken提出了一种神经元网络结构,即RBF网络。RBF神经元网络由三层组成,输入层节点只传递输入信号到隐含层,隐含层节点由像高斯函数那样的辐射状作用函数构成,而输出层节点通常是简单的线性函数。 隐含层节点中的作用函数(基函数)对输入信号将在局部产生响应,也就是说,当输入信号靠近基函数的中央范围时,隐含层节点将产生较大的输出,这正体现了大脑皮质层的反应特点,由此看出这种网络具有局部逼近能力,所以径向基函数网络也称为局部感知场网络。高斯函数: :维输入向量;:第个基函数的中心,与具有相同维数的向量;:第个感知的变量(可以自由选择的参数),它决定了该基函数围绕中心点的宽度;:感知单元的概述(隐含层节点数)。:向量的范数,它通常表示与之间的距离;在处有一个唯一的最大值,随着的增大,迅速衰减到零。对于给定的,只有一小部分靠近中心被激活1。 高斯函数具备如下优点:表示形式简单,即使对于多变量输入也不增加大多的复杂性;径向对称;光滑性好,任意阶导数均存在;由于该基函数表示简单且解析性好,因而便于进行理论分析4。本文共分八个部分。第一部介绍了神经网络的基本原理和两种神经模型。第二部分介绍了划模变结构控制的基本原理及控制器的基本设计方法;第三部分介绍了神经滑模控制的设计方法,包括网络逼近,等效控制和神经滑模控制;第四部分为全文结论;第五部分为参考文献;第六部分为原文说明。1 神经网络原理1.1 神经网络基本概念1.1.1 人工神经元模型生物神经元的结构生物神经元,也称神经细脑,是构成神经系统的基本单元。生物神经元主要由细脑体、树突和轴突构成。从生物控制论的观点来看,作为控制和信息处理基本单元的生物神经元,具有以下功能特点:时空整合功能,动态极化性,兴奋与抑止状态,结构的可塑性,脉冲与电位信号的转换,突触延期和不应期以及学习遗忘和疲劳。生物神经元经抽象化后,可得到如图11所示的一种人工神经元模型。它有三个基本要素。1 连接权连接权对应于生物神经元的突触,各个人工神经元之间的连接强度由连接权的权值表示,权值为正表示激活,为负表示抑制2 求和单元求和单元用于求取各输入信号的加权和(线性组合)3 激活函致激活函数起非线性映射作用,并将人工神经元输出幅度限制在一定范围内,一般限制在(0,1)或(1,,1)之间激活函数也称传输函数此外,还有一个阔值(或偏值 =)以上作用可分别用数学式表达出来,即式中,为输入信号,它相当于生物神经元的树突,为人工神经元的输入信息;为神经元的权值为线性组合结果;为阀值:为激活函数:为神经元的输出,它相当于生物神经元的轴突,为人工神经元的输出信息若把输入的维数增加一维,则可把阀值包括进去,即,激活函数一般有以下几种形式:1 阶跃函数函数表达式为 2 分段城性函数函致表达式为 3 Sigmoid型函数最常用的S函数为式中,参数a可控制其斜率。1.1.2 神经网络结构人工神经网络是由大量人工神经元经广泛互连而组成的,它可用来模拟脑神经系统的结构和功能人工神经网络可以看成是以人工神经元为节点,用有向加权弧连接起来的有向图。在此有向图中,人工神经元(以下在不易引起混淆的情况下,人工神经元简称神经元)就是对生物神经元的模拟,而有向加权弧则是轴突突触树突对的模拟。有向弧的权值表示相互连接的两个人工神经元间相互作用的强弱。人工神经网络是生物神经网络的种模拟和近似。它主要从两个方面进行模拟。一种是从生理结构和实现机理方面进行模拟,它涉及生物学、生理学、心理学、物理及化学等许多基础科学。生物神经网络的结构和权理相当复杂,现在距离完全认识它们还相差甚远另外一种是从功能上加以模拟,即尽量使得人工神经网络具有生物神经网络的某些功能特性,如学习、识别、控制等功能本书仅讨论后者,从功能上来看,人工神经网络根据连接方式主要分为两类。1 前馈型网络前馈神经网络是整个神经网络体系中最常见的一种网络,其网络中各个神经元接收前一级的输入,并输出到下一级,网络中没有反馈。节点分为两类,即输入单元和计算单元,每一计算单元可有任意个输入,但只有一个输出(它可耦合到任意多个其他节点作为输入),通常前馈网络可分为不同的层,第层的输入只与第层输出相连,输入和输出节点与外界相连,面其他中间层称为隐含层,它们是一种强有力的学习系统,其结构简单而易于编程。从系统的观点看,前馈神经网络是一静态非线性映射,通过简单非线性处理的复合映射可获得复杂的非线性处理能力。但从计算的观点看,前馈神经网络并非是一种强有力的计算系统,不具有丰富的动力学行为大部分前馈神经网络是学习网络,并不注意系统的动力学行为,它们的分类能力和模式识别能力一般强于其他类型的神经网络。2 反馈型网络反馈神经网络又称递归网络或回归网络。在反馈网络中,输入信号决定反馈系统的初始状态,然后系统经过一系列状态转移后,逐渐收敛于平衡状态。这样的平衡状态就是反馈网络经计算后输出的结果,由此可见,稳定性是反馈网络中最重要的问题之一如果能找到网络的李雅普诺夫函数,则能保证网络从任意的初始状态都能收敛到局部最小点。反馈神经网络中所有节点都是计算单元,同时也可接收输入并向外界输出,可画成一个无向图,其中每个连接弧都是双向的,。若总单元数为,则每一个节点有个输入和一个输出。1.1.3 神经网络工作方式神经网络的工作过程主要分为两个阶段第一阶段是学习期,此时各计算单元状态不变,各连接权上的权值可通过学习来修改;第二阶段是工作期,此时各连接权固定,计算单元变化,以达到某种稳定状态从作用效果看,前馈网络主要是函数映射,可用于模式识别和函数逼近。反馈网络按对能量函数的极小点的利用来分类有两种:第一类是能量函数的所有极小点都起作用,这一类主要用做各种联想存储器:第二类只利用全局极小点,它主要用于求解最优化问题。1.1.4 神经网络的学习通过向环境学习获取知识并改进自身性能是神经网络的一个重要特点,在一般情况下,性能的改善是按某种预定的度量调节自身参数(如权值)并随时间逐步达到的,学习方式(按环境所供信息的多少分)有以下三种。1有鉴督学习(有教师学习)有监督学习方式需要外界存在一个“教师”,它可对一组给定输入提供应有的输出结果,这组已知的输入输出数据称为训练样本集。学习系统可根据已知输出与实际输出之间的差值(误差信号)来调节系统参数,学习规则由一组描述网络行为的训练集给出式中,为网络的输入:为相应的目标输出。当输入作用到网络时,网络的实际输出与目标输出相比较,然后学习规则调整网络的权值和阀值,从而使网络的实际输出越来越接近于目标输出。2无监督学习(无教师学习)无监督学习时不存在外部教师,学习系统完全按照环境所提供数据的某些统计规律来调节自身参数或结构(这是一种自组织过程),以表示外部输入的某种固有特性(如聚类,或某种统计上的分布特征),在无监督学习当中,仅仅根据网络的输入调整网络的权值和阐值,它没有目标输出。乍一看,这种学习似乎并不可行:不知道网络的目的是什么,还能够训练网络吗?实际上,大多数这种类型的算法都是要完成某种聚类操作,学会将输入根式分为有限的几种类型。这种功能特别适合于诸如向量量化等应用问题。3 强化学习(或再励学习)强化学习介于上述两种情况之间,外部环境对系统输出结果只给出评价(奖或罚)而不是给出正确答案,学习系统通过强化那些受奖励的动作来改善自身性能。强化学习与有监督学习类似,只是它不像有监督的学习那样为每一个输入提供相应的目标输出,而是仅仅给出一个级别。这个级别(或评分)是对网络在某些输入序列上的性能侧度。当前,这种类型的学习要比有监督的学习少见它最适合控制系统应用领域。1.2 径向基神经网络1.2.1径向基函数网络模型RBF 网络由两层组成,其结构如图 14 所示。输入层节点只是传递输入信号到隐含层,隐含层节点(也称RBF节点)由像高斯核函数那样的辐射状作用函数构成,而输出层节点通常是简单的线性函数。隐含层节点中的作用函数(核函数)对输入信号将在局部产生响应,也就是说,当输入信号靠近该函数的中央范围时,隐含层节点将产生较大的输出。由此可看出这种网络具有局部逼近能力,故径向基函数网络也称为局部感知场网络。1.2.2 网络输出设网络输入为维向量,输出为维向量,输入输出样本对长度为。RBF网络的输入层到隐含层实现的非线性映射,径向基网络隐含层节点的作用函数一般取下列几种形式,即上面这些函数都是径向对称的,虽然有各种各样的激活函数,但最常用的是高斯激活函数,如RBF网络隐含层第个节点的物出可由下式表示,即 式中,是第个隐节点的输出,是第个隐节点的标准化常数,是隐含层节点数,是输入样本:是第个隐节点高斯函数的中心向量,此向量是一个与输入样本x的维数相同的列向量,即。由上式可知,节点的输出范围在0和1之间,且输入样本越靠近节点的中心,输出值越大。当时,。1.2.3 RBF网络的学习过程 设有个训练样本,则系统对所有个训练样本的总误差函数为式中,为模式样本对数; 为网络输出节点数;表示在样本作用下的第个神经元的期望输出:对表示在样本作用下的第个神经元的实际输出。RBF网络的学习过程分为两个阶段。第一阶段是无教师学习,是根据所有的输入样本决定隐含层各节点的高斯核函数的中心向量和标准化常数。第二阶段是有教师学习。在决定好隐含层的参数后,根据样本,利用最小二乘原则,求出隐含层和输出层的权值。有时在完成第二阶段的学习后,再根据样本信号,同时校正隐含层和输出层的参数,以进一步提高网络的精度。下面具体介绍一下这两个阶段。1无监督学习阶段:无监督学习是对所有样本的输入进行聚类求得各隐含层节点的 RBF的中心向量。这里介绍-值聚类算法调整中心向量,此算法将训练样本集中的输入向量分为若干族,在每个数据族内找出一个径向基函数中心向量,使得该族内各样本向量距该族中心的距离最小。算法步驭如下:(l) 给定各隐节点的初始中心向量和判定停止计算的;(2)计算距离(欧氏距离)并求出最小距离的节点:(3)调整中心(4)判定聚类质量2有监督学习阶段当确定以后训练由隐含层至输出层之间的权值,由上可知,它是一个线性方程组,则求权值就成为线性优化问题。因此,问题有惟一确定的解,肯定能获得全局最小点。类似于线性网络,RBF网络的隐含层至输出层之间的连接权值,学习算法为式中,为高斯函数; 为学习速率。可以证明,当 0 << l 时,可保证该迭代学习算法的收敛性而实际上通常只取0 << l; 和分别表示第个输出分量的期望值和实际值。由于向量中只有少量几个元素为1,其余均为0,因此在一次数据训练中只有少量的连接权需要调整。正是由于这个特点,才使得RBF神经网络具有比较快的学习速度。另外,由于当远离时,非常小,因此可作为0对待。因此,实际上只当大于某一数值(如0.05)时才对相应的权值进行修改。经这样处理后,RBF神经网络也同样具备局部逼近网络学习收敛快的优点。2 滑模控制原理2.1 滑模变结构控制基本原理滑模变结构控制时变结构控制系统的一种控制策略。这种控制策略与常规控制的根本区别在于控制的不连续性。即一种使系统的“结构”随时间变化的开关特性。该控制特性可以迫使系统在一定特性下延规定的状态轨迹作小幅度、高频率的上下运动,即所谓的“滑动模态”或“滑模”运动。这种滑动模态使可以设计的,且与四通的参数及扰动无关。这样,处于滑模运动的系统就具有很好的鲁棒性。滑动模态控制的概念和特性如下:1动模态定义及属性表达式考虑一般的情况,在系统 的状态空间中,有一个切换面,它将状态空间分成上下两部分及。在切换面上的运动点有三种情况。通常点系统运动点运动到切换面附近时,穿越次点而过;起始点系统运动点到达切换面附近时,从切换面的两边离开该点;终止点系统运动点到底切换面附近时,从切换面的两边趋向于该点。在滑模变结构中,通常点与起始点无多大意义,而终止点却有特使的含义。因为如果在切换面上的某一区域内所有的运动点都是终止点,则一旦运动点趋近于该区域,就会被“吸引”到该区域内运动。此时,称在切换面所有的运动点都是终止点的区域为“滑动模态”区,或简称为“滑模”区。系统在滑模区中的运动就叫做“滑模运动”。按照滑动模态区上的运动点都必须时终止点这一要求,当运动点到达切换面附近时,必有 及 或者 (2.1 )式(2.1 )也可以写成(2.2 )此不等式对系统提出了一个形如(2.3 )的李雅普诺夫函数的必要条件。由于在切换面领域内函数式(2.3)是正定的,而按照式(2.2),的导数是负半定的,也就是说在附近是一个非增函数,因此,如果满足条件式(2.2),则式(2.3)是系统的一个李雅普诺夫函数。系统本身也就稳定于条件。2滑模变结构控制的定义滑模变结构控制的基本问题如下:设有控制系统 需要确定切换函数 ,求解控制函数 (2.4 )其中,使得(1)滑动模态存在,即式(2.4)成立;(2)满足可达到性条件,在切换面以外的运动点都将于有限的时间内到达切换面;(3)保证滑模运动的稳定性;(4)达到控制系统的动态品质要求。上面的前三点式滑模变结构控制的三个基本问题,只有满足了这三个条件的控制才叫滑模变结构控制。2.2 滑模变结构控制系统的抖振2.2.1抖振产生的原因从理论上讲,在一定意义上,由于滑动模态可以按需要设计,而且系统的滑模运动与控制对象的参数变化和系统的外界干扰无关,因此滑模变结构控制系统的鲁棒性要比一般常规的连续系统强。然而,滑模变结构控制在本质上的不连续开关特性将会引起系统的抖振。对于一个理想的滑模变结构控制系统,假设“结构”切换的过程具有理想开关特性(即无时间和空间滞后),系统状态测量精确无误,控制量不受限制,则滑模总是降维的光滑运动而且渐进稳定于原点,不会出现抖振。但是对于一个现实的滑模变结构控制系统,这些假设是不可能成立的。特别是对于离散系统的滑模变结构控制系统。都将会在光滑的滑模面上叠加一个锯齿形的轨迹。于是,在实际系统中抖振是必定存在的,而且若消除了抖振也就消除了变结构控制的抗摄动和抗扰动的能力,因此消除抖振是不可能的,只能在一定程度上削弱它,抖振问题成为变结构控制在实际系统中应用的突出障碍。抖振产生的主要在于以下几个原因:(1) 时间滞后开关;(2) 空间滞后开关;(3) 系统惯性的影响;(4) 离散系统本身造成的抖振。在实际系统中,由于时间滞后开关、空间滞后开关、系统惯性、系统延迟及测量误差等因素,使变结构控制在滑动模态下伴随着高频抖振,抖振不仅影响控制的精确性,增加能量消耗,而且系统中的高频未建模动态很容易被激发起来,破坏系统的性能,甚至使系统产生振荡或失稳,损坏控制器部件。因此,关于变结构控制信号抖振消除的研究成为变结构控制研究的首要问题。2.2.2 抗抖振的方法简介国内卫针对滑模控制抗抖振问题的研究有很多,许多学者都从不同的角度提出了解决方案。目前,有代表性的研究工作主要有以下及方面。准滑动模态方法、趋近律方法、滤波方法、观测器方法、动态滑模方法、模糊方法、神经网络方法、遗传算法优化方法、切换增益方法和扇性区域法等等。本文主要介绍神经网络方法即神经滑模变结构控制,神经网络是一种具有高度非线性的连续时间动力系统,它有着很强的字学习功能和对非线性系统的强大映射能力。神经网络用于滑模变结构控制,可实现自适应滑模控制。S.C.Lin等将传统方法与神经网络相结合,无需对象的精确模型,设计了基于RBF网络的滑模控制器,该控制器成功地应用于非线性单级倒立摆地自适应控制。D.Munoz等针对一类非线性离散机器人力臂系统设计了自适应滑模控制器,在该控制器中采用两个神经网络实现了非线性系统中未知函数部分的逼近,从而实现了基于神经网络的滑模自适应控制。Z.H.Man等提出了一种新型神经网络滑模控制方法,采用RBF网络辨识系统不确定部分的上界,该方法已成功地应用于机器手地轨迹跟踪。J.M.Carrasco等采用BP网络代替带有切换的滑模控制器,通过神经网络权值的在线调整,实现了针对变频器的抗抖振自适应滑模控制。G.Parma等将BP网络学习算法与滑模控制相结合,构成了新的闭环控制系统,利用BP网络的在线学习功能,设计出了一种新型滑模神经网络控制器,实现了感应电机的自适应滑模控制。2.3 滑模控制器设计基本方法2.3.1 等效控制设系统的状态方程为 (2.5 )其中为控制输入,为时间。如果达到理想的滑动模态控制,则,即 或 (2.6 )将式(2.6)中的的解(如果存在)称为系统在滑动模态区内的等效控制。等效控制往往式针对确定性系统在无外加干扰情况下进行设计的。例如,对于线性系统 (2.7 )取切换函数其中为系统状态及各阶导数,选取常数,使得多项式为Hurwitz稳定,为Laplace算子设系统进入滑动模态后的等效控制为,由式(2.7 )有若矩阵满秩,则可解出等效控制(2.8 )针对带有不确定性和外加干扰的系统,一般采用的控制律为等效加切换控制,即其中实现对不确定性和外加干扰的鲁棒控制。所设计的控制律需要满足滑模稳定条件。2.3.2 滑动模态运动方程有了等效控制后,可以写出滑动模态运动方程。将等效控制代入系统的状态方程(2.5)可得 (2.9 )将式(2.8)代如式(2.7)所示的线性系统,有(2.10 )式中为单位矩阵。滑动模态运动式系统延切换面上的运动,达到理想终点时,满足及,同时起诶还开关必须时理想开关,这是一种理想的极限情况。实际上,系统运动点沿切换面上下穿行。所以式(2.10)式滑模变结构控制系统在滑动模态附近的平均运动方程,这种平均运动方程描述了系统在滑动模态下的主要动态特性。通常希望这个动态特征既是渐近稳定的,又具有优良的动态品质。从式(2.10)中可以看出,滑动模态运动的渐近稳定性和动态品质取决于切换函数及其参数的选择。2.3.3 控制器设计设计滑模变结构控制器的基本步骤包括两个相对独立的部分:(1)设计切换函数,使它所确定的滑动模态渐近稳定且具有良好的动态品质;(2)设计滑动模态控制律,使达到条件得到满足,从而在切换面上形成滑动模态区一旦切换函数和滑动模态控制律都得到了,滑动模态控制系统就能完全建立起来。常规滑模变结构控制有以下几种设计方法:(1)常值切换控制式中,是待求的常数,sgn是符号函数,求滑模变结构控制就是求(2)切换函数控制这是以等效控制为基础的形式(3)比例切换控制 为常数3. RBF神经滑模控制3.1 RBF神经网络逼近3.1.1 网络结构RBF网络是一种三层向前网络,又输入到输出的映射是非线性的,而隐含层空间到输出空间的映射是线性的,从而可以大大加快学习速度并避免局部极小问题。3.1.2 逼近算法RBF网络的辨识结构如图3-2所示图5.2 RBF网络逼近在RBF网络结构中,为网络的输入向量。设RBF网络的径向基向量,其中为高斯函数:其中网络第个节点的中心向量为设网络的基宽向量为其中为节点的基宽参数,且为大于零的数。网络的权向量为RBF网络的输出为RBF网络性能指标函数为根据梯度下降法,输出权、节点中心及节点基宽参数的迭代算法如下:其中为学习速率,为动量因子3.1.2 仿真程序使用RBF网络逼近下列时变对象 其中对象采样时间为1采用Z变换对进行离散化。经过Z变换后的离散化对象为在RBF网络中网络输入信号为三个,即,网络初始权值及高斯函数参数初始权值的取值可取随机值,也可通过仿真测试后获得。网络学习参数取,。仿真程序如下,仿真结果如图3-3和图34所示。%RBF identificationclear all;close all;sys=tf(5.235e005,1,87.35,1.047e004,0);dsys=c2d(sys,0.001,'z');num,den=tfdata(dsys,'v');alfa=0.05;xite=0.35; x=0,0,0'%bi=rands(4,1); %ci=rands(3,4); %w=rands(4,1); bi=-2.1268; -0.2870; 0.8481; -1.7593;ci=-0.4568 0.2089 -0.7983 3.5261; -0.3263 -0.4569 0.3854 3.0545; -0.3475 -0.6040 -0.0453 2.8705;w= 0.3392 0.0467 -0.8302 4.5379;w_1=w;w_2=w_1;w_3=w_1;ci_1=ci;ci_2=ci_1;bi_1=bi;bi_2=bi_1;y_1=0;y_2=0;y_3=0;u_1=0.0;u_2=0.0;u_3=0.0;ts=0.001;%Main Programfor k=1:1:2000 time(k)=k*ts;u(k)=0.50*sin(1*2*pi*k*ts);if k<=1000yout(k)=u(k)3+y_1/(1+y_12); elseyout(k)=-den(2)*y_1-den(3)*y_2-den(4)*y_3+num(2)*u_1+num(3)*u_2+num(4)*u_3;%Linear controlendx(3)=y_2;x(2)=y_1;x(1)=u_1; for j=1:1:4 h(j)=exp(-norm(x-ci_1(:,j)2/(2*bi_1(j)*bi_1(j);endymout(k)=w_1'*h' d_w=0*w;d_bi=0*bi;d_ci=0*ci;for j=1:1:4 d_w(j)=xite*(yout(k)-ymout(k)*h(j); d_bi(j)=xite*(yout(k)-ymout(k)*w_1(j)*h(j)*(bi_1(j)-3)*norm(x-ci_1(:,j)2; for i=1:1:3 d_ci(i,j)=xite*(yout(k)-ymout(k)*w_1(j)*h(j)*(x(i)-ci_1(i,j)*(bi_1(j)-2); endend w=w_1+ d_w+alfa*(w_1-w_2); bi=bi_1+d_bi+alfa*(bi_1-bi_2); ci=ci_1+d_ci+alfa*(ci_1-ci_2); u_3=u_2; u_2=u_1; u_1=u(k); y_3=y_2; y_2=y_1; y_1=yout(k); w_2=w_1; w_1=w; ci_2=ci_1; ci_1=ci; bi_2=bi_1; bi_1=bi; end figure(1); plot(time,ymout,'r',time,yout,'b'); xlabel('time(s)'); ylabel('y and ym'); figure(2); plot(time,ymout-yout,'r'); xlabel('time(s)'); ylabel('identification error');图3.3 RBF网络辨识结果图3.4 RBF网络辨识误差3.2 基于RBF神经网络的等效滑模控制3.2.1 系统描述被控对象为(3.1 )其中为转动惯量,粘性系数。将式(3.1)转化为状态方程(3.2 )其中,。将状态方程式(3.2)转换为离散状态方程为(3.3 )其中将离散状态方程式(3.3)转换为离散误差状态方程为其中, ,。为位置指令变化率; 为误差; 为误差变化率。3.2.2 等效控制器设计误差及其变化率为,切换函数定义为(3.4 )其中在滑模到达理想状态时,有(3.5 )由于(3.6 )根据式(3.4)(3.6),得总得控制律为其中为RBF网络得输出。3.2.3 神经滑模控制器设计设为网络输入,为网络隐含层输出,为高斯函数。 其中,为隐含层个数网络得的输出为RBF网络输入的两个,分别为选择神经网络学习指标为根据式,有根据梯度下降法,神经网络权值学习算法为其中为学习速率,为惯性系数。3.2.4 仿真程序被控对象为其中,位置指令为,为采样时间。设加在控制输入信号上的干扰为 取,网络结构取2-6-1,网络学习参数取,。网络初始权值及高斯参数的初始值均取随机值。采用控制律式(3.7 )。取,控制输入端无干扰,仿真结果如图3.5图3.7所示。取,控制输入端带干扰,仿真结果如图3.8图3.10所示。仿真程序如下:%Equivalent Discrete Sliding Mode Control based on RBF neural controlclear all;close all;ts=0.001;a=25;b=133;A=0,1;0,-a;B=0;b;C=1,0;D=0;A1,B1,C1,D1=c2dm(A,B,C,D,ts,'z');Ae=A1;Be=-B1;xite=0.60;alfa=0.05;x=0,0'xi=0,0'c=rands(2,6);b=rands(6,1);w=rands(6,1); h=0,0,0,0,0,0'c_1=c;c_2=c_1;b_1=b;b_2=b_1;w_1=w;w_2=w;r_1=0;r_2=0;s_1=0;for k=1:1:3000 time(k)=k*ts;r(k)=0.50*sin(6*pi*k*ts); cc=5;Ce=cc,1;%Using extrapolation dr(k)=(r(k)-r_1)/ts; dr_1=(r_1-r_2)/ts; r1(k)=2*r(k)-r_1; dr1(k)=2*dr(k)-dr_1; R=r(k);dr(k); R1=r1(k);dr1(k); fk=R1-A1*R; e(k)=r(k)-x(1);de(k)=dr(k)-x(2);s(k)=cc*e(k)+de(k);ds(k)=s(k)-s_1;ueq(k)=-inv(Ce*Be)*(Ce*(Ae-eye(2)*e(k);de(k)+Ce*fk);%RBF neural controlxi(1)=s(k);xi(2)=ds(k); for j=1:1:6 h(j)=exp(-norm(xi-c(:,j)2/(2*b(j)*b(j);endun(k)=w'*h; u(k)=ueq(k)+un(k); d_w=0*w;for j=1:1:6 d_w(