第5章-神经网络控制论-《智能控制技术(第2版)》ppt课件.ppt
《第5章-神经网络控制论-《智能控制技术(第2版)》ppt课件.ppt》由会员分享,可在线阅读,更多相关《第5章-神经网络控制论-《智能控制技术(第2版)》ppt课件.ppt(66页珍藏版)》请在三一办公上搜索。
1、第五章 神经网络控制论,浙江大学电气学院 韦巍 2015.9,2,引言,2,3,4,非线性动态系统的神经网络辨识,5,神经网络控制的学习机制,神经网络控制器的设计,由于神经网络本质上是一个大规模并行分布处理的非线性动力学系统,并在更高层次上体现出一些人脑的智能行为,为智能控制提供了新途径。神经网络控制的优越性体现在:神经网络可以处理那些难以用模型或规则描述的过程或系统。神经网络采用并行分布式信息处理,具有很强的容错性。神经网络是本质的非线性系统。神经网络具有很强的信息综合能力。神经网络的硬件实现愈趋方便。,一、引言,导师指导下的控制器:神经网络控制结构的学习样本直接取自于专家的控制经验。一旦神
2、经网络的训练达到了能够充分描述人的控制行为时,则网络训练结束,一、引言,逆控制器:如果一个动力学系统可以用一个逆动力学函数来表示,则采用简单的控制结构和方式是可能的,一、引言,模型参考自适应网络控制器:利用神经网络将线性系统经典的自适应控制设计理论和思想方法直接引到非线性系统自适应控制系统中来是可能的,一、引言,神经内模控制结构:系统的实际输出与模型M的输出信号差用于反馈的目的。这个反馈信号通过前向通道上的控制子系统G预处理。通常G是一个滤波器,用于提高系统的鲁棒性。系统模型M和控制器C可以由神经网络来实现,一、引言,前馈控制结构:通常单纯的求逆控制结构不能很好地起到抗干扰能力,因此结合反馈控
3、制的思想组成前馈补偿器的网络控制结构,一、引言,自适应评价网络是由Barto,Sutten 和Anderson在1983年提出来的。整个学习系统由一个相关的搜索单元和一个自适应评价单元组成,在这个算法中,相关搜索单元是作用网络。自适应评价单元为评价网络。它不需要控制系统数学模型,只是通过对某一指标准则J的处理和分析得到奖励或惩罚信号。,一、引言,神经网络的逼近能力首先要搞清楚到底什么样的被控系统可以用神经网络来描述。对于众多的神经网络类型来说,要得到一个统一的神经网络逼近理论是不现实的,况且,还有很多神经网络结构的逼近性问题至今尚未得到证明多层前向传播神经网络能够相当好地逼近许多实际问题中的非
4、线性函数。这一节就要回答这个问题。,一、引言,神经网络的逼近能力含有两个隐含层的前向传播神经网络,且神经元激励函数为单调的S型函数,则此神经网络能够得到合适的逼近精度对于在紧凑集中的任何平方可积函数可以通过有限个隐含神经元组成的二层前向传播神经网络来逼近,并能达到任意逼近精度。考虑具有单个隐含层的前向传播神经网络,其输出属于集合:其中:x表示n维输入矢量,=(1,xT)T;vj 表示隐含层第j个神经元到输出层的权值;wj 表示输入矢量到隐含层第j个神经元的权值矢量 j=1,2,.,q;q为隐含层神经元个数;()为隐含层神经元特性。,一、引言,神经网络的逼近能力定义5-1:S型函数如果函数():
5、R0,1是非递减函数,且满足则称函数()为 S型函数。定义5-2:距离函数-给定的函数空间S,设f,g,hS。则距离函数满足以下条件:.正定性(f,g)0,且仅当 f=g 时等号成立;.对称性(f,g)=(g,f);.三角不等式关系(f,g)(f,h)+(h,g)。定义5-3:-稠密-一个度量空间(X,)中的子集S称为是在子集T上的-稠密,只有当对于任意一个给定的0,对所有的tT,存在一个sS,有(s,t)。,一、引言,神经网络的逼近能力定理5-1:若神经元的激励函数()是S-型连续函数。那么,()在C(U)中是-稠密。这个定理说明,只要是有限空间中的连续函数g(x),总存在具有上述神经元特性
6、()的三层网络(),使得其输出函数f(x)能够以任意精度逼近g(x)。对于非连续函数是否也有类似的神经网络来逼近它呢?如果能够实现这样的逼近,则非连续函数g(x)应该满足什么样的条件?Hornik等人在1989年发表论文中阐明了多层前向传播神经网络可以逼近任意连续函数或分段连续函数,一、引言,16,引言,2,3,4,非线性动态系统的神经网络辨识,5,神经网络控制的学习机制,神经网络控制器的设计,系统建模是神经网络的最早应用。什么叫系统辨识?L.A.Zadch曾经下过这样的定义:“辨识是在输入和输出数据的基础上,从一组给定的模型中,确定一个与所测系统等价的模型”。使用非线性系统的输入输出数据来训
7、练神经网络可认为是非线性函数的逼近问题。多层前向传播网络能够逼近任意L2非线性函数。,二、非线性动态系统的神经网络辨识,系统辨识的三要素:模型的选择 输入信号的选择 误差准则的选择,二、非线性动态系统的神经网络辨识,系统辨识的三要素:模型的选择神经网络用于系统辨识的实质就是选择适当的神经网络模型来逼近实际系统,即 为神经网络模型类,为一神经网络。考虑到多层前向传播网络具备良好的学习算法,本章我们选择多层前向传播网络为模型类,为一能充分逼近实际系统而又不过分复杂的多层网络。,二、非线性动态系统的神经网络辨识,系统辨识的三要素:输入信号的选择 从时域上来看,要求系统的动态过程在辨识时间内必须被输入
8、信号持续激励,即输入信号必须充分激励系统的所有模态;从频域来看,要求输入信号的频谱必须足以覆盖系统的频谱,二、非线性动态系统的神经网络辨识,系统辨识的三要素:误差准则的选择 误差准则是用来衡量模型接近实际系统的标准,它通常表示为一个误差的泛函,二、非线性动态系统的神经网络辨识,一旦三大要素确定以后,神经网络的辨识就归结为一个最优化问题。神经网络辨识具有以下五个特点。(1)不要求建立实际系统的辨识格式。(2)可以对本质非线性系统进行辨识,而且辨识是通过在网络外部拟合系统的输入/输出,网络内部隐含着系统的特性。因此这种辨识是由神经网络本身实现的,是非算法式的。(3)辨识的收敛速度不依赖于待辨识系统
9、的维数,只与神经网络本身及其所采用的学习算法有关,传统的辨识方法随模型参数维数的增大而变得很复杂。(4)由于神经网络具有大量的连接,这些连接之间的权值在辨识中对应于模型参数,通过调节这些权值使网络输出逼近系统输出(5)神经网络作为实际系统的辨识模型,实际上也是系统的一个物理实现,可以用于在线控制。,二、非线性动态系统的神经网络辨识,神经网络辨识模型的结构 前向建模法逆模型法,二、非线性动态系统的神经网络辨识,前向建模法:利用神经网络来逼近非线性系统的前向动力学模型。,yN(k+1)=f(y(k),.,y(k-n+1),u(k),.,u(k-m+1),二、非线性动态系统的神经网络辨识,逆模型法直
10、接法:逆向建模是最直接的方法是将系统输出作为网络的输入,网络输出与其期望输出即系统的输入进行比较得到误差作为此神经网络训练的信号,二、非线性动态系统的神经网络辨识,逆模型法存在的问题 学习过程不一定是目标最优的,可以采用下图所示的实用逆模型法一旦非线性系统对应关系不是一对一的,那么不准确的逆模型可能会被建立,二、非线性动态系统的神经网络辨识,非线性系统的前向建模辨识的两种结构并行结构串行结构,串行结构收敛性较好,二、非线性动态系统的神经网络辨识,对于非线性系统:其中 X(k)、U(k)、Y(k)分别为n维、p维、m维状态矢量序列神经网络系统辨识的基本思想是利用神经网络的非线性映射特性来逼近动态
11、系统的非线性函数和。如下图所示。,二、非线性动态系统的神经网络辨识,设系统的输入空间为u,输出空间为g,实际系统可以表示为一个从输入空间到输出空间的算子P:ug;给定一个模型类SM,设PSM,则辨识的目的就是确定一个SM的子集类,使其中存在,且P在给定的准则下,为P的一个最佳逼近,二、非线性动态系统的神经网络辨识,讨论非线性动态系统的神经网络辨识的四种辨识模型IIIIIIIV其中f、g分别为非线性函数。u(k),y(k)表示在k时刻的输入-输出对,二、非线性动态系统的神经网络辨识,假定:(1)线性部分的阶次n、m已知;(2)系统是稳定的,即对于所有给定的有界输入其输出响应必定也是有界的。反映在
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 智能控制技术第2版 神经网络 控制论 智能 控制 技术 ppt 课件
链接地址:https://www.31ppt.com/p-3749204.html