神经网络第三章.ppt
《神经网络第三章.ppt》由会员分享,可在线阅读,更多相关《神经网络第三章.ppt(172页珍藏版)》请在三一办公上搜索。
1、第3章 神经控制中的系统辨识,3.1 系统辨识过程中神经网络的作用3.2 非线性动态系统辨识3.3 多层前向网络辨识中的快速算法3.4 非线性模型的预报误差神经网络辨识3.5 非线性系统逆模型的神经网络辨识3.6 线性连续动态系统辨识的参数估计3.7 利用神经网络联想功能的辨识系统3.7 小结习题与思考题,3.1 辨识模型辨识模型只是被测系统在一定环境下的近似描述,选择只能在以下情况中确定:是选择静态模型,还是选择动态模型?是选择参数模型,还是选择非参数模型?必须考虑:1)模型的用途;(2)被测对象的精确度与复杂程度;(3)系统的控制方式,是自适应控制还是实时控制;(4)使用神经网络,可以选择
2、三层网络通过仿真比对完成,当前神经网络理论尚未明确指出需要几个隐层节点数才能模拟出系统。,一、使用参数模型辨识的方法 从输入输出数据中提取被测系统S的数学模型M,使下式成立:YmYo=M(u)S(u)式中Ym、Yo分别是系统输入u作用下模型和系统的输出。为预设的辨识精度。设e=YmYo,则辨识准则,二、使用非参数模型辨识的方法 无需事先确定模型的具体结构,只需要知道运行过程为线性。这一类模型有阶跃响应、脉冲响应、频率特性,三、人工神经网络用于系统辨识 用神经网络构成辨识模型,辨识方法就是用神经网络辨识模型逼近被测系统。用作辨识模型的神经网络通常有多层感知器、BP网络、Hopfield网络等。四
3、、辨识系统的输入和输出被测系统与辨识模型使用相同的输入信号。输入信号满足条件1、辨识时间内的输入信号必须持续激励,充分激励系统的所有模态,输入信号的频谱必须足够覆盖系统的频谱;2、输入信号要求最优化。辨识系统常用的输入信号有伪随机序列或白噪声。辨识系统的输出是系统的误差。在确定系统误差时,选择误差准则,用来衡量辨识模型接近被测系统的程度。,四、误差准则函数的泛函表示,f()用得较多的是平方函数:fe(k)=e2(k)e(k)是误差函数,定义区间为0,M,是辨识模型的输出与被测系统的输出之差。如果e(k)=0,则说明被测系统与辨识模型等价。,3.2 系统辨识过程中神经网络的作用3.2.1 神经网
4、络辨识原理一、系统辨识 实质上是一个优化问题,优化准则依靠辨识目的、辨识算法的复杂程度进行选择。二、辨识方法基于算法的辨识方法,适用于线性系统;基于神经网络的辨识方法,适用于非线性系统。1.基于算法的辨识方法要求建立一个模型,该模型依赖于某个参数,把辨识转化成了对模型参数的估计。1)最小二乘法利用最小二乘法原理,通过极小化广义误差的二次方和函数来确定模型的参数。例如一个线性系统模型,在经过一系列的数学变换后转换成最小二乘格式:z(k)=hT(k)+e(k),hT(k)是系统的广义输入,内含原系统输入u(k)和原系统输出y(k);e(k)是系统的广义噪声。2)梯度校正法沿着误差准则函数关于模型参
5、数的负梯度方向,逐步修改模型的参数估计值,直到误差准则函数达到最小。3)极大似然法极大似然法通过极大化似然函数来确定模型参数。,最小二乘法辨识系统,2.基于神经网络的辨识方法人工神经网络辨识那些非线性系统,不需预先知道被测系统的模型。辨识并不在意神经网络以什么形式去逼近实际系统,只关心神经网络的输出与被辨识系统的输出相差多少,误差e(k)能否为0。从辨识的角度出发,只要e(k)小于某一个事先认可的值,对被辨识系统的辨识任务告一段落。,3、神经网络的辨识方法的特点:(1)辨识器由神经网络构成,被辨识对象允许是本质上不能线性化的非线性系统;(2)辨识过程非算法式,由神经网络的训练来实施。辨识结果是
6、网络外部特性拟合系统的输入输出特性,网络内部特性归纳隐藏在输入输出数据中;(3)辨识之前无须对被辨识系统建模,神经网络辨识器的权值反映了被辨识对象的可调参数;(4)辨识过程是否收敛以及收敛速度仅取决于神经网络的结构及其算法,与被辨识系统及其维数无关,有别于与模型参数的维数密切相关的传统算法;(5)神经网络可用于在线控制;(6)神经网络连接权的权值在辨识中对应于模型参数,只要调节这些参数,就能使网络输出逼近系统输出。,3.2.2 多层前向网络的辨识能力1.三层前向网络的逼近能力仅含一个隐层的三层前向网络可以逼近某个函数。,设输入层有n个节点,能接纳n个输入xi(i=1,2,3,n),隐层有q个节
7、点vj(j=1,2,3,q),输出层仅有一个节点。网络的输入矢量为X,输入层到隐层第j个神经元的连接权值矢量用Wj表示,网络的输出为单输出,用y表示。,()是隐层节点的作用函数。,给定函数空间S、映射p,若函数f,g,hS,且满足:(1)p(f,g)0,且仅当f=g时取等号,具有正定性;(2)p(f,g)=p(g,f),具有对称性;(3)三角不等式p(f,g)p(f,h)+p(h,g)成立。(s,p)为赋范空间,映射p称为距离函数或范数。如果URn是n维单位立方体,C(U)是定义在U上的所有连续函数f(X)的集合,定义范数,p=sup|f(X)|,定理1 若神经元特性(t)是连续函数,且,函数
8、f(x)不仅限于连续函数,f(x)是一个非连续函数时定理仍然成立,只要求f(x)在1,1上有定义,且满足平方可积条件。利用傅里叶积分将f(x)展开成傅里叶级数若干个连续函数之和,对每一连续函数,定理1均成立。设f(x)连续,且在连续点处,有限次级数和的三角级数形式为,问题推广到n维(n1),定义矢量的绝对值为其各分量的最大绝对值,在单位空间中定义下列积分:,其中将函数f(x)的集合记为L2(U)。定义范数,则下列定理成立:定理2 若神经元特性(t)是阈值特性,那么()在L2(U)中是p稠密的,即对于fL2(U)及0,g(X),使得,三层前向网络能以任意精度逼近任意连续函数、任意非连续函数及其各
9、阶导数(如果存在导数)。这一性质能用于动态系统辨识,要求神经网络具备逼近各阶导数的能力。,2.多层前向网络的基本结构,1)静态网络的典型例子就是BP网络,该网络的三个特征是多层次结构、S型神经元及反向传播算法(BackPropogation)。静态网络已在模式识别、系统识别、图像处理等方面受到较大的关注。2)动态多层前向网络回归网络是一种动态网络,它的结构特点存在反馈。,或用一段时间内的均方误差值,T选用适宜的一个正整数,并要求输入模式为动态信号。设网络的全部可调参数(例如连接权值和阈值)的集合用表示,网络的当前参数为,J为当前时刻指标函数的梯度,由BP算法知当前参数增量与梯度成正比:=J比值
10、是学习速率或步长。,(1)图(a),有,式中,用W(z)表示一个动态系统,只需要用BP算法静态计算,就能得到当前时刻的。设网络期望输出为,W(z)是一个特定的脉冲传递标量函数。选取多层网N的结构为四层:输入层1个节点,第一隐层20个节点,第二隐层10个节点,输出层1个节点。用多层网N逼近:,逼近过程中W(z)可能有三种情况出现:第一种,取W(z)是纯滞后q步的线性系统,传递函数W(z)=zq,计算并时延q步得 当前值。如取q=5,训练指标用J1,=0.1时训练50 000步可得较好效果。训练指标用J2,=0.2时训练50 000步得相同结果。第二种,取W(z)是有限脉冲响应模型(FIRM),传
11、递函数W(z)=aiz1,计算线性组合以前各时刻的值后可得。如设,W(z)=0.1z1+1.0z2+0.5z3,训练指标用J2,每三步调整一次参数(T=3),=0.01时训练50 000次后N与f基本相同。第三种,取W(z)是稳定的有限传递函数,且能用参数模型描述,如描述模型用ARMA模型。取,训练指标用J1,=0.005时训练10万次,发现y与yq仍有差别。训练指标改用J2,=0.005时训练10万次,取T=5,最终效果较好。(2)对图(b),多层前向网络的映射有两个,现分别确定。,对于N1网络映射,用静态BP算法计算,其中是N1的参数。对于N2网络映射,使用静态BP算法计算 和,求得,或写
12、成,其中,f代表了非线性的关系,有此函数关系的非线性系统均可以用神经网络来逼近。尽管如此,也不能简单地认为:N1能训练成f,N2能训练成g(u)。,用例说明,设N1是结构为120101的单输入单输出系统,取,训练用的输入信号是分布在2,2之间的随机信号。训练好以后,实际输出y与期望输出yq之间无多大的差别。,(3)图(c),设和是当前点上取值的Jacobian矩阵矢量,它们能够在每一时刻求得,成为以下线性差分方程的系数矩阵矢量,式中,是n维矢量,系统传递函数W(z)仅对其后的产生延时作用。如果离散系统通过零阶保持器采样,W(z)至少有一步时延效应,使得W(z)总只包括当前时刻前的各值。按照差分
13、方程能递推出各时刻的值。,(4)图(d),N1的可用与图(c)相同的线性差分方程计算出来,N2则有,仿真结果表明这种动态BP算法能使网络较好地跟踪期望输出。动态反向传播算法比静态反向传播算法复杂得多,导致这种算法存在诸多缺点,其中突出的有两个缺点:一个是必须假设系统可以分成线性系统和非线性系统;另一个是需要已知线性系统的传递函数。,3.2.3 辨识系统中的非线性模型神经网络作系统辨识,主要用于非线性辨识和自适应。非线性系统在能控性、能观性、负反馈调节、状态观测器设计等方面,还没有成熟的做法,难度是非线性系统的辨识模型和控制模型不易选取。为此,用神经网络辨识非线性系统,必须作一些假设限制:(1)
14、被控对象具有能控能观性;(2)对所有可能的输入控制量u,被控对象的输出y存在并有界;(3)在辨识模型中的神经网络允许一个或几个,选用的结构同于被控对象;,(4)辨识模型的基本结构为包含神经网络的串并联结构。以上第(1)、(2)条限制是为了保证整个系统的稳定性及可辨性;第(3)条限制是为了方便选择模型,简化数学处理过程;第(4)条限制源于串并联结构有以下优点:由于被控对象的输出y存在并有界,那么串并联模型中所有用作辨识的信号均有界,使辨识模型易于稳定;串并联模型无反馈网络,使从后向前的静态反向传播算法成为可能;当辨识误差足够小时,不使用串并联结构,只使用并联结构也能有好的效果。,在上述四种假设限
15、制下,能够写出常用的一些非线性典型模型,现举例如下:第一种,这种模型的输出输入关系为,n=2,m=0时的并联结构和串并联结构如图4-6所示。,第二种,,第三种,,并联及串并联模型(a)n=2,m=0时的并联模型;(b)n=2,m=0时的串并联模型,第四种,y(k+1)=f(y(k),y(k1),y(kn),u(k),u(k1),u(km),3.3 非线性动态系统辨识3.3.1 非线性动态系统的神经网络辨识设非线性离散动态系统的状态方程为X(k+1)=X(k),U(k)Y(k)=X(k),U(k)式中,X,Y,U分别是系统的状态矩阵、输出矩阵和输入矩阵,并设X(k)Rn,Y(k)Rp,U(k)R
16、m,设状态方程描述的系统满足以下三个条件:第一条,定义U的取值范围组成的集合为Rm,则U。若X(0)Rm,则对有限个M,系统是稳定的,表现为:X(M)+Y(M)。第二条,函数和当Rn+mRn时连续且满足Lipschitz条件,系统解唯一。由于神经网络用作非线性离散系统辨识模型时属静态网络,用作非线性离散系统的动态模型时还需要满足下一个条件。,第三条,设任意连续函数f:CRp,其中C为闭集,CRp,均存在网络参数W,使网络输出F(X,W)满足,其中,是一个大于0的小正数。满足以上三个条件的神经网络非线性动态系统结构图如图4-7所示,用作系统辨识时有如下定理。定理 考虑到满足第三条的系统状态方程为
17、,对于X(0)=X0Rm,U Rm,为闭集,对于每一0,必存在网络参数W,使得 U,都有满足上述第一条、第二条条件的系统充分接近输出,存在:maxy(k)Y(k)证明过程从略。此定理说明用BP网络组成非线性动态系统时,按上图结构,能构成非线性离散动态系统的精确模型,且有唯一稳定解。,图 神经网络非线性动态系统结构图,3.3.2 单输入单输出非线性动态系统的BP网络辨识选用BP网络辨识,网络的结构可选三层前向网络。其中输入层用u(k)作输入,神经元个数为n1,则n1 n+m+1隐层的神经元个数假设为n2个,可取n2n1隐层神经元个数n2在420个范围内选取,通过仿真比较,选取性能好的那个值。输出
18、层神经元个数设为n3,大小等于被辨识系统的输出个数。,现考虑一个单输入单输出非线性动态系统,设系统的输入及阶次分别为u(k)和m,输出及阶次分别为y(k)和p,系统方程为Y(k+1)=f(y(k),y(k1),u(k),u(km+1)单输入单输出的n1n31。BP网络的输入矢量可写成x(k)=x1(k),x2(k),xn1(k)T因m、p未知,可进行的几种组合,比较性能后选最优的一组。,设输入层用“I”表示,隐层用“H”表示,输入层到隐层的连接权矩阵为wji,对应输入输出关系为,Ij(k)=Hneti(k),阈值对应的状态为x0=1。设输出层用“O”表示,从隐层到输出层的连接权矩阵为Pi,相应
19、输入输出关系为,阈值对应的状态为I0=1。选用的性能指标为:,学习规则采用广义规则,为加快收敛,规则带惯性项,格式如下:,Pi(k)=Pi(k+1)Pi(k)=a1e(k)Ii(k)+a2Pi(k1)wji(k)=a1e(k)Hneti(k)Pi(k)xi(k)+a2wji(k1)e(k)=y(k)yq(k)Hneti(k)=neti(k)(1neti(k),式中,i=1,2,n2;j=1,2,n1,以下同。基于BP网络的系统辨识分6步实施,各步如下。(1)初始化连接权为小的随机值。设Random()为1,+1内均匀分布的随机函数,初始值wji(0)=aRandom()0.1,0.1Pi(0)
20、=aRandom()0.1,0.1(2)选择输入信号u(k),候选的有阶跃、斜坡、正弦波、伪随机二进制序列(PRBS)等信号,只选一种加入系统。(3)仿真计算y(k)。(4)形成输入矢量X(k),计算e(k)。,(5)计算Pi(k)、wji(k)。(6)将u(k)、y(k)移位转入第二步继续。如果是离线辨识,结束循环的判断条件为(预先选定为小的正数)|e(k)|=|y(k)yq(k)|例1 水轮发电机组模型BP网络辨识。本例选自参考文献3。水轮发电机组在线辨识系统结构如图4-8所示。从结构图中看到,水轮发电机组模型的输入信号除正常PC调节器调节信号外,还叠加有一个二位式伪随机M序列信号PRES
21、,由STD工控机参数在线辨识产生。,辨识系统运行状态如下:水轮发电机组在三种典型工况下运行,分别是空载、带地区小负荷、并入大电网。机组工作于空载运行时,转换开关S接入“电气手动”时,水轮发电机组呈现开环调节系统运行。机组工作于带地区小负荷运行时,转换开关S接入“PC调节器”输出,整个系统是一个受命于给定值的负反馈调节系统,由于负载较轻,参数在线辨识装置的输入基本上与“空载运行”相同。机组工作于“并入大电网”时,S仍拨在“PC调节器”输出位置上,负反馈调节继续有效,但辨识装置的输入却不同于“带地区小负荷运行”,由于机组的频率同于外电网的频率,辨识装置的输入为水轮机导叶开度和机组所带的外部有功负荷
22、。对于混流式机组,在小波动工况下,转速v(s)对导叶开度k(s)的传递函数表示成,式中,T、T0分别是机组及引水道的惯性时间常数,e0、e、a、b均是水轮机组的特性参数。水轮发电机组启动后,先空载运行,随后切换到电气手动运行,频率基准50 Hz,此时实际空载开度约20%。输入信号选用5级PRBS,单位游历t=4 s,采样周期为0.4 s,幅值取导水机构接力器全行程的2%,记录1000次,用时6 min 40 s,记录下三个完整的PRBS周期。数据处理时去掉稳态分量,得到机组频率的相对变化曲线,如图3-9(a)所示。,使用三层BP神经网络辨识,网络结构选用321,学习率=0.65,初始连接权在0
23、,1间随机取值,用基本BP算法得到的BP输出如图b)所示,图(c)给出了实际输出与BP网络输出之间的差别,从差别极微可以看到,BP网络能较理想辨识出水轮发电机组非线性动态模型。,3-9 水轮发电机组的BP动态辨识曲线(a)实际机组频率输出变化;(b)BP网络辨识结果;(c)实际测出结果与BP辨识之差,例2 煤气加热炉的BP动态辨识。煤气加热炉是典型的单输入单输出系统,输入u(t)是煤气流量,输出y(t)是排除烟道中CO2的浓度。输入输出的数据能够测得。模型的动态结构可以写成 Y(k)=f(y(k1),y(k2),y(k3),u(k3),u(k7)+cq1(k)式中,取模型的阶次n=3,m=5,
24、时滞d=2。c、q、是系统结构参数。用来辨识的前向网络选用三层,输入层、隐层、输出层的神经元个数分别为n1=8、n2=7、n3=1。,在进行训练前测得有289对u(i),y(i)数据对,可选择其中200对训练隐层(如果隐层选取10个神经元,则可选用170对数据进行训练)。在训练前,所有数据对应进行正规化处理。训练使用带修正项的BP算法,性能指标选择均方误差函数:,两种不同模型训练后的辨识结果比较如表4-1所示。,系统经过学习后,可将测量所得289对数据中的余下数据对与BP网络的输出进行比对,就可以测得使用BP网络的辨识准确程度。图4-10给出了BP网络辨识结果及预报曲线,从图中观察到,预报时间
25、较长,但预报的准确程度较为满意。网络学习过程中均方误差(MSPE)变化曲线如图4-11所示。变化趋势显示出BP网络能够用于辨识,但与隐层神经元个数、输入输出阶次等有密切的关系。,图 BP网络辨识结果及预报(a)辨识结果;(b)预报,图 BP网络学习过程中的均方误差变化,例3 多输入多输出动态系统的BP网络动态辨识。现以两输入两输出系统为例介绍,设系统为一线性系统,传递矩阵为,其中,,A(z1)=1+0.883z1+0.471z2+0.083z3B11(z1)=3z13.5z21.5zzB12(z1)=z10.167z20.167z3B21(z1)=4z22z3z4B22(z1)=z10.167
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 神经网络 第三
链接地址:https://www.31ppt.com/p-5371286.html