神经网络讲义第7章.ppt
《神经网络讲义第7章.ppt》由会员分享,可在线阅读,更多相关《神经网络讲义第7章.ppt(49页珍藏版)》请在三一办公上搜索。
1、2023/10/3,1,第七章 径向基网络 BP网络在训练过程中需要对网络的所有权值和阈值进行修正,把它称之为全局逼近神经网络。全局逼近神经网络学习速度很慢,所以在一些实时性较强的场合(如实时控制),其应用受到限制。径向基网络是一种局部逼近网络,对于每个训练祥本,它只需要对少量的权值和阈值进行修正,因此训练速度快。,2023/10/3,2,7.1 径向基网络模型 径向基函数(radial basis function,RBF)方法是在高维空间进行插值的一种技术。Bromhead和Love在1998年率先使用该技术,提出了神经网络学习的一种新手段。,2023/10/3,3,径向基神经元模型 径向
2、基神经元模型如图7.1 所示。输入 神经元 图7.1径向基神经元模型,2023/10/3,4,其输出表达式为式中:radbas 为径向基函数,一般为高斯函数:其光滑性好,径向对称,形式简单,有 称之为欧几里得距离。,2023/10/3,5,径向基函数的图形和符号如图7.2 所示。图7.2 径向基传输函数的传输特性和符号,2023/10/3,6,2.径向基神经网络模型 径向基神经网络同样是一种前馈反向传播网络,它有两个网络层:隐层为径向基层;输出为一线性层,如图7.3 所示。输入向量 径向基层 线性层 图7.3 径向基函数网络模型,2023/10/3,7,网络的输出为,2023/10/3,8,式
3、中:表示取矩阵向量主对角线上的元素组成的列向量;“”和“”分别表示数量乘方或数量乘积(即矩阵中各对应元素的乘方或乘积)。,2023/10/3,9,下面讨论径向基网络的工作特性。从图7.2 所示的径向基传输函数可以看出,只有在距离为0时,其输出为1;而在距离为0.833 时,输出仅为0.5。假如给定一个输入向量,径向基神经元将根据各输入向量与每个神经元权值的距离输出一个值,那些与神经元权值相差很远(距离大)的输入向量产生的输出值趋于0,这些很小的输出值对线性神经元输出的影响可以忽略;相反,那些与神经元权值相差较小(距离小)的输入向量产生的输出值趋于1,从而激活第二层线性神经元的输出权值。,202
4、3/10/3,10,换句话说:径向基网络只对那些靠近(距离接近于0的中央位置)输入权值向量的输入产生响应。由于隐层对输入信号的响应,只在函数的中央位置产生较大的输出,即局部响应,所以该网络具有很好的局部逼近能力。,2023/10/3,11,可以从两方面理解径向基网络的工作原理:(1)从函数逼近的观点看:若把网络看成是对未知函数的逼近,则任何函数都可以表示成一组基函数的加权和。在径向基网络中,相当于选择各隐层神经元的传输函数,使之构成一组基函数逼近未知函数。,2023/10/3,12,(2)从模式识别的观点看:总可以将低维空间非线性可分的问题映射到高维空间,使其在高维空间线性可分。在径向基网络中
5、,隐层的神经元数目一般比标准的BP网络的要多,构成高维的隐单元空间,同时,隐层神经元的传输函数为非线性函数,从而完成从输入空间到隐单元空间的非线性变换。只要隐层神经元的数目足够多,就可以使输入模式在隐层的高维输出空间线性可分。,2023/10/3,13,在径向基网络中,输出层为线性层,完成对隐层空间模式的线性分类,即提供从隐单元空间到输出空间的一种线性变换。,2023/10/3,14,7.2 径向基网络的创建与学习过程 从图7.3 所示径向基网络的结构上看,当隐层和输出层神经元的权值与阈值确定后,网络的输出也就确定了。所以径向基网络的学习,仍然是各网络层权值和阈值的修正过程。因为径向基网络设计
6、函数newrbe和newrb在创建径向基网络的过程中,就以不同的方式完成了权值和阈值的选取和修正,所以径向基网络没有专门的训练和学习函数,下面分别予以说明。,2023/10/3,15,1.newrbe 创建径向基网络的过程 以newrbe 创建径向基网络的步骤:(1)在隐含层,径向基神经元数目等于输入样本数,其权值等于输入向量的转置:,2023/10/3,16,所有径向基神经元的阈值为 式中:spread 为径向基函数的扩展系数,默认值为1.0。合理选择spread 是很重要的,spread 的值越大,其输出结果越光滑;但太大的spread 值会导致数值计算上的困难。若在设计网络时,出现“Ra
7、nk deficient”,警告时,应考虑减小spread 的值,重新进行设计。,2023/10/3,17,(2)在输出层,以径向基神经元的输出作为线性网络层神经元的输入,确定线性层神经元的权值和阈值,使之满足(解如下方程)可以看出,上述过程只要进行一次就可以得到一个零误差的径向基网络:所以newrbe 创建径向基网络的速度是非常快的。但由于其径向基神经元数等于输入样本数,、当输入向量数目很大时,将导致网络的规模也很大,所以更有效的方法是采用newrb 创建径向基网络。,2023/10/3,18,2.newrb 创建径向基网络的过程 当以newrb 创建径向基网络时,开始是没有径向基神经元的,
8、可通过以下步骤,逐渐增加径向神经元的数目:(1)以所有的输入样本对网络进行仿真。(2)找到误差最大的一个输入样本。(3)增加一个径向基神经元:其权值等于该样本输入向量的转置;阈值:spread 的选择与newrbe 一样。,2023/10/3,19,(4)以径向基神经元输出的点积作为线性网络层神经元的输入,重新设计线性网络层,使其误差最小。(5)当均方误差未达到规定的误差性能指标,且神经元的数目未达到规定的上限值时,重复以上步骤,直至网络的均方误差达到规定的误差性能指标,或神经元的数目达到规定的上限值时为止。,2023/10/3,20,可以着出,创建径向基网络时,newrb是逐渐增加径向基神经
9、元数的,所以可以获得比newrbe 更小规模的径向基网络。,关于径向基网络设计函数newrbe 和newrb 的译解可参见附录。,2023/10/3,21,7.3 其他径向基神经网络1泛化回归神经网络 泛化回归神经网络GRNN(generalized regression NN)常用于函数逼近,其网络结构如图7.4所示,它具有一个径向基网络层和一个特殊的线性网络层。,2023/10/3,22,输入向量 径向基层 线性层 图7.4 GRNN 模型,2023/10/3,23,图中,标有nprod的方框实现 的归一化点乘运算(以权值函数normprod 完成),其结果 的点乘,并以 所有元素的和进行
10、归一化,最后 作为线性神经元的加权输入。,2023/10/3,24,GRNN 的第一层与newrbe创建的RBF一样,其径向基神经元数目等于输入样本数:其权值等于输入向量的转置;阈值为:其第二层神经元数也等于输入样本数,其:目标向量为 权值等于目标向量为 无阈值向量。同样,不需要训练。函数newgrnn的详解可参见附录。,2023/10/3,25,2 概率神经网络 概率神经网络PNN(probabilistic neural networks)常用于模式分类,其网络结构如图7.5所示,它具有一个径向基网络层和一个竞争型网络层。输入向量 径向基层 竞争层 图7.5 PNN 模型,2023/10/
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 神经网络 讲义
链接地址:https://www.31ppt.com/p-6190630.html