欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    人工神经网络与人机博弈.ppt

    • 资源ID:5194571       资源大小:1.14MB        全文页数:21页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    人工神经网络与人机博弈.ppt

    人工神经网络与人机博弈,温文欢 王衎 杨磊 王宇飞 赵静 李娜 廖婷婷 陈芬 黄鹏飞 李浩攀,总目录,生物学的神经网络,动物的大脑结构 分为灰色的外层和白色的内层。灰色层只有几毫米厚,其中紧密地压缩着几十亿个被称作神经元的微小细胞。白色层在皮层灰质的下面,占据了皮层的大部分空间,是由神经细胞相互之间的无数连接组成。皮层象核桃一样起皱,这可以把一个很大的表面区域塞进到一个较小的空间里。这与光滑的皮层相比能容纳更多的神经细胞。人的大脑大约含有1OG(即100亿)个这样的微 小处理单元,生物学的神经网络,神经细胞 神经细胞都长着一根像电线一样的称为轴突(axon)的东西,它的长度有时伸展到几厘米,用来将信号传递给其他的神经细胞。它由一个细胞体、一些树突、和一根可以很长的轴突组成。神经细胞利用电-化学过程交换信号。输入信号来自另一些神经细胞。这些神经细胞的轴突末梢和本神经细胞的树突相遇形成突触,信号就从树突上的突触进入本细胞。大脑的神经细胞只有两种状态:兴奋和不兴奋。发射信号的强度不变,变化的仅仅是频率。神经细胞把所有从树突上突触进来的信号进行相加,如果全部信号的总和超过某个阀值,就会激发神经细胞进入兴奋状态,这时就会有一个电信号通过轴突发送出去给其他神经细 胞。,神经网络特点,能实现无监督的学习不存在导师,网络根据外部数据的统计规律来调节系统参数,以使网络输出能反映数据的某种特性。对损伤有冗余性 大脑即使有很大一部分受到了损伤,它仍然能够执行复杂的工作。处理信息的效率极高神经细胞采用了并行的工作方式,使得大脑能够同时处理大量的数据。善于归纳推广 极擅长的事情之一就是模式识别,并能根据已熟悉信息进行归纳推广。它是有意识的这个在人工神经网络中不予讨论。,人工神经网络,模拟大脑的人工神经网络ANN是由许多叫做人工神经细胞(也称人工神经原,或人工神经元)的细小结构模块组成。人工神经细胞就像真实神经细胞的一个简化版,但采用了电子方式来模拟实现。一个人工神经细胞可以有任意n个输入,n代表总数。可以用下面的数学表达式来代表所有n个输入:x1,x2,x3,x4,x5,.,xn 同样 n 个权重可表达为:w1,w2,w3,w4,w5.,wn 那么激励值就是所有输入与它们对应权重的之乘积之总和。,如下图,网络的每一层神经细胞的输出都向前馈送到了它们的下一层,直到获得整个网络的输出为止。这一种类型的神经网络就叫前馈网络。网络共有三层(输入层不是神经细胞,神经细胞只有两层)。输入层中的每个输入都馈送到了隐藏层,作为该层每一个神经细胞的输入;然后,从隐藏层的每个神经细胞的输出都连到了它下一层(即输出层)的每一个神经细胞。图中仅仅画了一个隐藏层,作为前馈网络,一般地可以有任意多个隐藏层。,人工神经网络,神经网络的人机博弈应用,人机博弈的重要事件,1988年,“深思”击败丹麦特级大师拉尔森1989年,每秒思考速度达200万步的“深思”0 比2不敌卡斯帕罗夫1993年,“深思”二代击败了丹麦国家队,在与前女子世界冠军小波尔加的对抗中获胜1996年,性能高于“深思”数百倍的“深蓝”以2比4负于卡斯帕罗夫1997年,“更深的蓝”以3.5比2.5击败了卡斯帕罗夫2001年,一家德国公司开发的国际象棋软件“更弗里茨”击败了除克拉姆尼克之外的所有排名世界前十位的棋手2002年10月,“更弗里茨”与克拉姆尼克在巴林进行“人机大战”,双方以4比4战平2003年1至2月 由两位以色列电脑专家研究出的“更年少者”与卡斯帕罗夫对弈,双方3比3战平。,1997年卡斯帕罗夫与深蓝2的人机大战,2003年卡斯帕罗夫与更年少者的人机大战,神经网络的人机博弈应用,Gerald Tesauro 的西洋双六棋 西洋双陆棋是西方一种状态空间比较大的棋类游戏。1992年,IBM的工程师Gerald Tesauro利用人工神经网络,编写出一款双六棋程序TD-Gammon。在本例中使用的神经网络包含198 个输入节点、80个隐含节点和1 个输出节点。其中输入节点输入的是棋盘的局面特征,输出的是对棋盘的评估值。,http:/,有兴趣的可以参考,五子棋 在本例中用这种方法的五子棋程序采用BP 神经网络来求评估值,网络即为局面评估函数 f。它有56个输入节点,28 个隐含节点和2 个输出节点。,输入节点中有28 个代表计算机局面的特征,另 28 个代表对手局面的特征。2 个输出节点分别是对计算机棋手局面与对手局面的评估,两个值相减得到对局面的评估值。,莫建文等.基于TD强化学习智能博弈程序的设计与实现J.计算机应用,2004,24(6):287-288,有兴趣的可以参考,小实验:井字过三关,介绍:即课本第一章习题1.5中提到的tic-tac-toe。两个玩家,一个打圈(O),一个打叉(X),轮流在3乘3的格上打自己的符号,最先以横、直、斜连成一线则为胜。先下玩家有优势,双方无失误,将是和局。,一个空白的棋盘,一场游戏的过程,原理概述设计由九个感知器组成的单层人工神经网络输入:将棋局分布用九位的二进制数表示,每一位作为一个输入。对方 用-1 表示;己方 用 1 表示;空白格用 0 表示。例子:1-1-1 0 1 0 1 0-1输出:应该落子的位置输出为1 其余位置输出为0,部分输入向量,对应的目标输出值,部分训练样例,实验利用Matlab中的神经网络工具箱来进行,将输入向量和目标输出分别保存为p_1和t_1两个文件,建立神经网络进行训练。学习速率取0.05,训练次数定为1000次。,训练结果 经过训练,对部分棋局能作出正确判断,但有时也会出现不正确的结果。,成功的例子,失败的例子,网络过于简单?,进一步的改进,利用多层前馈网络,http:/homepages.cae.wisc.edu/ece539/project/f01/index.html,有兴趣的可以参考,程序演示,谢谢,

    注意事项

    本文(人工神经网络与人机博弈.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开