AlphaGo小白的人工智能之路ppt课件.pptx
《AlphaGo小白的人工智能之路ppt课件.pptx》由会员分享,可在线阅读,更多相关《AlphaGo小白的人工智能之路ppt课件.pptx(40页珍藏版)》请在三一办公上搜索。
1、小白的人工智能之路,AlphaGo & AlphaGo Zero,在接下来的一个小时中,你将会,认识“谁”是可爱的 AlphaGo 还有它的兄弟 AlphaGo Zero探知 AlphaGo 和 AlphaGo Zero的实现原理 深度神经网络蒙特卡洛树搜索有监督学习做自己的井字棋 AI /人机对弈程序 易于实现的极大极小树算法,AlphaGo Human or AI?,AlphaGo 战绩,2016年1月27日 AlphaGo 以 5:0 完胜欧洲围棋冠军樊麾2016年3月9日到15日 挑战世界围棋冠军李世石的AlphaGo 以 4:1 取得胜利2017年5月23日到27日 乌镇围棋峰会,
2、AlphaGo 以 3:0 战胜世界围棋冠军柯洁,AlphaGo 家族AlphaGo AlphaGo Zero Alpha Zero,AlphaGo:于2014年开始由Google DeepMind开发的人工智能围棋软件。它以人类围棋高手的棋谱作为参考数据。AlphaGo Zero: AlphaGo的团队于2017年10月19日在自然杂志上发表了一篇文章,介绍了AlphaGo Zero,这是一个没有用到人类数据的版本(围棋棋盘大小与规则除外),比以前任何击败人类的版本都要强大。通过跟自己对战,AlphaGo Zero经过3天的学习,以100:0的成绩超越了AlphaGo Lee的实力,21天后
3、达到了AlphaGo Master的水平,并在40天内超过了所有之前的版本。 Alpha Zero:AlphaZero使用与AlphaGo Zero类似但更一般性的算法,在不做太多改变的前提下,并将算法从围棋延伸到将棋与国际象棋上。,AlphaGo 家族有多可怕?!,训练第 0 天的 AlphaGo Zero 什么都不懂,训练第 3 天打败 AlphaGo Lee,训练第 21 天打败 AlphaGo Master,训练第 40天超越了此前AlphaGo 系列的所有成员。,AlphaGo 家族有多可怕?!,AlphaZero在短时间训练后能达到其他算法的同等或更高水平,AlphaGo 走下神坛
4、,AlphaGo 的胜利意味着AI技术有了突破性的进展?AlphaGo 的胜利意味着机器打败人脑?答案是否定的。其实,AlphaGo在算法层面上并没有太多新意,而是通过 Google 强大的团队和计算平台,把已有的技术整合在一起,利用大量的训练数据和计算资源来提高准确性。AlphaGo = 蒙特卡洛树搜索算法(MCTS) + 深度神经网络,博弈树,把游戏看作一棵树每个结点是一种游戏状态。,常见对弈游戏的状态复杂度对比,围棋的状态复杂度为10170,那么10的170次方意味着什么呢?,这个规模十分可怕!,由于不能将所有状态都遍历一次,于是AlphaGo使用“蒙特卡罗树搜索”算法(MCTS),先从
5、蒙特卡罗方法开始: 假设我们要计算一个不规则图形的面积。蒙特卡罗方法基于这样的思想:假想你有一袋豆子,把豆子均匀地朝这个图形上撒,然后数这个图形之中有多少颗豆子,这个豆子的数目就是图形的面积。当你的豆子越小,撒的越多的时候,结果就越精确。,AlphaGo 什么是蒙特卡罗树搜索(MCTS)?,图:计算机蒙特卡罗方法模拟借助计算机程序可以生成大量随机的、均匀分布坐标点,统计出图形内的点数,通过它们占总点数的比例和坐标点生成范围的面积就可以求出图形面积。,AlphaGo 什么是蒙特卡罗树搜索(MCTS)?,如何让计算机“看懂棋局”: AlphaGo中一个游戏状态的大小是19*19*17。不仅要考虑当
6、前棋盘状态,还要考虑前几次下棋的位置。其中19*19是围棋棋盘的大小, 17=8+8+1: 1、过去8步的黑棋位置 2、过去8步的白棋位置 3、当前走棋方(黑棋/白棋),AlphaGo 什么是蒙特卡罗树搜索(MCTS)?,蒙特卡罗树的一个结点:对应一个游戏盘面树节点的子结点:从该状态出发可以产生的后续状态父结点到子结点的边:落子动作每个结点还具有信息 N 和 W:N = 结点(动作)被选择的次数W = 所有子结点的价值总和价值:获胜的期望值, -1为负, 0为平, 1为胜。,图:一棵蒙特卡罗树,AlphaGo 什么是蒙特卡罗树搜索(MCTS)?,蒙特卡罗树搜索的一次迭代包括四个阶段 :选择、扩
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- AlphaGo 人工智能 ppt 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-1375299.html