人工智能知识表示与推理博弈树搜索.ppt
《人工智能知识表示与推理博弈树搜索.ppt》由会员分享,可在线阅读,更多相关《人工智能知识表示与推理博弈树搜索.ppt(60页珍藏版)》请在三一办公上搜索。
1、2023/6/13,人 工 智 能Artificial Intelligence(AI),2023/6/13,2.4 博弈问题的搜索技术 2.4.1 博弈问题的表达 2.4.2 极大极小搜索过程 2.4.3-剪枝法,2023/6/13,2.4.1 博弈问题的表达,博弈是一类具有竞争性的智能活动双人博弈:即两位选手对垒,轮流依次走步,其中任何一方都完全知道对方过去已经走过的棋步和今后可能的走步,其结果是一方赢(而另一方则输),或双方和局,2023/6/13,博弈的例子:一字棋跳棋中国象棋围棋五子棋,2023/6/13,双方的智能活动,任何一方都不能单独控制博弈过程,而是由双方轮流实施其控制对策的
2、过程,博弈的特点:,2023/6/13,如何根据当前的棋局,选择对自己最有利的一步棋?!,人工智能中研究的博弈问题:,2023/6/13,用博弈树来表示,它是一种特殊的与或图。节点代表博弈的格局(即棋局),相当于状态空间中的状态,反映了博弈的信息。与节点、或节点隔层交替出现,博弈问题的表示:,2023/6/13,假设博弈双方为:MAX和MIN在博弈过程中,规则是双方轮流走步。在博弈树中,相当于博弈双方轮流扩展其所属节点,为什么与节点、或节点隔层交替出现?,2023/6/13,从MAX方的角度来看:所有MIN方节点都是与节点理由:因为MIN方必定选择最不利于MAX方的方式来扩展节点,只要MIN方
3、节点的子节点中有一个对MAX方不利,则该节点就对MAX方不利,故为“与节点”,2023/6/13,从MAX方的角度来看:所有属于MAX方的节点都是“或节点”理由:因为扩展MAX方节点时,MAX方可选择扩展最有利于自己的节点,只要可扩展的子节点中有一个对已有利,则该节点就对已有利,MAX,好招,2023/6/13,总之从MAX方来说,与节点、或节点交替出现;反之,从MIN方的角度来看,情况正好相反,2023/6/13,在博弈树中,先行一方的初始状态对应着树的根节点,而任何一方获胜的最终格局为目标状态,对应于树的终叶节点(可解节点或本原问题),但是,从MAX的角度出发,所有使MAX获胜的状态格局都
4、是本原问题,是可解节点,而使MIN获胜的状态格局是不可解节点,2023/6/13,例 Grundy博弈:分配物品的问题如果有一堆数目为N的钱币,由两位选手轮流进行分配,要求每个选手每次把其中某一堆分成数目不等的两小堆,直至有一选手不能将钱币分成不等的两堆为止,则判定这位选手为输家,2023/6/13,用数字序列加上一个说明来表示一个状态:(3,2,1,1,MAX)数字序列:表示不同堆中钱币的个数说明:表示下一步由谁来分,即取MAX或MIN,2023/6/13,现在取N7的简单情况,并由MIN先分,注:如果MAX走红箭头的分法,必定获胜,所有可能的分法,(7,MIN),(6,1,MAX),(5,
5、2,MAX),(4,3,MAX),(5,1,1,MIN),(4,2,1,MIN),(3,2,2,MIN),(3,3,1,MIN),(4,1,1,1,MAX),(3,2,1,1,MAX),(2,2,2,1,MAX),(2,2,1,1,1,MIN),(3,1,1,1,1,MIN),(2,1,1,1,1,1,MAX),2023/6/13,对于比较复杂的博弈问题,只能模拟人的思维“向前看几步”,然后作出决策,选择最有利自己的一步。即只能给出几层走法,然后按照一定的估算办法,决定走一好招,2023/6/13,2.4.2 极大极小过程,对于复杂的博弈问题,要规定搜索深度与时间,以便于博弈搜索能顺利进行,假
6、设由MAX来选择走一步棋,问题是:MAX如何来选择一步好棋?,2023/6/13,对于每一格局(棋局)给出(定义或者倒推)一个静态估价函数值。值越大对MAX越有利,反之越不利,极大极小过程的基本思路:,2023/6/13,对于给定的格局,MAX给出可能的走法,然后MIN对应地给出相应的走法,这样重复若干次,得到一组端节点(必须由MIN走后得到的,由MAX下的棋局)。这一过程相当于节点扩展注:博弈树深度或层数一定是偶数,2023/6/13,对于每一个端节点,计算出它们的静态估价函数,然后自下而上地逐层计算倒推值,直到MAX开始的格局。在MIN下的格局中取估值的最小值,在MAX下格局中取估值的最大
7、值 取估值最大的格局作为MAX要走的一招棋,2023/6/13,例:向前看一步的两层博弈树,2023/6/13,定义静态函数e(P)的一般原则:,2023/6/13,OPEN:存放待扩展的节点,此时为队列,即以宽度优先的策略扩展节点CLOSED:存放已扩展的节点,此时为堆栈,即后扩展的节点先计算静态估价函数值,符号:,2023/6/13,1、将初始节点 S 放入 OPEN 表中,开始时搜索树 T 由初始节点 S 构成2、若 OPEN 表为空,则转53、将 OPEN 表中第一个节点 n 移出放入CLOSED 表的前端,极大极小搜索过程为:,2023/6/13,4、若 n 可直接判定为赢、输、或平
8、局,则令对应的 e(n)=,-或 0,并转2;否则扩展 n,产生 n 的后继节点集 ni,将 ni 放入搜索树 T 中,2023/6/13,此时,若搜索深度d ni 小于预先设定的深度 k,则将 ni 放入OPEN表的末端,转2;否则,ni 达到深度k,计算e(ni),并转2,(续),2023/6/13,5、若CLOSED表为空,则转8;否则取出CLOSED表中的第一个节点,记为 np,Open为空,即已经扩展完节点,步2,2023/6/13,6、若 np 属于MAX层,且对于它的属于MIN层的子节点 nci 的 e(nci)有值,则:e(np)=max nci,某一个节点属于MAX的含义是该
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 知识 表示 推理 博弈树搜索

链接地址:https://www.31ppt.com/p-5194344.html