第12章精炼贝叶斯Nash均衡ppt课件.ppt
《第12章精炼贝叶斯Nash均衡ppt课件.ppt》由会员分享,可在线阅读,更多相关《第12章精炼贝叶斯Nash均衡ppt课件.ppt(65页珍藏版)》请在三一办公上搜索。
1、第四部分: 不完全信息动态博弈,第十二章 精炼贝叶斯Nash均衡,主要内容:一、均衡的精炼与信念二、信念设定三、精炼贝叶斯Nash均衡四、几种均衡概念的比较,主要内容:一、均衡的精炼与信念二、信念设定三、精炼贝叶斯Nash均衡四、几种均衡概念的比较,第十二章 精炼贝叶斯Nash均衡,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,在完全信息动态博弈中,假设s*为一子博弈精炼Nash均衡,那么在参与人采用均衡战略s*的情况下,不管博弈的进程如何或是否发生,每个参与人的战略对从任一决策结开始的
2、子博弈(或在其后轮着他采取的行动)都是最优的。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,子博弈精炼Nash均衡中的这种“均衡精炼”的思想,也可应用到不完全信息扩展式博弈中。作为上述“均衡精炼”思想的自然应用,必然要求每个参与人的均衡战略在其每个信息集上都为最优。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例如,Control Science and Engineering
3、, HUST All Rights Reserved, 2007, Luo Yunfeng,不仅要求参与人2的均衡战略在由单决策结构成的信息集上最优,而且还要求参与人3的均衡战略在由多决策结构成的信息集和上最优。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,但对于位于由多决策结构成的信息集(I3(x4,x5)或I3(x6,x7)上的参与人3,当轮到他行动时,由于对已发生的历史即参与人2是选择了L还是R并不清楚,因此也就不知道自己是位于决策结x4 (或x6)还是决策结x5 (或x7)上。
4、,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,在这种情况下,参与人3对信息集 (I3(x4,x5)或I3(x6,x7)后的博弈进程就不清楚,因而对自己的选择所导致的博弈结果也就不清楚,从而使得参与人3无法确定自己的最优行动。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,虽然位于多决策结信息集上的参与人,对自己到底位于信息集中哪一个决策结上不能给出一个明确的判断,但一般情况下还是
5、能够对自己位于哪一个决策结,给出一个“大概的估计”。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,当位于多决策结信息集上的参与人能够用一个定义在该信息集上的概率分布,来对自己位于哪一个决策结进行描述时,就称参与人在该信息集上具有了关于自己位于哪一个决策结的信念(或推断)。而当参与人具有了关于自己位于哪一个决策结的信念(或推断)时,就可借助这种信念(或推断)来指导自己的决策(或选择)。,Control Science and Engineering, HUST All Rights Re
6、served, 2007, Luo Yunfeng,考察如下完全但不完美信息动态博弈:,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,如果参与人1选择R,则博弈结束(参与人2没有行动)。如果参与人1选择了L或M,则参与人2就会知道1没有选择R(但不清楚1是选择了L还是M),并在L和R两个行动中进行选择,博弈随之结束。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,给出了上述博弈的战
7、略式描述,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,在两个子博弈精炼Nash均衡中,均衡(R, R ) 明显要依赖于一个不可信的威胁,因此,该博弈只有一个合理的纯战略子博弈精炼Nash均衡(L, L ),Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,根据Selten所给出的子博弈精炼Nash均衡的定义,是无法将不合理的子博弈精炼Nash均衡(R, R )排除掉的。,Contro
8、l Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,如果能将子博弈精炼Nash均衡的思想推广到多决策结信息集,并在每个信息集上给出一个参与人关于自己位于该信息集中哪一个决策结的信念(或推断),则可以将某些不合理均衡剔除掉。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,给定参与人2的一个推断,p表示参与人2位于左边决策结的概率为p,1-p表示参与人2位于右边决策结的概率为1-p。参与人2选择L的期望
9、收益为:,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,而参与人2选择R的期望收益为:,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,由于对任意的p,都有2-p1-p,这就排除了参与人2选择R的可能性。因此,在上述博弈中,简单要求参与人2持有一个推断,并且在此推断下选择最优行动,就足以使我们排除不合理的均衡(R,R)。,Control Science and Engineering
10、, HUST All Rights Reserved, 2007, Luo Yunfeng,考察更一般情形的博弈:,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,在该博弈中,战略组合(R,R )也是参与人2的信息集未能达到的一个子博弈精炼Nash均衡。如果参与人2的信息集一旦能够达到,参与人2的最优选择就依赖于他关于已发生历史的信念,即一旦博弈进入参与人2的信息集,参与人2关于自己位于哪一个决策结的推断。,Control Science and Engineering, HUST All
11、 Rights Reserved, 2007, Luo Yunfeng,参与人2选择L与R的期望收益分别为2-p和1+p,因此,如果p1/2,则最优战略为R;如果p1/2 ,则最优战略为L。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,要将子博弈精炼Nash均衡中“均衡精炼”的思想应用到不完全信息扩展式博弈中,就必须做到:,对每个参与人i,在其信息集上给出关于自己位于该信息集中哪一个决策结的信念(或推断);对参与人i的每个信息集,在给定参与人i在该信息集上的信念(或推断)情况下,参与人
12、的战略是对其他参与人战略的一个最优反应,即参与人的选择必须满足序惯理性(sequential rationality)。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,主要内容:一、均衡的精炼与信念二、信念设定三、精炼贝叶斯Nash均衡四、几种均衡概念的比较,第十二章 精炼贝叶斯Nash均衡,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,精炼贝叶斯Nash均衡既包含了一个战略组合,
13、又包含一个信念系统。这里信念系统对每个信息集都确定了位于该信息集上的参与人所持有的信念。这种信念是信念持有人对已发生历史的一个推断,也可理解为他对自己位于信息集上哪一个决策结的“一种估计”。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,通过给定参与人在信息集上的信念,来对不完全信息扩展式博弈的均衡进行精炼,是Selten子博弈精炼Nash均衡中“均衡精炼”的思想在不完全信息扩展式博弈中的自然应用。,Control Science and Engineering, HUST All Ri
14、ghts Reserved, 2007, Luo Yunfeng,给定参与人的均衡战略,参与人的信念必须满足:,与战略的一致性(consistency with strategies)原则;结构一致性(structural consistency)原则;共同信念(common beliefs)原则。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,与战略的一致性原则指导不完全信息扩展式博弈中处于均衡路径之上信息集的信念设定;结构一致性原则应用于处于均衡路径之外信息集的信念设定;共同信念原则
15、是博弈问题解的特性所决定的对博弈问题的结构要求。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,定义,对于一个给定的不完全信息扩展式博弈中给定的均衡,如果博弈根据均衡战略进行时将以正的概率达到某信息集,称此信息集处于均衡路径之上(on the equilibrium path)。反之,如果博弈根据均衡战略进行时,肯定不会达到某信息集,称之为处于均衡路径之外的信息集(off the equilibrium path),简称非均衡路径信息集。,Control Science and Engi
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 12 精炼 贝叶斯 Nash 均衡 ppt 课件

链接地址:https://www.31ppt.com/p-1353960.html