第10章 贝叶斯博弈与贝叶斯Nash均衡ppt课件.ppt
《第10章 贝叶斯博弈与贝叶斯Nash均衡ppt课件.ppt》由会员分享,可在线阅读,更多相关《第10章 贝叶斯博弈与贝叶斯Nash均衡ppt课件.ppt(144页珍藏版)》请在三一办公上搜索。
1、第三部分:不完全信息静态博弈,第十章贝叶斯博弈与贝叶斯Nash均衡,主要内容:一、贝叶斯博弈二、贝叶斯Nash均衡三、贝叶斯Nash均衡的应用四、关于混合战略Nash均衡的一个解释,主要内容:一、贝叶斯博弈二、贝叶斯Nash均衡三、贝叶斯Nash均衡的应用四、关于混合战略Nash均衡的一个解释,第十章贝叶斯博弈与贝叶斯Nash均衡,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,一、贝叶斯博弈,前面两部分我们讨论了完全信息博弈问题,但在现实生活中我们遇到更多的可能是不完全信息博弈问题。,Cont
2、rol Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,例如,在“新产品开发”博弈中,企业对市场的需求可能并不清楚;在连锁店博弈中,潜在的进入者可能并不知道连锁店在市场上的盈利情况,等等。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,将这种博弈开始时就存在事前不确定性的博弈问题是不完全信息博弈问题。,Control Science and Engineering,HUST All Rights Reserve
3、d,2007,Luo Yunfeng,例如:“斗鸡博弈”,考察这样的情形:假设参与人可能有这样的两种性格特征(类型)“强硬”(用s表示)或“软弱”(用w表示)。所谓“强硬”的参与人是指那些喜欢争强好胜、不达目的誓不罢休的决斗者;而“软弱”的参与人是指那些胆小怕事、遇事希望息事宁人的决斗者。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,显然,当具有不同性格特征的决斗者相遇时,所表现出来的博弈情形是不同的。令U表示冲上去;D表示退下去,则每种情况下博弈情形如下图所示。,Control Scien
4、ce and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,当参与人都为强硬者时,博弈存在两个纯战略Nash均衡(U,D)和(D,U)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,当参与人1为强硬者参与人2为软弱者时,博弈存在唯一的Nash均衡(U,D)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,当参与人1为软弱者参与人2
5、为强硬者时,博弈存在唯一的Nash均衡(D,U)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,当参与人都为软弱者时,博弈存在唯一的Nash均衡(D,D)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,(1)参与人都为强硬者,(2)参与人1为强硬者参与人2为软弱者,(3)参与人1为软弱者参与人2为强硬者,(4)参与人都为软弱者,Control Science and Engineering
6、,HUST All Rights Reserved,2007,Luo Yunfeng,在“斗鸡博弈”中,虽然在博弈开始之前每位决斗者都了解(知道)自己的性格特征,但对对手的性格特征往往不甚了解或了解不全。在这种情况下即使所有的决斗者都看到了上面的四个战略式博弈,但对决斗者来讲,仍存在着所谓的事前不确定性即博弈开始之前就不知道的信息。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,对于“强硬”的参与人1来讲,虽然他看到了上面的战略式博弈,但他不知道对手是“强硬”的还是“软弱”的,所以博弈开始之前
7、他无法确定博弈是根据(1)还是(2)进行。这意味着“强硬”的参与人1面临着事前无法确定的信息。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,同样,“软弱”的参与人1也会面临类似的问题。此时,“斗鸡博弈”就是一个不完全信息博弈问题。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,对于不完全信息博弈问题,是不可能应用前面两部分介绍的方法进行求解的。,Control Science and Eng
8、ineering,HUST All Rights Reserved,2007,Luo Yunfeng,这是因为给定参与人1为“强硬”的决斗者,如果对手是“软弱”的,那么博弈就只存在惟一的Nash均衡(U,D),参与人1有惟一的最优选择“冲上去”;如果对手是“强硬”的,则博弈就会出现两个Nash均衡(U,D)和(D,U),参与人1的最优选择取决于对手的选择。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,但由于参与人1不知道对手究竟是“强硬”的还是“软弱”的,因此,此时的参与人1就觉得自己似乎是
9、在与两个决斗者进行决斗,一个是“强硬”的,另一个是“软弱”的。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,当一个参与人并不知道在与谁博弈时,博弈的规则是没有定义的,如何处理不完全信息?Harsanyi提出了Harsanyi转换。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,为了分析,对“斗鸡博弈”进行简化。假设参与人1是“强硬”的决斗者,参与人2可能是“强硬”的也可能是“软弱”的,参与人
10、1不知道但参与人2清楚,而且这一假设为所有的参与人所知道。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Harsanyi转换,对于简化的“斗鸡博弈”,Harsanyi转换是这样处理的:在原博弈中引入一个“虚拟”参与人“自然”(nature,用N表示),构造一个参与人为两个决斗者和“自然”的三人博弈。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Harsanyi转换,“自然”首先行动决定参与
11、人2的性格特征(即选择参与人2是“强硬”的还是“软弱”的),“自然”的选择参与人1不知道,但参与人2知道。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在“自然”选择后,参与人1和2再进行“斗鸡博弈”。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在新构造的三人博弈中,“自然”的支付不必考虑。参与人1和2的支付由“斗鸡博弈”决定。,Control Science and Engineeri
12、ng,HUST All Rights Reserved,2007,Luo Yunfeng,如果“自然”选择参与人2的性格特征是“强硬”的,则意味着参与人1与“强硬”的参与人2进行决斗,博弈进入决策结x1,其支付(1)决定;,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,如果“自然”选择参与人2的性格特征是“软弱”的,则意味着参与人1与“软弱”的参与人2进行决斗,博弈进入决策结x2,其支付由(2)决定。,Control Science and Engineering,HUST All Right
13、s Reserved,2007,Luo Yunfeng,Harsanyi通过引入“虚拟”参与人,将博弈的起始点由x1(或x2)提前至x0,从而将原博弈中参与人的事前不确定性转变为博弈开始后的不确定性(即参与人1不知道“自然”的选择)。这种通过引入“虚拟”参与人来处理不完全信息博弈问题的方法亦称Harsanyi转换。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,考察不完全信息博弈问题参与人的决策,用p1表示参与人1认为“自然”选择参与人2为“强硬”的概率,v1(U)和v1(D)分别表示参与人1
14、认为自己选择行动U和D时所能得到的期望收益;用x表示“强硬”的决斗者2选择行动U的概率。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,当 即 时,对参与人1来讲,其最优选择是U(即“冲上去”)。由于,所以当 即参与人1认为参与人2是“强硬”决斗者的可能性不超过1/2时,就会选择“冲上去”。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,考察参与人2的选择。用q1表示参与人2关于“参与人1关于
15、自然选择的推断”的推断,即q1表示参与人2认为“参与人1认为参与人2是强硬的”概率。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,由前面的分析可知:如果,则参与人2认为“U(即冲上去)是参与人1的最优选择”;与此同时,如果,则参与人1的最优选择与参与人2的预测一致。但是,如果 而,则参与人1的最优选择就可能与参与人2的预测不一致。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在Harsan
16、yi转换中规定:参与人关于“自然”选择的推断为共同知识。也就是说,两个决斗者不仅同时一起看到了“自然”随机选择参与人2的性格特征,而且同时一起看到了“自然”以一定的概率分布随机选择参与人2的性格特征。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,不完全信息博弈经Harsanyi转换之后得到的完全但不完美信息博弈。(x,y)表示参与人1的性格特征为x,参与人2的性格特征为y;pxy表示“自然”选择(x,y)的概率,这里pxy为共同知识。,Control Science and Engineer
17、ing,HUST All Rights Reserved,2007,Luo Yunfeng,在应用Harsanyi转换时,需要注意以下问题:,1)“自然”的选择。在一般的不完全信息博弈问题中,Harsanyi转换规定“自然”选择的是参与人的类型(type)。除了根据参与人的支付来划分参与人的类型以外,还可以根据参与人的行动空间,甚至根据参与人掌握信息的多少(或程度)来来划分参与人的类型。此外,需要注意的是,参与人的类型必须是其个人特征的一个完备描述。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfen
18、g,用ti表示参与人i的一个特定的类型,Ti表示参与人i所有类型的集合(亦称类型空间,type space),即,t=(t1,tn)表示一个所有参与人的类型组合,t-i=(t1,ti-1,tn)表示除参与人i之外其他参与人的类型组合。所以,t=(ti,t-i)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,2)参与人关于“自然”选择的推断。用p(t1,tn)表示定义在参与人类型组合上的一个联合分布密度函数,Harsanyi转换假定:对于一个给定的不完全信息博弈问题,存在一个参与人关于“自然”
19、选择的推断p(t1,tn),且p(t1,tn)为共同知识。也就是说,Harsanyi转换假定所有参与人关于“自然”行动的信念(belief)是相同的,并且为共同知识。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,用 表示参与人i在知道自己类型为ti的情况下,关于其他参与人类型的推断(即条件概率),则其中,为边缘密度函数。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,假设pss=0.2,ps
20、w=0.3,pws=0.25,pww=0.25。虽然决斗者1不知道决斗者2 的类型,但由于决斗者1知道自己的类型,因此他可以根据贝叶斯公式推知决斗者2的类型分布。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,例如,根据贝叶斯规则,“强硬”的决斗者1可以推知:决斗者2是“强硬”的概率为决斗者2是“软弱”的概率为“软弱”的决斗者1可以推知:决斗者2是“强硬”的概率为决斗者2是“软弱”的概率为,Control Science and Engineering,HUST All Rights Rese
21、rved,2007,Luo Yunfeng,这里不同类型的决斗者1所形成的关于“自然”选择的推断是不同的,究其原因,Harsanyi认为:虽然理性的参与人在掌握同样的信息时对同一事件会形成相同的概率推断,但参与人各自掌握的信息不同时对同一事件就会形成不同的概率推断。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,这说明在Harsanyi转换中,参与人对包括自己在内的所有参与人的类型的联合概率推断(分布)都是一样的,但由于参与人掌握的私人信息不同,使得各自对其他参与人的类型的概率分布的推断不同。
22、,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,贝叶斯博弈(the static Bayesian game)是关于不完全信息静态博弈的一种建模方式,也是不完全信息静态博弈的标准式描述。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,贝叶斯博弈的定义,贝叶斯博弈包含以下五个要素:参与人集合;参与人的类型集T1,T2;参与人关于其他参与人类型的推断,;参与人类型相依的行动集A(t1),A(tn)
23、;参与人类型相依的支付函数,。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,参与人的推断 来源于一个共同的参与人关于“自然”选择的推断p(t1,tn),且p(t1,tn)为共同知识。所以,贝叶斯博弈中参与人所具有的关于其他参与人的类型的推断是一致的。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,规定贝叶斯博弈的时间顺序如下:,“自然”选择参与人的类型组合t=(t1,tn),其中;参与人i观
24、测到“自然”关于自己类型ti的选择;虽然参与人i观测不到“自然”关于其他参与人类型t-i的选择,但参与人i具有关于其他参与人类型的推断;参与人同时选择行动,每个参与人i从行动集Ai(ti)中选择行动ai(ti);参与人i得到。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,贝叶斯博弈中的战略,在贝叶斯博弈 中,参与人i的一个战略是从参与人的类型集Ti到其行动集的一个函数si(ti),它包含了当自然赋予i的类型为ti时,i将从可行的行动集Ai(ti)中选择的行动。,Control Science
25、 and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,“斗鸡博弈”的贝叶斯模型,参与人为决斗者1和2;用s表示决斗者是“强硬”的,w表示决斗者是“软弱”的,所以T1=T2=s,w。用pxy表示“自然”选择类型组合(x,y)的概率,并假设pxy为共同知识,则每位决斗者i关于其对手类型的推断pi(x|y)。每位决斗者i关于类型相依的行动空间Ai(x)=U,D。每位决斗者i的支付由前面的图决定。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfe
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第10章 贝叶斯博弈与贝叶斯Nash均衡ppt课件 10 贝叶斯 博弈 Nash 均衡 ppt 课件

链接地址:https://www.31ppt.com/p-2132769.html