第7章 子博弈精炼Nash均衡ppt课件.ppt
《第7章 子博弈精炼Nash均衡ppt课件.ppt》由会员分享,可在线阅读,更多相关《第7章 子博弈精炼Nash均衡ppt课件.ppt(207页珍藏版)》请在三一办公上搜索。
1、第二部分: 完全信息动态博弈,第七章 子博弈精炼Nash均衡,主要内容:一、子博弈精炼Nash均衡二、子博弈精炼Nash均衡的求解三、承诺行动与要挟诉讼四、子博弈精炼Nash均衡的合理性讨论五、子博弈精炼Nash均衡的惟一性讨论,主要内容:一、子博弈精炼Nash均衡二、子博弈精炼Nash均衡的求解三、承诺行动与要挟诉讼四、子博弈精炼Nash均衡的合理性讨论五、子博弈精炼Nash均衡的惟一性讨论,第七章 子博弈精炼Nash均衡,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,一、子博弈精炼N
2、ash均衡,我们知道Nash均衡是一个静态均衡,将Nash均衡作为扩展式博弈的解同样会遇到Nash均衡的多重性问题,而且在多个Nash均衡中有些是明显不合理的。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例1:新产品开发博弈,市场需求大时的情况,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,Control Science and Engineering, HUST All Ri
3、ghts Reserved, 2007, Luo Yunfeng,博弈存在两个Nash均衡(开发,(开发,开发)和(开发,(开发,不开发),其中均衡(开发,(开发,不开发)要求企业2采取战略“企业1开发自己就开发,企业1不开发自己也不开发”。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,我们知道,“新产品开发博弈”中,如果市场需求大的话,不管对方是否开发,每个企业都应选择“开发”(因为只要开发即可盈利),所以,“当企业1开发时,企业2开发”是合理的,但是,“当企业1不开发时,企业2不开
4、发”就不合理了。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,所以,均衡(开发,(开发,不开发)不是一个关于博弈结果的合理预测。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例2:新产品开发博弈,市场需求小时的情况,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,Contr
5、ol Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,该博弈存在三个Nash均衡:(开发,(不开发,开发);(开发,(不开发,不开发);(不开发,(开发,开发),但这三个均衡是否都是合理的呢?,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,在“新产品开发博弈”中,如果市场需求小,那么就只能一个企业开发,另一个企业不开发,问题在于谁选择开发,谁选择不开发。,Control Science and En
6、gineering, HUST All Rights Reserved, 2007, Luo Yunfeng,但是,对于先行动的企业1来讲,只要自己选择“开发”,理性的企业2就只会选择“不开发” ,所以,均衡(不开发,(开发,开发)是不合理的。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,而对于企业2来讲,企业1开发自己当然不能开发,如果企业1不开发自己显然应该开发。所以,均衡(开发,(不开发,不开发)也是不合理的。因此,合理的Nash均衡是(开发,(不开发,开发)。,Control
7、Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例3:,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,该博弈存在两个Nash均衡(B,E),D)和(B,F),D)。,Control Science and Engineering, HUST All
8、 Rights Reserved, 2007, Luo Yunfeng,当参与人1在信息集 采取行动B时,博弈结束。但是,作为参与人1的战略必须告诉参与人1,如果他在信息集 上他应如何选择?显然,如果轮到参与人1在信息集 上决策,他的最优选择为行动E。所以,均衡是不合理的(B,F),D) 。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,博弈论的研究目的就是寻找博弈问题的解。到目前为止人们主要是将Nash均衡作为博弈的解,但Nash均衡作为博弈的解面临一个很大的问题多重性问题。,Cont
9、rol Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,如何解决Nash均衡的多重性问题,人们已做了很多探讨,如前面我们讨论过的“焦点效应”、相关均衡等等,但这些方法都是一些非规范式的方法,需要结合具体的博弈问题,剔除不合理的Nash均衡。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,除了非规范式的方法以外,解决Nash均衡的多重性问题的一种主要方法就是精炼的方法,即从博弈解的定义入手,在Nash
10、均衡的基础上,通过定义更加精炼的博弈解剔除Nash均衡中不合理的均衡。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,Selten在1965年提出的“子博弈精炼Nash均衡”(subgame perfect Nash equlibrium)的概念,就是这样一种新的博弈解。子博弈精炼Nash均衡不仅在一定程度上解决了Nash均衡的不足,而且对完全信息的动态博弈问题尤为适用。,Control Science and Engineering, HUST All Rights Reserved,
11、 2007, Luo Yunfeng,子博弈的概念,在给出子博弈精炼Nash均衡的正式定义之前,我们需要介绍“子博弈”这个概念。所谓“子博弈”就是原博弈的一部分,它始于原博弈中一个位于单结信息集中的决策结x,并由决策结x及其后续结共同组成。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,子博弈可以作为一个独立的博弈进行分析,并且与原博弈具有相同的信息结构。,Control Science and Engineering, HUST All Rights Reserved, 2007, L
12、uo Yunfeng,为了叙述方便,用 表示博弈树中开始于决策结的子博弈。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例子:找出下列博弈的子博弈。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,该博弈存在3个子博弈:除了原博弈自己以外,还存在下面两个子博弈。,(1)子博弈,(2)子博弈,Control Science and Engineering, HUST All Righ
13、ts Reserved, 2007, Luo Yunfeng,例子:找出下列博弈的子博弈,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,该博弈存在3个子博弈:除了原博弈自己以外,还存在下面两个子博弈。,(1)子博弈,(2)子博弈,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,子博弈精炼Nash均衡的定义,扩展式博弈的战略组合 是一个子博弈精炼Nash均衡,当且仅当满足以下条件:它是
14、原博弈的Nash均衡;它在每一个子博弈上给出(或构成)Nash均衡。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,一个战略组合是子博弈精炼Nash均衡当且仅当它对所有的子博弈(包括原博弈)构成Nash均衡,同时也意味着原博弈的Nash均衡并不一定是子博弈精炼Nash均衡,除非它还对所有子博弈构成Nash均衡。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例子:,Control
15、Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,虽然(开发,(开发,不开发)是Nash均衡,但并不是子博弈精炼Nash均衡。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例子:新产品开发博弈,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,虽然(不开发,(开发,开发)和(开发,(不开发,不开发
16、)是Nash均衡,但并不是子博弈精炼Nash均衡。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,考察下面的分配博弈问题:,两人使用下列过程去分配两个相同的不可分割的物品:他们中的某一个人提出一种分配方式,另一个人可能接受也可能拒绝。如果拒绝,两人都得不到任何东西。假设每个人仅关心所得的物品数量。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,分配博弈的扩展式描述 为:,A表示“参
17、与人1得2件物品,参与人2得0件物品”分配方案,B表示“两个参与人各得1件物品”分配方案,C表示“参与人1得0件物品,参与人2得2件物品”分配方案 ;Y表示参与人2接受参与人1的分配方案,N表示参与人2拒绝参与人1的分配方案 。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,在分配博弈中,参与人1有三个战略战略A、B和C,参与人2有8个战略战略(Y,Y,Y)、(Y,Y,N)、(Y,N,Y)、(N,Y,Y)、(Y,N,N)、(N,Y,N)、(N,N,Y)和(N,N,N)。,Control
18、Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,博弈的Nash均衡为:(A,(Y,Y,Y)、(A,(Y,Y,N)、(A,(Y,N,Y)、(A,(Y,N,N)、(A,(N,N,Y)、(A,(N,N,N)、(B,(N,Y,Y)、(B,(N,Y,N)、(C,(N,N,Y)。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,Control Science and Engineering, HUST All R
19、ights Reserved, 2007, Luo Yunfeng,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,根据子博弈精炼Nash均衡的定义,容易验证只有(A,(Y,Y,Y)和(B,(N,Y,Y)为子博弈精炼Nash均衡。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,因此,扩展式博弈,尤其是完全信息的动态博弈,一般都用子博弈精炼Nash均衡作为博弈的解。,Control S
20、cience and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,Kuhn定理,每个有限的扩展式博弈都存在子博弈精炼Nash均衡。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,虽然Kuhn定理保证了子博弈精炼Nash均衡的存在性,但Kuhn定理并不能确保我们所讨论的有限的扩展式博弈都只存在惟一的子博弈精炼Nash均衡。,Control Science and Engineering, HUST All Rights
21、Reserved, 2007, Luo Yunfeng,存在多个子博弈精炼Nash均衡的例子:,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,由于子博弈精炼Nash均衡并不是在任何情况下都是惟一的,使用子博弈精炼Nash均衡仍可能面临解的多重性问题,特别是在某些情况下(如退化了的动态博弈),博弈的子博弈精炼Nash均衡与Nash均衡是一样的。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunf
22、eng,主要内容:一、子博弈精炼Nash均衡二、子博弈精炼Nash均衡的求解三、承诺行动与要挟诉讼四、子博弈精炼Nash均衡的合理性讨论五、子博弈精炼Nash均衡的惟一性讨论,第七章 子博弈精炼Nash均衡,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例子:,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,虽然(B,F),D)是Nash均衡,但并不是子博弈精炼Nash均衡。,Con
23、trol Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,由以上分析可以得到博弈的求解过程:首先求解博弈树中最底层的子博弈(x3),得到子博弈(x3)的结果为(3,0) (即参与人1选择E);再求解子博弈(x2) ,容易得到博弈的结果为(1,1)(即参与人2选择D);最后求解原博弈即子博弈(x1) ,得到博弈的结果为(2,1) (即参与人1选择B)。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,考
24、察更一般的情形。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,参与人i在信息集Ii (xi)选择行动L还是行动R,取决于选择行动L和行动R所带来的后果。 由于参与人i选择行动L时使博弈进入了子博弈(xi+1) ,因此,参与人i选择行动L的后果就是得到子博弈(xi+1) 。同样,参与人i选择行动R的后果就是得到子博弈(xi+2) 。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,所
25、以,参与人i在信息集Ii (xi)上的最优选择,取决于参与人i在信息集Ii (xi)上可能采取的行动所导致的各个子博弈。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,也就是说,参与人i在信息集Ii (xi)上的最优选择,一定是使博弈进入能给自己带来最大支付的子博弈。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,因此,为了确定参与人i在信息集Ii (xi)上的选择,就必须先求解参
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第7章 子博弈精炼Nash均衡ppt课件 博弈 精炼 Nash 均衡 ppt 课件
链接地址:https://www.31ppt.com/p-1428851.html