欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    第6章 扩展式博弈ppt课件.ppt

    • 资源ID:1428709       资源大小:550KB        全文页数:65页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第6章 扩展式博弈ppt课件.ppt

    第二部分: 完全信息动态博弈,第六章 扩展式博弈,主要内容:一、扩展式博弈二、扩展式博弈的战略及其Nash均衡三、两种博弈描述形式的比较,主要内容:一、扩展式博弈二、扩展式博弈的战略及其Nash均衡三、两种博弈描述形式的比较,第六章 扩展式博弈,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,一、扩展式博弈,所谓扩展式博弈(extensive form game)是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中所遇到决策问题的序列结构的详细分析。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,研究博弈问题的具体进程必须弄清楚的两个问题,每个参与人在什么时候行动(决策);每个参与人行动时,他所面临决策问题的结构。这包括参与人行动时可供他选择的行动方案,以及参与人行动时所了解的信息。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,上述两个问题构成了参与人在博弈过程中所遇到决策问题的序列结构。对于一个博弈问题,如果能够说清楚博弈过程中参与人的决策问题的序列结构,那么就意味着知道了博弈问题的具体进程。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,扩展式博弈的定义:,扩展式博弈包括以下要素:参与人集合 ;参与人的行动顺序,即每个参与人在何时行动;每个参与人行动时面临的决策问题,包括参与人行动时可供他选择的行动方案以及他所了解的信息;参与人的支付函数,即博弈结束时每个参与人得到的博弈结果。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,如果要用扩展式博弈对一个博弈问题进行建模,那么除了要说明博弈问题所涉及到的参与人及每位参与人的支付函数以外,还必须对博弈过程中参与人所遇到的决策问题的序列结构,进行详细的解释,说清楚每个参与人在何时行动,以及参与人行动时可供选择的行动方案和所了解到的信息。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例子: “新产品开发博弈”,试用扩展式博弈对两个企业都知道市场需求,且企业1先决策,企业2观测到企业1的选择后再进行选择的博弈情形即完全信息动态的“新产品开发博弈”进行建模。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,完全信息动态的“新产品开发博弈”的扩展式博弈包括以下要素:,参与人是企业1和2;企业1先行动,企业2后行动;企业1行动时有两种选择“开发”和“不开发”,企业1行动时不知道企业2的行动;企业2行动时有两种选择“开发”和“不开发”,但企业2行动时已经知道企业1的行动;,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,(4) 两个企业的支付如下:,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,在上述例子中,我们用文字描述的方法给出了博弈问题的扩展式描述。对于一些简单的博弈问题,这种文字表述的方法也许是简单可行的。但可以想象,如果我们遇到的是更为复杂的博弈问题,文字描述所给出的模型就会显得繁冗拖沓,极不直观。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,因此,我们需要寻找一种简便易行的扩展式博弈的描述方式。下面我们就以“新产品开发博弈”为例,介绍一种不仅简单方便,而且十分直观的扩展式博弈的描述方式博弈树。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,所谓博弈树就是由结和有向枝构成的“有向树”。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,最上端的一个点(用空心圆表示),表示博弈的开始 。,将“企业1”标示在点x1上,表示博弈开始于企业1的选择。,企业1的选择有“开发”和“不开发”,分别用标有“开发”和“不开发”的有向枝表示。,表示博弈达到该点时企业的所得 ,其中,支付向量中的第一个数字表示企业1的所得,第二个数字表示企业2的所得 。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,回过来再考察上图中的博弈树,可以得到这样的信息:,博弈中的参与人是企业1和企业2;博弈中企业1先选择,企业2后选择;企业1选择时有行动“开发”和“不开发”,企业2选择的行动有“开发”和“不开发”;博弈中企业的支付。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,也就是说,除了“企业2行动时是否观测到企业1的选择”这一点,暂时无法从上图中知道以外,完全信息动态的“新产品开发博弈”的扩展式描述所需要的信息(或要素),都可以从上图中得到。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,如果还能够直接从博弈树中知道“企业2行动时是否观测到企业1的选择”,那么给出博弈树,就意味着给出了完全信息动态的“新产品开发博弈”的扩展式描述。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,问题:,如何在博弈树中,将“企业2行动时是否观测到企业1的选择”这一信息表示出来?,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,在完全信息动态的“新产品开发博弈”中,企业2决策时,企业1已经做出选择。此时,企业2面临的决策情形就有以下两种:企业2知道企业1的选择;企业2不知道企业1的选择。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,对于第一种情形,企业2知道企业1的选择,即知道企业1选择了“开发”还是“不开发”,因此,企业2知道博弈是从x1到了x2还是从x1到了x3。这就意味着当轮到企业2决策时,他知道自己是在点x2上还是在点x3上;,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,对于第二种情形,企业2不知道企业1的选择,即不知道博弈是从x1到了x2还是从x1到了x3。因此,当轮到企业2决策时,他不知道自己是在点x2上还是在点x3上。所以,“企业2行动时是否观测到企业1的选择”这一问题,实际上就等价于“企业2行动时是否知道自己是在博弈树中的点x2上还是在点x3上”。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,为了将“企业2行动时是否知道自己是在博弈树中的点x2上还是在点x3上”这一点说清楚,需要引入“信息集”(information set)的概念。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,在博弈树中,参与人i的一个信息集(用Ii表示)是参与人i决策结的一个集合,它满足以下两个条件: Ii中的每个决策结都是参与人i的决策结;当博弈到达信息集Ii(即博弈到达Ii中某个决策结)时,参与人i知道自己是在信息集Ii中的决策结上,但不知道自己究竟在Ii中哪个决策结上。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,因此,参与人i的信息集Ii可以用来描述:当轮到参与人i行动时,他所了解到的信息,即他知道什么(知道自己位于哪一个信息集上)、不知道什么(不知道自己位于信息集中哪一个决策结上)。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例如,在“新产品开发博弈”中,假设企业1先行动,企业2后行动,但企业2行动时不知道企业1的行动。,企业2行动时,只知道博弈要么到达点x2,要么达到点x3 ,但具体在哪一点上,企业2不清楚。也就是说,企业2只知道自己位于决策结集合x2, x3 上,但不知道位于x2, x3 中哪一个决策结上。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,设X为一决策结集合,用Ii(X)表示参与人的由决策结集X构成的一个信息集。例如,I2(x2, x3)表示企业2的由决策结集x2, x3构成的信息集,I2(x2)和I2(x3)分别表示企业2的由决策结集x2和x3构成的信息集。 可以在博弈树中将同一信息集中的决策结用虚线连接起来。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,下图表示参与人3选择时,知道参与人1的选择,但不知道参与人2的选择的博弈情形。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,下图表示参与人3选择时,知道参与人2的选择,但不知道参与人1的选择的博弈情形。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,下图表示参与人3选择时,即不知道参与人2的选择,也不知道参与人1的选择的博弈情形。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,下图表示参与人3选择时,即知道参与人2的选择,也知道参与人1的选择的博弈情形。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,在以后的讨论中,我们假设博弈树中的博弈都是从上往下进行的,因此,在不引起歧义的情况下,我们都不标示出博弈树中枝的方向。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例子:,考察“新产品开发博弈”。试用博弈树描述“两个企业都知道市场需求,且企业1先决策,企业2观测到企业1的选择后再进行选择”的博弈情形。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,当市场需求大时,“新产品开发博弈”的博弈树,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,当市场需求小时,“新产品开发博弈”的博弈树,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,由于在博弈分析中,假设博弈的结构(或描述方式)为共同知识,因此,在以后的讨论中,如果给出博弈树,就意味着所有的参与人都同时一起看到了博弈树。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,除了前面一再提到的博弈结构和参与人完全理性为共同知识外,对于多阶段的动态博弈问题,一般还假设参与人满足“完美记忆”(perfect recall)要求,即假设参与人不会忘记以前知道或者做过的事情。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,但在现实生活中,不满足“完美记忆”要求的情形比比皆是。例如,人们在玩扑克时,往往会忘记自己曾经出过什么牌或者对手曾经出过什么牌;在棋类比赛中,也会出现这种情况。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,但是,在博弈分析中,如果没有“完美记忆”假设,各种博弈结果都有可能出现,那么我们也就无法对博弈进行预测。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,不满足“完美记忆”要求的博弈情形,参与人1第二次行动时忘了他第一次行动时的选择 。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,主要内容:一、扩展式博弈二、扩展式博弈的战略及其Nash均衡三、两种博弈描述形式的比较,第六章 扩展式博弈,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,二、扩展式博弈的战略及其Nash均衡,提出一个问题:给定一个博弈问题的扩展式,该如何来求解博弈问题的解?已知对于战略式博弈,可以用Nash均衡来描述博弈问题的解,对于博弈树所描述的扩展式博弈,是否同样可以用Nash均衡来描述博弈问题的解?,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,对于一个博弈问题,要给出其战略式描述,就必须定义清楚该博弈问题的三个要素:参与人、参与人的战略以及参与人在相应战略组合下的支付。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,一个扩展式博弈实际上已定义了博弈的参与人及参与人的支付,因此,如果能定义一个扩展式博弈的战略,那么就意味着给出了一个扩展式博弈的战略式描述,同时也就意味着可以用Nash均衡来描述博弈的解。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,所谓参与人的战略就是参与人在博弈中的行动规则,它规定了参与人在博弈中每一种轮到自己行动的情形下,应该采取的行动。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,而在博弈树中,参与人在博弈中每一种轮到自己行动的情形又可以用一个信息集来表示,因此,参与人在扩展式博弈中的战略实际上就是参与人在每个信息集上的行动规则。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,用 Hi 表示博弈树中参与人i的信息集的集合,即Hi=(Ii);用Ai(Ii)表示参与人i在信息集Ii上的行动集, Ai(Hi)表示参与人在所有信息集上的行动集合,即,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,参与人i的一个纯战略si就是从信息集集合Hi到行动集合Ai(Hi)的一个映射关系,即其中,对,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,根据上述定义,参与人i的一个纯战略可以解释为参与人i在各个信息集上的行动组合。因此,在以后的讨论中,可以用参与人i在每个信息集上的行动集Ai(Ii)的笛卡尔积来表示参与人i的战略集Si,即,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例如:,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,参与人2的信息集为I2 (x2),参与人2在I2 (x2)上的行动集为C,D。所以,参与人2的战略集为C,D ; 参与人1的信息集为I1 (x1)和I1 (x3) ,其中参与人1在I1 (x1)上的行动集为A,B,在I1 (x3)上的行动集为E,F。所以,参与人1的战略集为A,BE,F ,即A,E、A,F、B,E和B,F。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,给定一个博弈问题的扩展式描述,可以得到参与人的战略以及参与人在各战略组合下的支付,所以,由一个博弈问题的扩展式描述可以得到该博弈问题的战略式描述。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例如,扩展式描述,战略式描述,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,由左图可得前面所示的扩展式博弈的Nash均衡(B,E),D)和(B,F),D)。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,主要内容:一、扩展式博弈二、扩展式博弈的战略及其Nash均衡三、两种博弈描述形式的比较,第六章 扩展式博弈,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,三、两种博弈描述形式的比较,战略式博弈从本质上来讲是一种静态模型。扩展式博弈从本质上来讲是一种动态模型。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,1.战略式博弈从本质上来讲是一种静态模型,战略式博弈从本质上来讲是一种静态模型,它假设所有的参与人同时选择战略并得到博弈的结果,至于博弈中参与人何时行动、行动时又如何行动等等,战略式博弈并不考虑。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,这种建模方式对于描述完全信息的静态博弈问题,如“囚徒困境”、“性别战”等非常适用,也很直观。虽然战略式博弈也可用来对动态博弈问题进行建模,但从所得到的模型中,我们却无法直观地看到博弈问题所具有的动态特性。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,2.扩展式博弈从本质上来讲是一种动态模型,扩展式博弈从本质上来讲是一种动态模型,它不仅直观地给出了博弈的结果,而且还对博弈的过程进行详尽的描述,如给出博弈中参与人的行动顺序,以及参与人行动时的决策环境和行动空间等等。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,前面我们已经看到,给出博弈问题的扩展式描述(如博弈树),我们就可得到博弈问题的战略式描述。同样,在许多情况下,给出博弈问题的战略式描述,我们也能构造出博弈问题的扩展式描述。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例如:,囚徒困境的战略式描述,囚徒困境的扩展式描述,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,但是,在求解博弈问题的解时,如果我们将Nash均衡当作博弈问题的解,那么我们可以直接根据战略式描述得到博弈的Nash均衡。而如果是扩展式博弈的话,则需要先给出博弈的战略式描述,才能得到博弈的Nash均衡。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,究其原因,主要在于Nash均衡本身只是一个静态的解的概念 。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,本章结束,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,

    注意事项

    本文(第6章 扩展式博弈ppt课件.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开