完全信息动态博弈(子博弈完美的纳什均衡)ppt课件.ppt
完全信息动态博弈,Subgame Perfect Nash Equilibrium,完全信息动态博弈,序贯博弈问题 动态博弈经典模型 重复博弈与合作问题,3.1 序贯博弈问题 Sequential Games,强盗分金 五个强盗抢得100枚金币,他们决定: 抽签决定各人的号码(1,2,3,4,5);1号提方案,5人表决,超过半数同意方案被通过,否则被扔入大海;2号提方案,4人表决,超过半数同意方案通过,否则同样被扔入大海;依次类推 第一个人应怎样提方案?,答案是:1号强盗分给3号1枚金币,4号或5号强盗2枚,独得97枚。,完全信息序贯博弈 Sequential game 行动有先后 后行者在行动前已经观测到先行者的行动 描述方法:扩展式 extensive form 博弈树 game tree,例:静态游戏 支付矩阵,假设:A B 两人同时行动,例:动态游戏 支付矩阵,假设:A 先行动,B 后行动,例:动态游戏 博弈树,假设:A 先行动,B 后行动,博弈树 game tree,结点 node 枝 branch 信息集 information set,博弈树 game tree,2,9,3,1,NE:(U , L)&(D , R),如何寻找均衡?,SPNE:(D , R),逆 推backward induction,( 3,1 ),均衡路径equilibrium path,子博弈精炼纳什均衡 SPNE,子博弈精炼纳什均衡 (Selten,1965) Subgame Perfect Nash Equilibrium 泽尔腾1965年发表需求减少条件下寡头垄断模型的对策论描述一文,提出了“子博弈精炼纳什均衡”的概念,又称“子对策完美纳什均衡”。,Reinhard Selten ,1930-,莱茵哈德泽尔腾 Reinhard Selten ,子博弈精炼纳什均均衡的创立者。 1994年因在“非合作博弈理论中开创性的均衡分析”方面的杰出贡献而荣获诺贝尔经济学奖。,给定“历史”,每一个行动选择开始至博弈结束构成了一个博弈,称为“子博弈”。 扩展式博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结(包括终点结)组成的,能自成一个博弈。,子博弈 Sub-game,子博弈 Sub-game,原博弈中的一部分(次级博弈),子博弈精炼纳什均衡 SPNE 扩展式博弈的策略组合 S*=(S1*, Si*, Sn* )是一个子博弈精炼纳什均衡, 如果: 它是原博弈的纳什均衡; 它在每一个子博弈上也都构成纳什均衡。,子博弈精炼纳什均衡 SPNE,SPNE:(D , R),思考: B如何能使A选上?许诺 - 事前:B向A承诺,若A选上,给A补偿2A照做,事后B履行诺言 (U,L)(4,7)A照做,事后B赖帐 (U,L)(2,9)威胁 - 事后:B威胁,若A选下,自己选左A相信 (U,L) (2,9)A不信 (D,R) (3,1),问题:可信性 Credibility 承诺和威胁都是不可信的! 思考: 如何能使承诺和威胁变得可信? 增加撤销承诺或威胁所要受到的损失 让对方知道 “破釜沉舟” & “穷寇莫追”,