重复博弈的详细介绍.ppt
《重复博弈的详细介绍.ppt》由会员分享,可在线阅读,更多相关《重复博弈的详细介绍.ppt(42页珍藏版)》请在三一办公上搜索。
1、重复博弈,主要内容:一、有限次重复博弈二、无限次重复博弈与无名氏定理三、重复博弈的社会学含义,例子1-越战战场上的潜规则 一名新兵刚上战场,老兵按住他:别乱开枪!新兵问:为什么?老兵对其解释:曾有一段时间,双方打得不可开交,结果大家都躲着,屎尿都撒在猫耳洞里,由于猫耳洞很潮湿,人呆在里面很难受,导致有人耳朵都发了霉,最后是谁也打不着谁,自己却活受罪。此后,便慢慢达成默契:我出来你不开枪,你出来我也不开枪。,例子2 一个男孩被视为傻瓜,因为每当别人拿一枚1块硬币和5分硬币让他选的时候,他总是选5分的,有一个人觉得奇怪,就问他:“为什么你不拿1块钱的?”,男孩小声回答:“假若我拿了1块钱的硬币,下
2、次他们就不会再拿钱让我选了。”,威胁和承诺的重要性:以上两个例子带给我们什么启发?,问题1 在相互联系紧密的人际关系中,人们普遍比较注意礼节、道德,因为合作和协调对大家都有好处;但是,我们又常常见到这样的消息:在公共汽车上,两个陌生人会为一个座位争吵,为什么会发生这种事情?原因何在?,问题2 在“囚徒困境”这一例子中,博弈的参与人为了追求自身利益的最大化,而陷入了个人理性与集体理性的冲突中,导致最优的结果未能出现,即合作没有产生。如果我们假定博弈可以多次重复进行,结果是否会发生变化?是否会出现合作的局面?,动态博弈中涉及的一个重要问题是,博弈过程中威胁和承诺如何影响博弈的进程。重复博弈所关心的
3、议题也与之相似:(1)将来可信的威胁或承诺如何影响到当前的行动?(2)在一次博弈中无法实现的均衡,在重复博弈中能否实现?,一、有限次重复博弈,考察下列博弈,该博弈存在唯一的Nash均衡,即(U,L)。同时注意到,该博弈还存在一个高效均衡(D,R),高效均衡对应着一种合作行为。为什么高效的均衡不是纳什均衡?如何保证这一高效均衡能够实现?,两次重复博弈的博弈树,假设将上述博弈重复两次,那么第二次博弈开始时,第一次博弈的结果可视为已知。,第二阶段,第一阶段,第一阶段,运用逆推归纳法,可以发现上述重复博弈的子博弈精炼Nash均衡为:在每次博弈中,参与人1都选择U,参与人2都选择L。这说明:在两次重复博
4、弈中,高效的均衡仍无法实现。,同样可证明:在n阶段重复博弈(即博弈重复n次且每次博弈开始时,前面博弈的结果都已知)中,高效的均衡同样无法实现。,有限重复博弈定义,定义:对于给定的阶段博弈G,令G(T)表示G重复进行T次的有限重复博弈,并且在下一次博弈开始前,所有之前博弈的进程均可被观测到。,有限重复博弈的战略、子博弈与支付,战略:重复博弈环境下,参与人的战略非常复杂。一般地,我们定义参与人的一个战略是在博弈的每个阶段针对之前的博弈历史而制定的行动计划;子博弈:子博弈要么仍然是重复博弈,要么是原博弈;,有限重复博弈的战略、子博弈与支付,参与人的支付:是所有阶段博弈支付的贴现值之和,或者加权平均值
5、。注意:在重复博弈中,阶段博弈可能是静态博弈,也可能是动态博弈,因此,重复博弈可能是完美信息重复博弈和不完美信息重复博弈。此处我们仅讨论完美信息重复博弈。,假定在位者在不同的市场上有20家连锁店,进入者试图进入这些市场。如果进入者进入了每一个市场,此时博弈就变成了20次重复博弈。当进入者进入第1个市场时,在位者应该如何反应呢?猜想:杀鸡儆猴的效应,连锁店悖论,单阶段博弈矩阵,进入者,支付,在位者,纳什均衡为:在位者在每一个市场选择默许,进入者在每一个市场选择进入。,单阶段扩展式博弈,阶段博弈的子博弈精炼纳什均衡为:在位者在每一个市场选择默许,进入者在每一个市场选择进入。,重复博弈的子博弈精炼纳
6、什均衡:在位者在每一个市场选择默许,进入者在每一个市场选择进入。,定理:,如果阶段博弈G有唯一的Nash均衡,则对任意有限的T,重复博弈G(T)有唯一的子博弈精炼解,即G的Nash均衡结果在每一个阶段重复进行。,问题:囚徒困境中的囚徒有可能实现高效的均衡吗?,考察下列博弈,存在多重纳什均衡的情形,单阶段Nash均衡:(L1,L2)和(R1,R2);合作均衡:(M1,M2);问题:合作均衡能否出现?,现在假设博弈重复两次,可以根据以下原则构造均衡:由第一阶段的结果,预测第二阶段的均衡。例如:若第一阶段出现(M1,M2)(即出现合作),则第二阶段为(R1,R2)(即“好的纳什均衡”);若第一阶段没
7、有出现(M1,M2),则第二阶段为(L1,L2)(即“差的纳什均衡”)。,冷酷战略(grim strategies),也称触发战略;以囚徒困境为例:开始选择抵赖,而且一直选择抵赖直到有一方选择了坦白,然后永远选择坦白;这意味着:一旦哪个参与人选择了坦白,就触发了惩罚的扳机。,根据上述原则,可构造如下战略:,S1:第一阶段选择M1;如果第一阶段结果为(M1,M2),则下一阶段选R1;否则选择L1。S2:第一阶段选择M2;如果第一阶段结果为(M1,M2),则下一阶段选R2;否则选择L2。,根据上述战略,博弈可表示为:,这意味着,合作可以在第一阶段达到。这一结论说明,对将来行动所作的可信威胁或承诺可
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 重复 博弈 详细 介绍
链接地址:https://www.31ppt.com/p-5323739.html