重复博弈教学课件PPT.ppt
《重复博弈教学课件PPT.ppt》由会员分享,可在线阅读,更多相关《重复博弈教学课件PPT.ppt(53页珍藏版)》请在三一办公上搜索。
1、第四章 重复博弈(repeated game),本章介绍基本博弈重复进行构成的重复博弈。虽然形式上是基本博弈的重复进行,但重复博弈中博弈方的行为和博弈结果却不一定是基本博弈的简单重复,因为博弈方对于博弈会重复进行的意识,会使他们对利益的判断发生变化,从而使他们在重复博弈过程中的行为选择受到影响。这意味着不能把重复博弈当作基本博弈的简单叠加,必须把整个重复博弈过程作为整体进行研究。,重复博弈引论有限次重复博弈无限次重复博弈,本章分三节,4.1 重复博弈引论,4.1.1 为何研究重复博弈经济中的长期关系人们的预见性未来利益对当前行为的制约长期合同、回头客、长客和一次性买卖的区别有无确定的结束时间,
2、4.1.2 基本概念,有限次重复博弈:给定一个基本博弈G(可以是静态博弈,也可以是动态博弈),重复进行T次G,并且在每次重复G之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T)。而G则称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。无限次重复博弈:一个基本博弈G一直重复博弈下去的博弈,记为G(),策略:博弈方在每个阶段针对每种情况如何行为的计划子博弈:从某个阶段(不包括第一阶段)开始,包括此后所有的重复博弈部分均衡路径:由每个阶段博弈方的行为组合串联而成,重复博弈的得益,1,贴现系数2,一个T期重复博弈,每期收益,随机停止和贴现
3、率,4.2 有限次重复博弈,定义:给定一个基本博弈G(可以是静态博弈,也可以是动态博弈),重复进行T次G,并且在每次重复G之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T)。而G则称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。4.2.1 两人零和博弈的有限次重复博弈 4.2.2唯一纯策略纳什均衡博弈的有限次重复博弈4.2.3多个纯策略纳什均衡博弈的有限次重复博弈,4.2.1 两人零和博弈的有限次重复博弈,引入实例:猜硬币博弈的有限次重复博弈,正确策略是什么?思路:运用子博弈逆向归纳法结论:一般零和博弈为原博弈的有限次重复博弈的
4、策略就是:重复一次性博弈中的纳什均衡策略,囚徒的困境博弈的有限次重复1、两次重复2、有限次重复 逆推归纳法 等价博弈,4.2.2唯一纯策略纳什均衡博弈的有限次重复博弈,一般结论,定 理:设原博弈G有唯一的纯策略纳什均衡,则对任意整数T,重复博弈 G(T)有唯 一的子博弈完美纳什均衡,即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍,平均得益的与原博弈G中的得益。,应用:有限次重复削价竞争博弈,有唯一纯策略纳什均衡(70,70)有限次重复的结果仍然是每次都采用(低价,低价)古诺模型重复,开金矿博弈的有限次重复,均衡策略是什么?,重复囚徒困境博弈悖论与连锁店
5、悖论,1,囚徒困境悖论2,连锁店悖论3,叠代重复博弈:生态破坏,资源过度开发,环境污染问题,破解悖论,1,成功例子:石油输出过组织(OPEC)。2,破解悖论的关键:站的高,望的远,考虑的是长期利益。3,假设一个重复10次囚徒困境的博弈,贴现系数为,问 满足什么条件,参与者会选择不坦白。,4.2.3多个纯策略纳什均衡博弈的有限次重复博弈,三价博弈的重复博弈,原博弈有两个纳什均衡(M,M)、(L,L)两次重复的子博弈完美纳什均衡有多个:1、每次重复一个纳什均衡;2、加混合策略纳什均衡。重要的是在2次重复博弈中可以找到包含(H,H)的子博弈完美均衡。,触发策略:两博弈方先试探合作,一旦发现对方不合作
6、则也用不合作报复。触发策略是重复博弈实现合作的关键措施。博弈方1:第一次选H;如第一次结果为(H,H),则第二次选M,否则选L 博弈方2:同博弈方1。,触发策略的进一步讨论:报复的可信性,H M L P Q,触发策略可信的重复博弈,H M L P Q,博弈有4个纳什均衡(M,M)、(L,L),(P,P),(Q,Q)。均衡策略:博弈方1:第一阶段选H,如果第一阶段结果是(H,H),第二阶段采用M,否则采用P。博弈方2:第一阶段选H,如果第一阶段结果是(H,H),第二阶段采用M,否则采用Q。,两市场博弈的重复博弈(重复两次),(A,B)+(A,B)OR(B,A)+(B,A)(1,4)(4,1)连续
7、两次采用混合策略(2,2)(A,B)+(B,A)OR(B,A)+(A,B)(2.5,2.5)轮换策略一次纯策略+一次混合策略(1.5,3)(3,1.5),两次重复两市场博弈子博弈完美纳什均衡平均得益,三次重复两市场博弈子博弈完美纳什均衡,触发策略:厂商1:第一阶段A;如果第一阶段结果(A,A)则第二阶段A,如果第一阶段结果(A,B),则第二阶段B;第三阶段B。厂商2:第一阶段A;第二阶段无条件B;如果第一阶段结果(A,A)则第三阶段A,如果第一阶段结果(A,B),则第三阶段B。均衡路径:(A,A)+(A,B)+(B,A)。平均收益:(3+1+4)/3=2.67,重复次数进一步扩展到101次的策
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 重复 博弈 教学 课件 PPT
链接地址:https://www.31ppt.com/p-2243577.html