重复博弈教学课件PPT.ppt
第四章 重复博弈(repeated game),本章介绍基本博弈重复进行构成的重复博弈。虽然形式上是基本博弈的重复进行,但重复博弈中博弈方的行为和博弈结果却不一定是基本博弈的简单重复,因为博弈方对于博弈会重复进行的意识,会使他们对利益的判断发生变化,从而使他们在重复博弈过程中的行为选择受到影响。这意味着不能把重复博弈当作基本博弈的简单叠加,必须把整个重复博弈过程作为整体进行研究。,重复博弈引论有限次重复博弈无限次重复博弈,本章分三节,4.1 重复博弈引论,4.1.1 为何研究重复博弈经济中的长期关系人们的预见性未来利益对当前行为的制约长期合同、回头客、长客和一次性买卖的区别有无确定的结束时间,4.1.2 基本概念,有限次重复博弈:给定一个基本博弈G(可以是静态博弈,也可以是动态博弈),重复进行T次G,并且在每次重复G之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T)。而G则称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。无限次重复博弈:一个基本博弈G一直重复博弈下去的博弈,记为G(),策略:博弈方在每个阶段针对每种情况如何行为的计划子博弈:从某个阶段(不包括第一阶段)开始,包括此后所有的重复博弈部分均衡路径:由每个阶段博弈方的行为组合串联而成,重复博弈的得益,1,贴现系数2,一个T期重复博弈,每期收益,随机停止和贴现率,4.2 有限次重复博弈,定义:给定一个基本博弈G(可以是静态博弈,也可以是动态博弈),重复进行T次G,并且在每次重复G之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G的T次重复博弈”,记为G(T)。而G则称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。4.2.1 两人零和博弈的有限次重复博弈 4.2.2唯一纯策略纳什均衡博弈的有限次重复博弈4.2.3多个纯策略纳什均衡博弈的有限次重复博弈,4.2.1 两人零和博弈的有限次重复博弈,引入实例:猜硬币博弈的有限次重复博弈,正确策略是什么?思路:运用子博弈逆向归纳法结论:一般零和博弈为原博弈的有限次重复博弈的策略就是:重复一次性博弈中的纳什均衡策略,囚徒的困境博弈的有限次重复1、两次重复2、有限次重复 逆推归纳法 等价博弈,4.2.2唯一纯策略纳什均衡博弈的有限次重复博弈,一般结论,定 理:设原博弈G有唯一的纯策略纳什均衡,则对任意整数T,重复博弈 G(T)有唯 一的子博弈完美纳什均衡,即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍,平均得益的与原博弈G中的得益。,应用:有限次重复削价竞争博弈,有唯一纯策略纳什均衡(70,70)有限次重复的结果仍然是每次都采用(低价,低价)古诺模型重复,开金矿博弈的有限次重复,均衡策略是什么?,重复囚徒困境博弈悖论与连锁店悖论,1,囚徒困境悖论2,连锁店悖论3,叠代重复博弈:生态破坏,资源过度开发,环境污染问题,破解悖论,1,成功例子:石油输出过组织(OPEC)。2,破解悖论的关键:站的高,望的远,考虑的是长期利益。3,假设一个重复10次囚徒困境的博弈,贴现系数为,问 满足什么条件,参与者会选择不坦白。,4.2.3多个纯策略纳什均衡博弈的有限次重复博弈,三价博弈的重复博弈,原博弈有两个纳什均衡(M,M)、(L,L)两次重复的子博弈完美纳什均衡有多个:1、每次重复一个纳什均衡;2、加混合策略纳什均衡。重要的是在2次重复博弈中可以找到包含(H,H)的子博弈完美均衡。,触发策略:两博弈方先试探合作,一旦发现对方不合作则也用不合作报复。触发策略是重复博弈实现合作的关键措施。博弈方1:第一次选H;如第一次结果为(H,H),则第二次选M,否则选L 博弈方2:同博弈方1。,触发策略的进一步讨论:报复的可信性,H M L P Q,触发策略可信的重复博弈,H M L P Q,博弈有4个纳什均衡(M,M)、(L,L),(P,P),(Q,Q)。均衡策略:博弈方1:第一阶段选H,如果第一阶段结果是(H,H),第二阶段采用M,否则采用P。博弈方2:第一阶段选H,如果第一阶段结果是(H,H),第二阶段采用M,否则采用Q。,两市场博弈的重复博弈(重复两次),(A,B)+(A,B)OR(B,A)+(B,A)(1,4)(4,1)连续两次采用混合策略(2,2)(A,B)+(B,A)OR(B,A)+(A,B)(2.5,2.5)轮换策略一次纯策略+一次混合策略(1.5,3)(3,1.5),两次重复两市场博弈子博弈完美纳什均衡平均得益,三次重复两市场博弈子博弈完美纳什均衡,触发策略:厂商1:第一阶段A;如果第一阶段结果(A,A)则第二阶段A,如果第一阶段结果(A,B),则第二阶段B;第三阶段B。厂商2:第一阶段A;第二阶段无条件B;如果第一阶段结果(A,A)则第三阶段A,如果第一阶段结果(A,B),则第三阶段B。均衡路径:(A,A)+(A,B)+(B,A)。平均收益:(3+1+4)/3=2.67,重复次数进一步扩展到101次的策略。博弈方1,2的策略:前99次选A,但从其中的第二次开始,一旦发现结果不是(A,A),则选B坚持到底,最后2次重复与三次重复博弈中的后2次策略相同。平均收益(99x3+1+4)/101=2.99,4.2.4 有限次重复博弈的民间定理,个体理性收益(w):不管其它博弈方的行为如何,一博弈方在某个博弈中只要自己采取某种特定的策略,最低限度保证能获得的得益,也称为保留收益。可实现收益:博弈中所有纯策略组合得益的加权平均数组。,有限次重复博弈的民间定理,设原博弈的一次性博弈有均衡得益数组优于w,那么在该博弈的多次重复中所有不小于个体理性得益的可实现得益,都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们。,4.3 无限次重复博弈,4.3.1 两人零和博弈的无限次重复博弈4.3.2唯一纯策略纳什均衡博弈的无限次重复博弈4.3.3 无限次重复古诺模型4.3.4 有效工资率,4.3.1 两人零和博弈的无限次重复博弈,案例:无限次重复拳头,剪刀,布游戏,你的策略是什么?分析:重复次数不会改变原博弈中博弈方之间在利益上的对立关系,也不会创造出潜在的合作利益。因此,两人零和博弈无限次重复的所有阶段都不可能发生合作,博弈方会一直重复原博弈的混合策略纳什均衡。,4.3.2:唯一纯策略纳什均衡博弈的无限次重复博弈,冷酷策略:第一阶段采用H,如果前t-1阶段的结果都是(H,H),则继续采用H,否则采用L。如果博弈方2采用L,总得益现值为如果博弈方2采用H,总得益现值为,结论:当 时,双方采用此触发策略是子博弈完美纳什均衡,“囚徒困境悖论”得以破解。提问思考:1,有限次重复博弈能否通过冷酷战略破解囚徒困境问题?2,具有唯一占优策略纳什均衡的无限次重复博弈的子博弈完美纳什均衡是纳什均衡的重复吗?,无限次重复博弈的无名氏定理,无限次重复博弈的无名氏定理的实质是一个存在性定理,4.3.3:无限次重复古诺模型,假设:假设市场存在2个寡头,市场需求函数为P=8-Q(Q8),Q=q1+q2。两个企业的边际成本都为2,不存在固定成本。两企业可以进行古诺竞争,与可以合作作为一个垄断企业。博弈重复无限次。考虑以下三个问题:(1)保持垄断产量(冷酷策略)的条件;(2)冷酷策略条件不满足就一定要进行你死我活的竞争吗?(3)一定要冷酷到底吗?,支持垄断产量(冷酷策略)的条件,只有当企业采取偏离策略后的总收益小于不偏离的总收益,那么企业才不会偏离,即:,冷酷策略条件不满足就一定要进行你死我活的竞争吗?:低水平的合作,如果企业2偏离,企业1第二阶段对其进行惩罚,只生产产量x,企业2只能与之合作,否则第三阶段会继续被惩罚,因此企业2在第二阶段的利润只能是,非要冷酷到底吗?加大惩罚力度和提高合作水平,因此企业2只有在第一阶段偏离获利大于第二阶段的所受惩罚的损失的时候,企业2才会选择偏离。,4.3.4:有效工资成立的条件是什么?,问题:在同一行业,为什么一些企业的工资高于其他企业?,触发策略,总结,我们分析的无限次重复博弈的原博弈都是完全信息博弈,如果原博弈是一个不完全信息博弈,无限次重复博弈的结果将会复杂很多;重复博弈和声誉模型的联系与区别。,习题,1,举出生活中的一个重复博弈和一次性博弈效率不同的例子。火车站及旅游景点的商店和生活区商店的价格。,2,重复两次下面的博弈,如果你是博弈方1,你该如何采取策略?,用画线法容易找出该博弈的两个纯策略纳什均衡(T,L)和(M,R)。这两个纳什均衡的得益都帕累托劣于(B,S)。一次性博弈中效率较高的(B,S)不可能实现。但该博弈的结构表明存在双方合作的利益,在两次重复博弈中也有构造惩罚机制的条件,因此我会考虑运用试探合作的触发策略争取部分实现(B,S),提高博弈的效率。我作为博弈方1会采用这样的触发策略:第一次重复采用B;第二次重复时,如果前一次的结果是(B,S),则采用M,如果前一次的结果是其他,则采用T。如果另一个博弈方有同样的分析能力,或者比较有经验,那么他(或她)也会采用相似的触发策略:在第一次重复时采用S;第二次重复时,如果前一次的结果是(B,S),则采用R,否则采用L。双方采用上述触发策略构成一个子博弈完美纳什均衡,因此是稳定的。这时候前一次重复实现了(B,S),提高了博弈的效率。,3,2次重复下面博弈。问能否有一个子博弈完美纳什均衡策略组合,实现第一阶段收益为(4,4)?如能,给出策略组合,如果不能,请说明为什么。如果(下,左)的收益改为(1,5)会发生什么变化,至少能在部分阶段实现收益(4,4)的条件是什么?,两个NE:(上,左),(中,中)博弈方1:第一阶段下;第二阶段上博弈方2:第一阶段右;第二阶段,如果第一阶段结果是(下,右),则选左,否则选中。如果把(4,4)改为(1,5),不存在SPNE实现(4,4)。,4,求出下列静态博弈的纳什均衡,并说明有限次重复和无限次重复时博弈方1,2的策略。,首先很容易看出,博弈方1的D策相对于T策和M策都是严格下策,因此可以消去,消去博弈方1的D策后四个策略组合中不存在纯策略纳什均衡。根据混合策略纳什均衡的计算方法,不难算出混合策略纳什均衡为:博弈方1概率分布(1/2,1/2)在T和M中随机选择,博弈方2则以概率分布(1/3,2/3)在L和R中随机选择。由于上述静态博弈是没有纯策略纳什均衡的严格竞争博弈,因此在有限次重复博弈和无限次重复博弈中,两博弈方的均衡策略都是简单复重原博弈的混合策略纳什均衡。,5,寡头的古诺产量博弈中,如果市场需求P=130-Q,边际成本c=30且没有固定成本,贴现因子=0.9,如果该市场有长期的稳定性,问两个厂商能否维持垄断产量?,6,两个人合作研发一项产品,能否成功与2个人的工作态度有关。设成功的概率如下。假设成功每个人有4单位收益,失败则无收益,偷懒本身有1个单位的收益。问无限次重复博弈的均衡是什么?,