欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    第8章重复博弈.ppt

    • 资源ID:4827600       资源大小:644.02KB        全文页数:125页
    • 资源格式: PPT        下载积分:10金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第8章重复博弈.ppt

    第二部分:完全信息动态博弈,第八章 重复博弈,主要内容:一、有限重复博弈二、无限重复博弈三、讨价还价博弈,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,第八章 重复博弈,主要内容:一、有限重复博弈二、无限重复博弈三、讨价还价博弈,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,一、有限重复博弈,重复博弈所关心的议题:将来可信的威胁或承诺如何影响到当前的行动,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,考察下列博弈,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,上述博弈存在唯一的Nash均衡。将上述博弈重复两次,其中第二次博弈开始时,第一次博弈的结果已知。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,两次重复博弈的博弈树,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,上述重复博弈只存在唯一的Nash均衡:在每次博弈中,参与人1都选择U,参与人2都选择L,即(U,U,U,U,U),(L,L,L,L,L)可以证明:该均衡为精炼Nash均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,前面的分析说明:在两次重复博弈中,合作仍无法到达。同样可证明:在n阶段重复博弈(即博弈重复n次且每次博弈开始时,前面博弈的结果都已知)中,合作同样无法到达。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,重复博弈定义,对于给定的阶段博弈G,令G(T)表示G重复进行T次的有限重复博弈,并且在下一此博弈开始前,所有以前博弈的进程都可被观测到,G(T)的收益为T次阶段博弈收益的简单相加。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在重复博弈中,当全部博弈进行到任何一个阶段,到此为止的进行过程就成为参与各方的共同知 识,而其后尚未开始进行的部分就是一个子博弈。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,定理:,如果阶段博弈G有唯一的Nash均衡,则对任意有限的T,重复博弈G(T)有唯一的子博弈精炼解,即G的Nash均衡结果在每一个阶段重复进行。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,考察下列博弈,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,上述博弈存在两个Nash均衡:(L1,L2)和(R1,R2)将上述博弈重复两次。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,1)战略:每个局中人都有个战略;,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,2)战略组合:一共存在 个战略组合;,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,3)均衡:可以根据以下原则构造均衡:由第一阶段的结果,预测第二阶段的均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,例如:若第一阶段出现(M1,M2)(即出现合作),则第二阶段为(R1,R2)(即“好的均衡”);若第一阶段没有出现(M1,M2),则第二阶段为(L1,L2)(即“差的均衡”)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,根据上述原则,可构造如下策略:,S1:第一阶段选择M1;如第一阶段结果为(M1,M2),则下一阶段选R1;否则选择L1。S2:第一阶段选择M2;如第一阶段结果为(M1,M2),则下一阶段选R2;否则选择L2。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在上述策略下,博弈可表示为:,这意味着:合作可以在第一阶段达到,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,定理:,如果G=是一个有多个Nash均衡的完全信息静态博弈,则G(T)可以存在子博弈精炼解,其中对每一 tT,t 阶段的结果都不是G的Nash均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,上述结论说明:对将来行动所作的可信威胁或承诺可以影响到当前的行动。考察下列博弈。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,如果第一阶段出现(Y1,Y2),则第二阶段(Z1,Z2);如果第一阶段出现(Y1,w),其中(wY2),则第二阶段为(P1,P2);,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,如果第一阶段出现(w,Y2),其中(wY1),则第二阶段(Q1,Q2);如果第一阶段出现(w1,w2),其中(w1Y1,w2Y2),则第二阶段为(Z1,Z2)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,显然,上述策略构成博弈的Nash均衡,且为子博弈精炼Nash均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,第八章 重复博弈,主要内容:一、有限重复博弈二、无限重复博弈三、讨价还价博弈,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,二、无限重复博弈,定义(无线重复博弈)给定一阶段博弈G,令 表示相应的无限重复博弈,其中G将无限次低重复进行,且参与人的贴现率为。对每个t,之前t-1次阶段博弈的结果在t阶段开始进行前都可以被观测到,每个参与人在 中的收益都是该参与人在无限次的阶段博弈中所得受益的现值。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在有限重复博弈G(T)中,由第 t+1 阶段开始的一个子博弈为G进行 T-t 次的重复博弈,可表示为G(T-t)。由第 t+1 阶段开始有许多子博弈,到 t 阶段为止的每一可能的进行过程之后都是不同的子博弈。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在无限重复博弈 中,由 t+1 阶段开始的每个子博弈都等同于初始博弈,和在有限情况下相似,博弈 到 t 阶段为止有多少不同的可能进行过程,就有多少从 t+1 阶段开始的子博弈。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,对于无限重复博弈,参与人在博弈的每一时点,都不必考虑过去的得失,也就是说,无限重复博弈中,参与人过去的得失并不重要,可以看成是沉没成本(或收入)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,下列博弈重复无限次。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,对于阶段博弈为上述博弈的有限重复博弈,合作不可能形成。但对于无限重复博弈,在一定的贴现率下,合作有可能形成。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,构造如下触发策略:,S1:第i阶段选择D;如第i阶段结果为(D,R),则下一阶段选D;否则以后一直选择U。S2:第i阶段选择R;如第i阶段结果为(D,R),则下一阶段选R;否则以后一直选择L。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,可用证明:在一定的贴现率下,上述触发策略构成Nash均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,贴现率的求解,所以,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,可行收益,一组收益 为阶段博弈G的可行收益,如果它们是G的纯战略收益的凸组合(即纯战略收益的加权平均,权重非负且和为1)。前述阶段博弈的可行收益集合如下图所示。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,阴影部分为上述博弈的可行收益区间,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,平均收益,给定贴现率,无限的收益序列 的平均收益,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,所以,故,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,令G为一个有限的完全信息静态博弈,令 为G的一个Nash均衡下的收益,且用 表示G的其它任何可行收益。若存在 则存在足够接近1的贴现率,使无限重复博弈 存在一个子博弈精炼Nash均衡,其平均收益可达到,定理:,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,子博弈精炼Nash均衡的可行收益区间,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在贴现因子并不“足够接近于1”时,子博弈精炼Nash均衡能达到什么样的平均收益?,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,思路之一:令贴现率等于一个固定值,并在假设参与者运用触发战略,一旦发生任何偏离就永远转到阶段博弈的Nash均衡的条件下,计算可以达到的平均收益。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在决定当前阶段是否偏离时,贴现率越小,下一阶段开始进行惩罚的效果就越小。然而,一般来讲参与者总可以比简单重复阶段博弈的Nash均衡得到更高的收益。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,思路之二:由阿布勒(Abreu,1988)最先提出,它基于如下思 路,即阻止一个参与者偏离既定战略的最有效的方法是威胁该参与者,一旦偏离,就将受到最严厉的可信的惩罚,即威胁该参与者,一旦偏离,就将选择使偏离者收益最低的无限重复博弈的子博弈精炼Nash均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在绝大多数博弈中,永远转到阶段博弈的Nash均衡并不是最严厉的可信惩罚,于是有些使用触发战略方法无法达到的平均收益,运用阿布勒的方法可以达到。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,考虑古诺博弈为阶段博弈的无限重复博弈,两企业的贴现率都为。计算两个企业的下述触发战略成为无限重复博弈的Nash 均衡时,贴现率 的值。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,触发战略,在第一阶段都生产垄断产量的一半。第 t 阶段,如果前面 t-1个阶段两个企业的产量都为,则生产;否则,生产古诺产 量。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,当双方都生产 时,每个企业的利润为,用 来表示。当双方都生产 时,每个企业的利润为 我们用 表示。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,若企业i将在本期生产,则使企业j本期利润最大化的产量为下式的解其解为,其利润水平为,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,首先计算对任意一个给定贴现率,如果双方都采用触发战略,一旦出现背离就永远转到古诺产出,企业可以达到的利润最大化的产量。显然,该产量处于古诺产出与垄断产出之间。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,考虑如下的触发战赂:第一阶段生产。在第 t 阶段,如果在此之前的t-1个阶段两企业的产量都是,生产;否则,生产古诺产出。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,考虑下面的“两面”(亦称胡萝卜加大棒)战略:在第一阶段生产垄断产量的一半,即;第t阶段,如果两个企 业在第t1阶段都生产,则生产;如果两个企业在t-1阶 段的产量都是x,则生产;其他情况下生产x。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,上述战略为参与者提供了两种手段:其一是(单阶段的)惩罚,这时企业生产x;其二是(潜在无限阶段的)合作,这时企业的产量为。如果任何一 个企业偏离了合作,则惩罚开始,如果任何一个企业背离了惩罚,则会使博弈进入又一轮惩罚。如果两个企业都不肯离惩罚,则在下一阶段又回到合作。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,如果两企业都采用上面的“两面”战略,则无限重复博弈里的子博弈就可归为两类:(1)合作的子博弈,其前面一个阶段的结果是 或(x,x);(2)惩罚的子博弈,其前面一个阶段的结果既非,又不是(x,x)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,两企业都采取上面的“两面”战略要成为一个子博弈精炼Nash均衡,则在其每一类子博弈中遵循该战略必须是Nash均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,具体地说,在合作的子博弈中,每一企业与本期得到 的收益,且下期得到惩罚的现值收益 V(x)相比,必须更愿意永远得到垄断收益的一半,即,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在惩罚的子博弈中,每一企业与本期得到 的收益,且下期又开始惩罚相比,企业更愿意共同执行惩罚产量,即,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,罗伯特爱克斯罗德实验,罗伯特爱克斯罗德(政治科学家),对合作的问题具有研究兴趣。为了进行关于合作的研究,他组织了一场计算机竞赛。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,这个竞赛的思路非常简单:任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色。他们把自己的策略编入计算机程序,然后他们的程序会被成双成对地融入不同的组合。分好组以后,参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间做出选择,并且游戏重复多次。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,竞赛的第一个回合交上来的14个程序中包含了各种复杂的策略。但使爱克斯罗德和其他人深为吃惊的是,竞赛的桂冠属于其中最简单的策略:一报还一报(TIT FOR TAT)。这是多伦多大学心理学家阿纳托拉帕波特提交上来的策略。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,一报还一报的策略是这样的:它总是以合作开局,但从此以后就采取以其人之道还治其人之身的策略。也就是说,一报还一报的策略实行了胡萝卜加大棒的原则。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,一报还一报的策略永远不先背叛对方,从这个意义上来说它是“善意的”。一报还一报策略会在下一轮中对对手的前一次合作给予回报(哪怕以前这个对手曾经背叛过它),从这个意义上来说它是宽容的。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,但一报还一报策略会采取背叛的行动来惩罚对手前一次的背叛,从这个意义上来说它又是“强硬的”。而且,一报还一报策略的策略极为简单,对手程序一望便知其用意何在,从这个意义来说它又是简单明了的。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,为了验证上述结果的合理性,爱克斯罗德又举行了第二轮竞赛,特别邀请了更多的人,看看能否从一报还一报策略那儿将桂冠夺过来。这次有62个程序参加了竞赛,结果是一报还一报又一次夺魁。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,竞赛的结论无可争议地证明:好人,或更确切地说,具备以下特点的人,将总会是赢家。1善意的;2宽容的;3强硬的;4简单明了的。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,一报还一报策略的胜利对人类和其他生物的合作行为的形成具有深刻地含义。爱克斯罗德在合作进化一书中指出,一报还一报策略能导致社会各个领域的合作,包括在最无指望的环境中的合作。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,典型的例子就是第一次世界大战中自发产生的“自己活,也让他人活”的原则。当时,前线战壕里的军队约束自己不开枪杀伤人,只要对方也这么做。使这个原则能够实行的原因是,双方军队都已陷入困境数月,这给了他们相互适应的机会。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,一报还一报的相互作用使得自然界即使没有智能也能产生合作关系。这样的例子很多:真菌从地下的石头中汲取养分,为海藻提供了食物,而海藻反过来又为真菌提供了光合作用;金蚁合欢树为一种蚂蚁提供了食物,而这种蚂蚁反过来又保护了该树;无花果树的花是黄蜂的食物,而黄蜂反过来又为无花果树传授花粉,将树种撒向四处。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,更广泛地说,共同演化会使一报还一报的合作风格在这个充满背信弃义劣行的世界上蔚然成风。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,假设少数采取一报还一报策略的个人在这个世界上通过突变而产生了。那么,只要这些个体能互相遇见,足够在今后的相逢中形成利害关系,他们就会开始形成小型的合作关系。一旦发生了这种情况,他们就能远胜于他们周围的那些背后藏刀的类型。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,这样,参与合作的人数就会增多。很快,一报还一报式的合作就会最终占上风。而一旦建立了这种机制,相互合作的个体就能生存下去。如果不太合作的类型想侵犯和利用他们的善意,一报还一报政策强硬的一面就会狠狠地惩罚他们,让他们无法扩散影响。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,第八章 重复博弈,主要内容:一、有限重复博弈二、无限重复博弈三、讨价还价博弈,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,讨价还价博弈亦称序贯谈判。其具体过程如下。,三、讨价还价博弈,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,参与人1和参与人2就一美元的分配进行谈判。他们轮流提出方案:首先参与人1提出一个分配建议,参与人2可以接受或拒绝;如果参与人2拒绝,就由参与人2提出分配建议,参与人1选择接受或拒绝;如此一直进行下去。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,注意:在博弈中,一个条件一旦被拒绝,它就不再具有任何约束力,并和博弈下面的进程不再相关。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,第一阶段:在第一阶段开始时,参与人1建议他分得1美元的s1,参与人2得1-s1;参与人2接受这一建议,则博弈结束,否则博弈进入第二阶段。,考察三阶段的序贯谈判,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,第二阶段:在第二阶段开始时,参与人2建议参与人分得1美元的s2,参与人2得1-s2;参与人1接受这一建议,则博弈结束,否则博弈进入第三阶段。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,第三阶段:在第三阶段,参与人1得1美元的s,参与人2得1s。博弈结束。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,如不考虑贴现,由逆向归纳法很容易求得均衡结果(s,1s)。博弈的结果就是外界强加的结果。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,假设参与人的贴现率都为。首先考察参与人2在第二阶段的最优选择。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,由于若博弈进入第三阶段,参与人1可得s,相当于第二阶段的,因此,,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,考察参与人1在第一阶段的最优选择。参与人1在第一阶段即可预测到参与人2在第二阶段的最优选择,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,假设参与人的贴现率分别为:首先考察参与人2的最优选择。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,考察参与人1在第一阶段的最优选择。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,由于,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,考虑以上述讨价还价博弈为阶段博弈的无限重复博弈。假设贴现率为。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,由于在无限重复博弈 中,由 t+1 阶段开始的每个子博弈都等同于初始博弈,因此,从第 t 阶段开始的子博弈等同于 t+2 阶段开始的子博弈。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,从均衡结果可以看到:每个参与人在博弈中的所得都随自己的贴现率(即自己的耐心)增大而增加,随对方的贴现率(即对方的耐心)的减少而增加。这说明在讨价还价博弈中,耐心越大越有利,越不耐心越不利!,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,进一步讨论均衡结果与参与人贴现率的关系。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,从上述分析可以看到:有绝对耐心的参与人总可以通过拖延时间使自己独吞整个蛋糕。这种“耐心优势”在一般情况也成立:给定其他条件(如参与人的出价次序),越有耐心的参与人得到的份额越大。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,4.贴现率还可以理解为讨价还价的一种成本,类似蛋糕随时间的推延而不断缩小,每一论讨价还价的总成本与剩余的蛋糕成比例。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,讨价还价的成本可以分为两类:固定成本和变动成本。贴现率可以认为是变动成本,参与人每出一次价,蛋糕都要按一定比例(贴现率)缩小。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,讨价还价的另一类成本就是固定成本。比如说,工会与企业的谈判拖延了工期,企业要承受两种损失:一种是推迟出售产品而造成的利息损失(与价值成比例),另一种是不能按期交付的违约罚款(一般是固定的)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,两种成本对讨价还价均衡结果的影响是不同的。下面讨论固定成本对均衡结果的影响。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在讨价还价博弈中,固定成本的一种特殊形式就是外部机会(即机会成本)。外部机会越多,机会成本越大,参与人所处的地位越不利。,Contro

    注意事项

    本文(第8章重复博弈.ppt)为本站会员(sccc)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开