第8章重复博弈.ppt
《第8章重复博弈.ppt》由会员分享,可在线阅读,更多相关《第8章重复博弈.ppt(125页珍藏版)》请在三一办公上搜索。
1、第二部分:完全信息动态博弈,第八章 重复博弈,主要内容:一、有限重复博弈二、无限重复博弈三、讨价还价博弈,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,第八章 重复博弈,主要内容:一、有限重复博弈二、无限重复博弈三、讨价还价博弈,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,一、有限重复博弈,重复博弈所关心的议题:将来可信的威胁或承诺如何影响到当前的行动,Control Science and
2、 Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,考察下列博弈,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,上述博弈存在唯一的Nash均衡。将上述博弈重复两次,其中第二次博弈开始时,第一次博弈的结果已知。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,两次重复博弈的博弈树,Control Science and Engineerin
3、g,HUST All Rights Reserved,2007,Luo Yunfeng,上述重复博弈只存在唯一的Nash均衡:在每次博弈中,参与人1都选择U,参与人2都选择L,即(U,U,U,U,U),(L,L,L,L,L)可以证明:该均衡为精炼Nash均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,前面的分析说明:在两次重复博弈中,合作仍无
4、法到达。同样可证明:在n阶段重复博弈(即博弈重复n次且每次博弈开始时,前面博弈的结果都已知)中,合作同样无法到达。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,重复博弈定义,对于给定的阶段博弈G,令G(T)表示G重复进行T次的有限重复博弈,并且在下一此博弈开始前,所有以前博弈的进程都可被观测到,G(T)的收益为T次阶段博弈收益的简单相加。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在重复
5、博弈中,当全部博弈进行到任何一个阶段,到此为止的进行过程就成为参与各方的共同知 识,而其后尚未开始进行的部分就是一个子博弈。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,定理:,如果阶段博弈G有唯一的Nash均衡,则对任意有限的T,重复博弈G(T)有唯一的子博弈精炼解,即G的Nash均衡结果在每一个阶段重复进行。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,考察下列博弈,Control S
6、cience and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,上述博弈存在两个Nash均衡:(L1,L2)和(R1,R2)将上述博弈重复两次。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,1)战略:每个局中人都有个战略;,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,2)战略组合:一共存在 个战略组合;,Control Sc
7、ience and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,3)均衡:可以根据以下原则构造均衡:由第一阶段的结果,预测第二阶段的均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,例如:若第一阶段出现(M1,M2)(即出现合作),则第二阶段为(R1,R2)(即“好的均衡”);若第一阶段没有出现(M1,M2),则第二阶段为(L1,L2)(即“差的均衡”)。,Control Science and Engineering,HUS
8、T All Rights Reserved,2007,Luo Yunfeng,根据上述原则,可构造如下策略:,S1:第一阶段选择M1;如第一阶段结果为(M1,M2),则下一阶段选R1;否则选择L1。S2:第一阶段选择M2;如第一阶段结果为(M1,M2),则下一阶段选R2;否则选择L2。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在上述策略下,博弈可表示为:,这意味着:合作可以在第一阶段达到,Control Science and Engineering,HUST All Rights Re
9、served,2007,Luo Yunfeng,定理:,如果G=是一个有多个Nash均衡的完全信息静态博弈,则G(T)可以存在子博弈精炼解,其中对每一 tT,t 阶段的结果都不是G的Nash均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,上述结论说明:对将来行动所作的可信威胁或承诺可以影响到当前的行动。考察下列博弈。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Scie
10、nce and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,如果第一阶段出现(Y1,Y2),则第二阶段(Z1,Z2);如果第一阶段出现(Y1,w),其中(wY2),则第二阶段为(P1,P2);,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,如果第一阶段出现(w,Y2),其中(wY1),则第二阶段(Q1,Q2);如果第一阶段出现(w1,w2),其中(w1Y1,w2Y2),则第二阶段为(Z1,Z2)。,Control Science
11、and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,显然,上述策略构成博弈的Nash均衡,且为子博弈精炼Nash均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,第八章 重复博弈,主要内容:一、有限重复博弈二、无限重复博弈三、讨价还价博弈,Control Science and E
12、ngineering,HUST All Rights Reserved,2007,Luo Yunfeng,二、无限重复博弈,定义(无线重复博弈)给定一阶段博弈G,令 表示相应的无限重复博弈,其中G将无限次低重复进行,且参与人的贴现率为。对每个t,之前t-1次阶段博弈的结果在t阶段开始进行前都可以被观测到,每个参与人在 中的收益都是该参与人在无限次的阶段博弈中所得受益的现值。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在有限重复博弈G(T)中,由第 t+1 阶段开始的一个子博弈为G进行 T-
13、t 次的重复博弈,可表示为G(T-t)。由第 t+1 阶段开始有许多子博弈,到 t 阶段为止的每一可能的进行过程之后都是不同的子博弈。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在无限重复博弈 中,由 t+1 阶段开始的每个子博弈都等同于初始博弈,和在有限情况下相似,博弈 到 t 阶段为止有多少不同的可能进行过程,就有多少从 t+1 阶段开始的子博弈。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yun
14、feng,对于无限重复博弈,参与人在博弈的每一时点,都不必考虑过去的得失,也就是说,无限重复博弈中,参与人过去的得失并不重要,可以看成是沉没成本(或收入)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,下列博弈重复无限次。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,对于阶段博弈为上述博弈的有限重复博弈,合作不可能形成。但对于无限重复博弈,在一定的贴现率下,合作有可能形成。,Control
15、 Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,构造如下触发策略:,S1:第i阶段选择D;如第i阶段结果为(D,R),则下一阶段选D;否则以后一直选择U。S2:第i阶段选择R;如第i阶段结果为(D,R),则下一阶段选R;否则以后一直选择L。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,可用证明:在一定的贴现率下,上述触发策略构成Nash均衡。,Control Science and Engineering,
16、HUST All Rights Reserved,2007,Luo Yunfeng,贴现率的求解,所以,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,可行收益,一组收益 为阶段博弈G的可行收益,如果它们是G的纯战略收益的凸组合(即纯战略收益的加权平均,权重非负且和为1)。前述阶段博弈的可行收益集合如下图所示。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,阴影部分为上述博弈的可行收益区间,Co
17、ntrol Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,平均收益,给定贴现率,无限的收益序列 的平均收益,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,所以,故,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,令G为一个有限的完全信息静态博弈,令 为G的一个Nash均衡下的收益,且用 表示G的其它任何可行收益
18、。若存在 则存在足够接近1的贴现率,使无限重复博弈 存在一个子博弈精炼Nash均衡,其平均收益可达到,定理:,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,子博弈精炼Nash均衡的可行收益区间,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在贴现因子并不“足够接近于1”时,子博弈精炼Nash均衡能达到什么样的平均收益?,Control Science and Engineering,HUST
19、All Rights Reserved,2007,Luo Yunfeng,思路之一:令贴现率等于一个固定值,并在假设参与者运用触发战略,一旦发生任何偏离就永远转到阶段博弈的Nash均衡的条件下,计算可以达到的平均收益。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在决定当前阶段是否偏离时,贴现率越小,下一阶段开始进行惩罚的效果就越小。然而,一般来讲参与者总可以比简单重复阶段博弈的Nash均衡得到更高的收益。,Control Science and Engineering,HUST All R
20、ights Reserved,2007,Luo Yunfeng,思路之二:由阿布勒(Abreu,1988)最先提出,它基于如下思 路,即阻止一个参与者偏离既定战略的最有效的方法是威胁该参与者,一旦偏离,就将受到最严厉的可信的惩罚,即威胁该参与者,一旦偏离,就将选择使偏离者收益最低的无限重复博弈的子博弈精炼Nash均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在绝大多数博弈中,永远转到阶段博弈的Nash均衡并不是最严厉的可信惩罚,于是有些使用触发战略方法无法达到的平均收益,运用阿布勒的方
21、法可以达到。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,考虑古诺博弈为阶段博弈的无限重复博弈,两企业的贴现率都为。计算两个企业的下述触发战略成为无限重复博弈的Nash 均衡时,贴现率 的值。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,触发战略,在第一阶段都生产垄断产量的一半。第 t 阶段,如果前面 t-1个阶段两个企业的产量都为,则生产;否则,生产古诺产 量。,Control Scie
22、nce and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,当双方都生产 时,每个企业的利润为,用 来表示。当双方都生产 时,每个企业的利润为 我们用 表示。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,若企业i将在本期生产,则使企业j本期利润最大化的产量为下式的解其解为,其利润水平为,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfen
23、g,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,首先计算对任意一个给定贴现率,如果双方都采用触发战略,一旦出现背离就永远转到古诺产出,企业可以达到的利润最大化的产量。显然,该产量处于古诺产出与垄断产出之间。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunf
24、eng,考虑如下的触发战赂:第一阶段生产。在第 t 阶段,如果在此之前的t-1个阶段两企业的产量都是,生产;否则,生产古诺产出。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,Control Scien
25、ce and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,考虑下面的“两面”(亦称胡萝卜加大棒)战略:在第一阶段生产垄断产量的一半,即;第t阶段,如果两个企 业在第t1阶段都生产,则生产;如果两个企业在t-1阶 段的产量都是x,则生产;其他情况下生产x。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,上述战略为参与者提供了两种手段:其一是(单阶段的)惩罚,这时企业生产x;其二是(潜在无限阶段的)合作,这时企业的产量为。如果任何一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 重复 博弈
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-4827600.html