博弈论完全信息动态博弈ppt课件.ppt
第二章完全信息动态博弈(3),五、重复博弈重复博弈 有限次重复博弈:连锁店悖论无限次重复博弈无名氏定理无限重复博弈的例子参与人不固定时的重复博弈 不确定环境下的重复博弈,0、重复博弈,动态博弈:序惯博弈 :参与人在前一阶段的选择将决定随后的子博弈的结构。 重复博弈 :是指同样结构的博弈重复多次,其中的每次博弈称为阶段博弈。 重复博弈的基本特征:(1)阶段博弈之间没有物质上的联系(前一阶段博弈不改变后一阶段博弈的结构);(2)所有人都观察到过去博弈的历史;(3)参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值。,在重复博弈的每个阶段博弈中,参与人可同时行动,也可不同时行动。在后一情形中,每一阶段博弈本身就是一个动态博弈。影响重复博弈均衡结果的主要因素:博弈的重复次数:参与人可能为了长期利益而牺牲眼前利益从而选择不同的均衡策略。信息的完备性:当一个参与人的支付函数不为其他人所知时,该参与人可能有积极性建立一个好的声誉以换取长远利益(声誉模型)。,重复博弈的分类,根据阶段博弈的重复次数,可分为:有限重复博弈和无限重复博弈根据信息结构的出现,重复博弈可分为:(1)可观察行动的重复博弈:连锁店悖论、重复囚徒困境博弈、古诺寡头垄断重复博弈等;参与人不确定时的重复博弈(2)不完美信息重复博弈:双寡头重复博弈:厂商观察到每期的市场价格下选择产量,但不知道对手的产量;重复合伙关系:参与人观察到实现的产出但不知对方的努力水平。,1、有限次重复博弈,(1)市场进入阻挠博弈通常,进入门槛越低的行业,其平均利润率越低。一种解释是,在位者为了阻止潜在进入者的进入,主动放弃高定价,选择较低的竞争性价格(以此表示自己是低成本),从而阻止潜在进入者进入。另一种解释是,潜在进入者只要看到有利可图,由于其进入成本低,就将进入该行业。,进入阻挠博弈,模型设定:一个新企业(进入者)想进入被垄断企业(在位者)所把持的市场。进入者有两种策略可选择:进入还是不进入;在位者也有两种策略:默许还是斗争。设进入前垄断利润为300,进入之后寡头利润为100,进入成本为10,进入后双方争斗时利润均为0。该博弈有两个纯策略纳什均衡(默许,进入)和(斗争,不进入)。,市场进入阻挠博弈的子博弈精炼纳什均衡,在单阶段博弈中,唯一的子博弈精炼纳什均衡结果是在位者默许,潜在进入者选择进入。,有限重复次的市场进入阻挠博弈,现在假定同样的市场有100个(理解为在位者有100家连锁店),进入者每次进入一个市场,博弈就变成了100次重复博弈。在位者是否可以以斗争来威胁以阻止潜在进入者进入?在有限次重复博弈中,斗争并不是一个值得置信的威胁。,连锁店悖论,首先考虑第100个市场,在博弈最后阶段,斗争已没有任何意义,在位者将默许,进入者将选择进入。再考虑第99个市场,因为不论在位者选择什么行动,第100个市场的均衡结果不受影响,在位者的最优选择仍然是默许。如此一直倒推回去,得到该博弈的唯一的子博弈精炼纳什均衡是在位者在每一个市场上都选择默许,进入者在每一个市场上选择进入。其他的纳什均衡如“在位者总选择斗争,进入者总选择不进入”,但不是子博弈精炼的。,(2)有限次重复囚徒困境博弈,在有限次重复囚徒困境博弈同样如此,“总是坦白”是唯一的子博弈精炼纳什均衡。,定理,定理:令G是阶段博弈,G(T)是G重复T次的重复博弈(T)。那么,如果G有唯一的纳什均衡,则重复博弈G(T)的唯一子博弈精炼纳什均衡是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都是一次性博弈的均衡结果)。G有唯一的纳什均衡是必不可少的条件。,例:有两个纯策略纳什均衡的重复博弈,在单阶段博弈中有两个纯策略纳什均衡(L1,L2)和(R1,R2)。现考虑两阶段重复博弈情形。在子博弈精炼纳什均衡中,参与人能否在第一阶段实现合作(M1,M2),使其收益最大化?,预期,若参与人均有这样的预期,若第一阶段出现合作(M1,M2),则第二阶段预期的纳什均衡是(R1,R2),若第一阶段出现其他结果,则第二阶段预期的纳什均衡是(L1,L2)。考虑策略:参与人1(2)在第一阶段首先选择M1(M2);在第二阶段,若第一阶段的博弈结果是(M1,M2),则第二阶段选择合作的纳什均衡策略R1( R2),否则选择惩罚的纳什均衡策略L1 (L2)。该策略是一个子博弈精炼纳什均衡。,两个阶段,模型启示,上述模型说明,对将来行动所作的可信的威胁或承诺可以影响当前的行动。上述模型亦表明,子博弈精炼的概念对可信性的要求并不严格。因为参与人会认为,过去的反正已经过去,即使第一阶段双方未能合作,在第二阶段选择较低的纳什均衡(1,1)也是一种愚蠢的行为。故参与人没有动机在第二阶段实施惩罚行为。,参与人没有动机在第二阶段实施惩罚,参与人有动机实施惩罚的例子,第二阶段,第二阶段预期策略(可视为一种谈判协议):若第一阶段出现合作(M1,M2)或(x,y), 这里x、y分别是除M1、M2外的任何策略,则第二阶段结果为(R1,R2);若第一阶段出现(M1,y),y是除M2外的任何策略,为(P1,P2);若第一阶段出现(x,M2),x是除M1外的任何策略,为(Q1,Q2)。,第一阶段,((M1,M2),(R1,R2))是重复博弈的子博弈精炼均衡结果,且是帕累托最优的。 而((R1,R2),(R1,R2))、((L1,L2),(L1,L2))也是子博弈精炼均衡结果。,评析,G中纳什均衡的唯一性是一个重要条件:当阶段博弈有多个纳什均衡时,在博弈最后阶段,参与人可以使用不同的纳什均衡惩罚第一阶段的不合作行为或奖励第一阶段的合作行为。,解开连锁店悖论的方法,解开连锁店悖论的办法之一是引入信息的不完全性(声誉模型)。解开连锁店悖论的办法之二是引入无限重复博弈(或以某一概率随机地确定是否继续开张新的连锁店)。当博弈重复无限多次时,存在着完全不同于一次博弈的子博弈精炼纳什均衡。,2、无限次重复博弈与无名氏定理,(1)无限重复囚徒困境博弈与有限次重复博弈不同,即使在每个阶段中有唯一纳什均衡的无限次重复博弈也存在多重纳什均衡。例如,在无限重复囚徒困境博弈中,单阶段博弈中不可能实现的合作也能作为子博弈精炼纳什均衡的结果出现。重复博弈的特点是参与人在每一阶段的行动空间和支付函数是完全一样的,新均衡的出现在于参与人的选择基于他们之前阶段获得的信息。,无限次重复囚徒困境博弈的冷酷策略,“冷酷策略(grim strategies)”,又称“触发策略(trigger strategies) ,是指:开始选择抵赖(合作),然后一直选择抵赖(合作),直至有一方选择坦白(背叛),然后永远选择坦白(背叛)。,只要参与人有足够耐心(贴现因子1/8,这里=1/(1+r),r为贴现率),每一阶段(抵赖,抵赖)是一个子博弈精炼纳什均衡结果,双方都坚持“冷酷策略(触发策略)是一个子博弈精炼纳什均衡。,纳什均衡,首先,(冷酷策略,冷酷策略)是一个纳什均衡。给定对方选择冷酷策略,选择冷酷策略对自己是最优的:给定对方坚持冷酷策略(1/8) ,自己不会选择首先坦白;给定对方坚持冷酷策略,一旦某方选择坦白,由于对方将坚持坦白,因而自己坚持冷酷策略永远坦白也是最优的。,子博弈精炼纳什均衡,其次,(冷酷策略,冷酷策略)是子博弈精炼的纳什均衡。将子博弈划分为两类:(1)类型A,没有任何参与人曾经坦白(与原博弈相同);(2)类型B,至少有一个参与人曾经坦白。在类型B中,冷酷策略要求参与人只是重复单阶段博弈的纳什均衡,自然也是整个子博弈的纳什均衡。,其他,但该博弈还有许多其他子博弈精炼均衡,例如,参与人在每一个阶段都选择坦白。针锋相对策略(tit-for-tat strategy)(又称投桃报李,一报还一报,以牙还牙):1)每个参与人开始选择抵赖(合作);2)然后,在阶段t,简单地重复t-1阶段对手的行动。若贴现因子为1,该策略是否是子博弈精炼的纳什均衡策略?,分析,若囚徒B选择针锋相对策略:首先,囚徒A没有激励在开始时选择坦白(即囚徒B的针锋相对策略在均衡路径上是最优的)。其次,如果囚徒A开始时选择坦白,囚徒B对其进行惩罚是不理性的行为(即囚徒B在非均衡路径上不是最优的)。因此,针锋相对策略不是一个子博弈精炼纳什均衡策略。,无名氏定理,无名氏定理(弗里德曼,1971):令G为一个n人阶段博弈,G(,)为以G为阶段博弈的无限次重复博弈,a*是G的一个纳什均衡(纯策略或混合策略),e=(e1, e2, , en)是a*决定的支付向量,v=(v1, v2, , vn)是一个任意可行的支付向量,V是可行的支付向量的集合。那么,对于任何满足viei的vV,存在一个因子*1使得对于所有的*,v=(v1, v2, , vn)是一个特定的子博弈精炼纳什均衡结果。,囚徒困境博弈中的可行支付集,子博弈精炼均衡可达到的可行集,(2)古诺寡头垄断的无限重复博弈,在古诺寡头垄断重复博弈中,某种形式的合谋就有可能作为均衡结果出现。考虑冷酷策略:首先选择生产qi=qM/2(qM表示垄断情形下的最优产量);继续选择qi=qM/2,直到有一个企业选择qjqM/2,然后永远选择qi=qic(qic表示企业i的古诺均衡产量)。如果:,即当9/17,则默契合作(合谋)将是一个子博弈精炼均衡结果。,特别地,对任何q*qM/2, qic都是冷酷策略精炼纳什均衡的一个特定结果。设想参与人选择如下冷酷策略:首先选择生产qi= q*;继续选择qi= q*,直到有一个企业选择qjq*,然后永远选择qi=qic(qic表示企业i的古诺均衡产量) 。则当以下条件满足时,企业i没有积极性偏离q*:,其中,于是,只要又因对任何q*qM/2, qic都有:,故当9/17时,对任何的i*ic, M/2都将是一个子博弈精炼均衡结果。,当9/17时,若触发策略是一个子博弈精炼纳什均衡,则寡头公司的产量q*将满足:,当9/17时,q*下限接近于(a-c)/4,当 0时,q*下限接近于古诺产量(a-c)/3。,古诺重复博弈的可行集合,时间偏好性与博弈结束不确定性解释,无名氏定理意味着在无限次重复博弈中,对任何满足个人理性的可行的支付向量都可以通过一个特定的子博弈精炼纳什均衡得到。在上述分析中,一直被解释为参与人时间偏好的变量,也可用来解释博弈在某个时间结束的不确定性。设博弈在某个阶段结束的概率为p,则博弈达到阶段t的概率为(1-p)t-1,于是参与人在阶段t的期望支付现值为t-1(1-p)t-1t,这可以完善无名氏定理:如果博弈重复无限次或每次结束的概率足够小,并且充分接近于1,则任何个人理性的可行支付向量都可以作为子博弈精炼均衡结果出现。,(3)无名氏定理的扩展,Fudenberg-Maskin证明,无名氏定理中的纳什均衡支付e=(e1, e2, , en)可用其保留支付v=(v1, v2, , vn)代替,表示参与人i可能受到的最大惩罚支付。,古诺重复博弈的最大可行集合,胡萝卜加大棒,Abreu(1986)证明,即使不够大,如果使用最严厉(使不合作者得到最低可能支付)的可信惩罚(是子博弈精炼均衡)则能保证最大可能的合作策略。考虑古诺模型中的“胡萝卜加大棒”策略:首先选择生产qi=qM/2(qM表示垄断情形下的最优产量);在阶段t,如果两个企业在时期t-1都生产qM/2或x,继续生产qM/2,否则生产x,这里x为最大惩罚产量(大于古诺均衡产量)。,在合作子博弈中,参与者愿意合作,则:M /2 +/(1-) M/2d+V(x)其中,V(x)=(x)+/(1-) M/2即:M /2 +M/2d+(x)等价于:M/2 - (x) d - M /2 由(x) = (a-c-2x) x,d = 9(a-c) 2 /64,取=1/2,得:x(a-c)/8 或 x3(a-c)/8。在惩罚子博弈中,企业愿意执行惩罚产量,则:V(x) dp(x)+V(x)由dp(x) = (a-c-x) 2 /4,即得: 3(a-c)/10 x(a-c)/2,从而可得,当=1/2时, “胡萝卜加大棒”策略能保证垄断利润作为子博弈精炼均衡结果出现,条件是惩罚产量x满足:,虽然惩罚是一把双刃剑,但严厉的目的是阻止不合作行为的发生(处罚必须可信),惩罚实际并不发生。法律威信关键在于违法必究,否则,再严厉的法律也没用。市场经济中的信用问题:,无名氏定理(推广),无名氏定理:令G(,)是一个n人无限次重复博弈,则任何一个有限次重复博弈中能观察到的任何一个行动组合都将是某个子博弈精炼纳什均衡结果,若:1)博弈在任何一个重复阶段上结束的概率充分小。2)贴现因子充分接近于1,即存在一个贴现因子*1使得对于所有的*时均成立。3)该行动组合的支付向量v=(v1, v2, , vn)满足,vivi,这里是参与人i的最小最大支付,v=(v1, v2, , vn) 是该博弈的最小最大支付组合。,3、无限重复博弈的例子,(1)可观察行动的重复博弈(参与人确定):无限重复囚徒困境博弈古诺寡头垄断重复博弈效率工资时间一致性的货币政策,(a)效率工资,若产出完全由努力水平(道德)确定时,就业高工资和失业市场并存是有效率的。类似于古诺双头垄断下的共谋,在如下效率工资模型中,采用触发策略,能得到高产出高工资的均衡结果。高薪养廉:,模型设定,企业为激励工人努力工作,一方面支付很高的薪水;同时又威胁一旦被发现偷懒,立即开除。作为这种高薪的一个后果,企业减少了对劳动力的需求,造成部份工人的高薪就业和其他工人的非自愿失业并存。在竞争均衡条件下,工资水平w和失业率u恰好可以使工人不去偷懒,并且企业在工资水平w下的劳动需求恰好使失业率等于u。以下分析一个企业和一个工人的情形。,阶段博弈,考虑如下的阶段博弈:(1)企业对工人开出一个工资水平w;(2)工人接受或拒绝企业的开价。如果工人拒绝,则成为自我雇佣者,保留收益为w0;如果工人接受,则工人选择是否努力工作(努力带来负效用e)。工人的态度:如果努力工作,则肯定可以得到高产出y;如果偷懒,则以p的概率得到高产出,不妨设低产出为0(y0)。工人的博弈:工人偷懒时企业的期望收益为py。假设y-ew0py:这意味着对工人来说,受雇于企业并且努力工作是有效率的;对企业来说,工人自我雇佣要优于受雇于企业并偷懒。,该阶段博弈的子博弈精炼解是失望的,由于企业先付工资,工人没有动机努力工作,于是企业将开出0工资且工人选择自我雇佣。但在无限重复博弈中,触发策略将是一个子博弈精炼纳什均衡。如果企业在第一阶段开出工资w*(w*w0)。给定企业的策略,工人接受是最优的。如果工人努力工作,企业将再次开出高工资,工人在下一阶段进行相同的博弈。,对企业给定的工资w*来讲,如果工人努力工作,则工人收益的现值为Ve=(w*-e)+Ve 即Ve=(w*-e)/(1-)如果工人偷懒,则偷懒的现值为Vs=w*+pVs+(1-p)w0/(1-) 即Vs=(1-)w*+(1-p)w0/(1-p)(1-)对工人来讲,如果VeVs,则选择努力工作是最优的,即:w*w0+e(1-p)/(1-p)=w0+e1+(1-)/(1-p),w*w0+e(1-p)/(1-p)=w0+e1+(1-)/(1-p) 这就是说,企业向工人支付的必须包括工人的自我机会收益、努力负效用和工资升水。自然地,如果偷懒很难被发现(p1),则工资升水必须非常高才能激励工人努力工作。另一方面,如果偷懒必然被发现(p=0),则当w*w0+e/时,工人将选择努力工作。,给定工人的策略,则企业在第一阶段的参与约束条件为:y-w*0。此即:y-ew0+e(1-)/(1-p)至此,我们已经得到,触发策略(企业在第一阶段开出高工资w*,并且在其后的每一阶段,若博弈过程是高工资、高产出,则继续开出高工资;工人的策略是如果ww0,则接受企业的工资,并且如果博弈的过程是高工资、高产出,则努力工作)是一个纳什均衡。,要证明其是子博弈精炼均衡,只要证明对不是始于“高工资、高产出”之后的子博弈,上述策略也是一个纳什均衡即可。这是成立的:对企业来说,由于将来工人都不会努力工作,因而将永远开出0工资;对工人来说,工人在当前阶段也不会努力工作,并且只有在ww0时,才会接受给付的工资。,在劳动力市场上,同时存在多个企业,并且每一企业雇佣多名工人,此时,企业一般不会再雇佣因偷懒而被自己开除的工人,但是否会雇佣被其他企业因偷懒而开除的工人?合理的结果可能是“否”,因为这会使努力工作的工人失望。这可以解释日本大企业间白领雇员缺乏流动性。与此相对的是,若被解雇工人能很快找到新工作,则无法提供对偷懒的有效惩罚。日本和美国的工作观:,如果一个债务国能够在国际资本市场上通过短期交易重复从债权国借入长期贷款,则在无限重复博弈中对债务国的违约行为没有一个可行的惩罚方案。如果企业能很容易地从资本市场上融资,那么企业将热衷于资本游戏。,(b)时间一致性的货币政策,在单阶段博弈中,政府的货币政策具有动态不一致。现实中,政府与企业进行的是多阶段动态博弈,这是否会改变博弈结果呢?在无限重复博弈中,运用触发策略能使货币政策具有动态一致性。,假设货币当局与政府的贴现因子都为。考虑触发策略:雇主在第一阶段持有预期e=0,在其后各阶段,如果所有前期的预期和真实的通货膨胀率都为0,则继续预期e=0,否则雇主持有预期e=s;在当前预期和所有以前的预期都为0,且所有以前的真实通货膨胀率都为0时,货币当局选择令0的货币供给,否则货币当局选择s*(e)。,给定雇主第一阶段的0通货膨胀预期和触发策略,货币当局的选择是:(1)0,其效用为Mp,在下一阶段货币当局面临同样的选择;(2)选择*(0),此时效用为Mf,但这将使得其后的e=s。此后,货币当局将永远选择=s,其效用为Ms。从而,当下式成立时,货币当局的0通货膨胀政策是对雇主策略的最优反应:Mp/(1-)Mf+Ms/(1-),由此可得,只要(Mf-Mp)/(Mf-Ms),则货币当局的策略是对雇主策略的最优反应。 在前面效用函数的假设下,条件为:c/(2c+2)。同样,雇主策略是对货币当局策略的最优反应。与前面证明相同,上述触发策略是子博弈精炼均衡 。,(2)参与人不固定时的重复博弈,无名氏定理可以扩展到一部份参与人不固定的重复博弈:长期参与者和短期参与者。消费品市场交易就是一个典型例子。厂商是长期的固定参与人,不断重复提供产品(决定产品是高质量还是低质量),而消费者是不固定的,每个消费者只购买一次或有限次。,产品质量博弈模型,参与人:无限多的潜在企业和连续的消费者博弈顺序:1)企业进入市场成本为F,企业进入数量n由进入成本决定;2)进入市场的企业选择生产高质量的产品(成本为c)还是低质量的产品(成本为0),并选择价格p,消费者观察不到企业的质量选择;3)消费者决定购买企业i的商品数量为qi,所有消费者观察到其购买商品的质量,博弈回到2),重复进行。支付:消费者从低质量的产品中得到支付为0;若认为产品是高质量的,则购买量为q(p)=qi,其中dq/dp0。如果企业不进入市场,支付为0;如果企业进入市场(固定支付为-F),若生产低质量产品,则该期期末支付为qip,若生产高质量产品则期末支付为qi(p-c)。,同质厂商和同质消费者情形,假定只有一个厂商提供产品,每个阶段只有一个消费者。在博弈的每一阶段,厂商选择提供高质量产品还是低质量产品,消费者选择是否购买。阶段博弈的支付矩阵如图。在一次性博弈中,唯一的纳什均衡是(不购买,低质量)。,但在无限次重复博弈中,只要1/2,下列触发策略组合是一个子博弈精炼纳什均衡:厂商从生产高质量产品开始;继续生产高质量产品,除非曾经生产过低质量产品;如果上一次生产了低质量产品,则永远生产低质量产品。第一个消费者选择购买;只要厂商不曾生产过低质量产品,随后的消费者继续购买;如果厂商曾经生产过低质量产品,之后的消费者不再购买。此均衡的结果是(购买,高质量)。品牌的价值:,迭代模型与马尔可夫均衡,参与人:两个企业A、B和一系列的消费者,每个消费者开始时是年轻人,然后是老年人。博弈顺序:1a)企业A首先作为在位者企业,选择在位者价格p1i;企业B首先作为进入者企业,选择进入者价格p1e。1b)老年人选择一个企业,年轻人选择一个企业,吸引了年轻人的那个企业成为进入者企业;1c)老年人去世,年轻人变成老年人。2a)博弈回到1a)重新开始,此时在位者和进入者的身份可能改变。支付:贴现率为。消费者的保留价格为R,转换成本为c;企业j=(i, e)在t期的当前支付tj分别是0(没吸引顾客)、ptj (吸引1个顾客)和2ptj (吸引2个顾客)。老年人、年轻人从在位者和进入者企业购买的t期支付分别为: toi=R-pti, toe=R-pte-c, tyi=R-pti, tye=R-pte。,分析,toi=R-pti, toe=R-pte-c, tyi=R-pti, tye=R-pte首先,在位者的价格需保持对老年人有足够吸引力,即进入者的价格应满足 pepi-c。在位者的选择pi将使进入者是否争夺老年人是无差异的,即使得进入者选择pe=pi和pe=pi-c的利润无差异,即:pi=2(pi-c).于是在位者和进入者价格满足:pi=pe=2c。均衡中,在位者和进入者轮流转换,且制定同样的价格。,马尔可夫策略指参与人在每个节点上的行动只取决于上一期的行动(或参与人在上一期的行动集合),而和博弈的历史无关的策略。在马尔可夫均衡中,由e*=pe+i*i*=pi+e*由此,即得i*=e*=2c/(1-)。,4、不完美信息重复博弈,“参与人过去的行为是共同信息”这一假设通常很难满足。在多数重复博弈中,在每一期末,所有参与人观察到一个共同结果,每个参与人实现的收益只和他自己的行为和公共结果有关。每个参与人只是通过他们对结果分布的作用来影响其他参与人的收益。,价格战,问题:在一个寡头市场上,一个企业可能并不能确切地知道另一个企业生产了多少产量,卖什么价格,它能观察的只有自己的情况。由于市场需求的不确定性,企业观察到自己利润下降时,这有可能是对手削价造成的,也有可能是市场需求下降造成的。古诺模型:价格由逆需求函数确定(需求是确定的),厂商选择产量,其利润依赖于自己的产量和对方的产量。斯蒂格勒模型:市场需求是不确定的,厂商观察到自己的销售情况,但不能观察到对方的价格和产量。,不完美信息的价格战模型(Green and Porter, 1984),模型假设:厂商的收益取决于自己的产出和市场价格,后者由不确定的市场需求和总产出共同确定。由于需求的不确定性和对方产出的难以观察,最大的惩罚不是最优的,它将导致任何企业都选择不合作;另一方面,若企业确信当对手利润下降时也不会实施惩罚,则暗中削价能带来短期利润。此时,触发价格均衡策略包括一个合作期(垄断价格)和一个惩罚期(成本价格),模型预测存在一个周期性的价格战(由需求下降造成)。,Rotemberg 和Saloner(1986)证明,即使需求是可观察的,需求的波动也会使合作变得更为困难(在高需求阶段维持合作更为困难)。若每一阶段各有两种可能的需求D1(p)D2(p),概率各为1/2。在高需求阶段时,削价企业(产量增加)将获得较高的阶段利润,维持合作变得更加困难。这就是“共苦容易同甘难”。,重复“道德风险”博弈,逆向选择与道德风险:合伙模型(Radner,1986):每个人的收益依赖于自己的努力和共同产出,共同产出取决于所有人的努力和一个随机因素,其他参与人的努力不能观察。有噪声的囚徒困境博弈:保险模型:,失业保险,考虑失业保险模型:(1)保险公司乙首先行动,公布它的保险费率表;(2)某甲决定购买多少保险;(3)自然决定甲是否被解雇,若未被解雇,则博弈结束,否则进入下一步;(4)甲再次行动,选择自己寻找工作的努力程度(越努力越容易找到工作,但努力是有成本的);(5)自然确定甲是否找到新工作,若甲找到新工作并赴任,则保险公司不必赔偿,否则保险公司按协议给予补偿。,购买失业保险人员失业后寻找新工作的努力程度是个人私人信息,保险公司无法证实(或证实成本太高)。若甲购买的是完全保险,则失业后,甲肯定不会努力寻找工作。若保险公司能无成本地观察到甲寻找工作的努力程度,他可以提供差别费率。,常见的道德风险问题还有财产保险、汽车保险、股东和经理的激励问题、非自愿失业等等。,求解重复博弈,求解重复博弈的思路:参与者的声誉未来损失的威胁重复博弈能作为长期关系建模的最佳近似。常见的例子有:共谋现象;厂商和供应商关系:信任过去行动揭示其私人信息的信号:,本章小结,博弈分类与博弈的扩展式表述博弈树的构造:路径和信息集纯策略、混合策略与行为策略 纳什均衡与子博弈精炼纳什均衡逆向归纳法与子博弈精炼纳什均衡求解重复博弈:触发策略,巩固思考题,张维迎博弈论与信息经济学第二章的习题。,