博弈与信息.ppt
1,博弈与信息,工商管理学院 李映东2003年9月2004年1月,2,一元与两元的故事,美国19世纪有一个颇有成就的政治家,其幼年时是流浪街头的孤儿。他经常在大街上向行人讨钱,但当有人让他在一块钱和两块钱之间选择时,他选择了一块钱。于是,许多人都为了亲眼验证关于他的“犯傻”行为的传闻,专门来找他并让他在一块钱和两块钱之间选择。他依然故我地只选择一块钱,于是来找他的人愈来愈多。终于有一天,有一位女士问他:难道你不知道两块钱比一块钱更多一些钱吗?他如此回答道:如果我有一次选择了两块钱,就不会有人来找我让我在一块钱与两块钱之间选择了,我也讨不到钱了。,他如此回答道:如果我有一次选择了两块钱,就不会有人来找我让我在一块钱与两块钱之间选择了,我也讨不到钱了。,3,三方对决,话说有三个仇家,分别叫做张三、李四和王五,他们决定来一场三方对决。总共有两个回合:第一回合,每人得到一次射击机会,射击次序分别为张三、李四和王五;第一回合过后,幸存者得到第二次射击机会,射击次序还是张三、李四和王五。对于每一个参与对决的人,最佳结果都是成为唯一幸存者;次佳结果则是成为两个幸存者之一;排在第三位的结果,是无人死亡,最差的结果当然是自己被对方打死。,张三的枪法最糟糕,瞄准10次只有3次能够打中目标;李四的水平高一点,精确度有80;王五是神枪手,百发百中。那么,张三的第一回合的最优策略应该是什么?在这个问题里,谁有最大的机会幸存下来?,4,三方对决之分析,假如张三先向李四开枪并打中对方,他等于签下自己的死亡保证书,因为接下来轮到王五,而他是百发百中。王五不可能放弃向张三开枪的机会,因为开枪将使他得到自己的最佳结果。所以,张三向李四开枪不是吸引人的选择。假如张三先向王五开枪并打中对方,接下来轮到李四,李四会向张三开枪,李四的精确度是80,所以张三活命的机会只有20。,到目前为止,上述选择没有一个显得很有吸引力。张三的最佳策略是什么呢?实际上,他的最佳策略是向空中开枪!若是这样,李四就会向王五开枪,假如他没打中,王五将向李四开枪并打死李四。于是进入第二轮,又轮到张三开枪了;由于只剩下一个对手,他至少有30的概率保住性命,因为这是他打中剩下这个对手的概率。,这个案例也说明一个道理:弱者可能通过放弃自己的第一个成功机会取得更好的结果。因此,你的幸存机会不仅取决于你自己的本事,还要看你威胁到的人。一个没有威胁到任何人的弱者,可能由于较强的对手相互残杀而幸存下来。王五是最厉害的神枪手,但在此案例中的幸存概率却最低,只有14。李四有56的取胜机会;张三的最佳策略使他能以30的精确度换取41.2的幸存概率。,5,策略思维,策略思维方式:我们在决策时,不仅要考虑自己究竟有什么策略可以选择,而且也要考虑博弈对方的可供选择的策略以及他们的相互影响,在此基础上进行博弈分析,然后再做出自己的最优选择。博弈论基础上的策略思维方式从一个独特的视角帮助我们更加深刻地理解和把握经济现象,并指导更加有效的经济、管理政策制订。,6,信息甄别:所罗门王的故事,所罗门王是古代以色列国的一位以智慧著称的君主。一次,两个女人为争夺一个婴儿争扯到所罗门王殿前,她们都说婴儿是自己的,请所罗门王作主。所罗门王稍加思考后作出决定:将婴儿一刀劈为两段,两位妇人各得一半。这时,其中一位妇人立即要求所罗门王将婴儿判给对方,并说婴儿不是自己的,应完整归还给另一位妇人,千万别将婴儿劈成两半。听罢这位妇人的求诉,所罗门王立即作出最终裁决婴儿是这位请求不杀婴儿的妇人的,应归于她。,这个故事讲的道理是,尽管所罗门王不知道两位妇人中谁是婴儿的母亲,但他知道婴儿真正的母亲是宁愿失去孩子也不会让孩子被劈成两半的。所罗门王正是利用这一点,一下就识别出谁是婴儿的真正的母亲了。也就是说,他提供了不同方案,让两个女人自己去选择,然后再根据她们的选择来推断其类型。(当然,如果另外一个女人足够聪明的话,她也应该假装真正母亲的人的行为说:不要劈成两半),7,参考书籍,张维迎,博弈论与信息经济学,上海三联书店,1996美Fudenberg、法Tirole,博弈论,中国人民大学出版,2002年(原著1991)法Tirole,产业组织理论,人大出版社,1997法Laffont、Martimort,激励理论(第一卷):委托代理模型,中国人民大学出版社,2002年王则柯,博弈论平话,中国经济出版社王则柯等,信息经济学浅说,中国经济出版社,1999张维迎,企业的企业家契约理论,上海三联书店,1995美阿维纳什等,策略思维商界、政界及日常生活中的策略竞争,8,第一章 导论,第一节 经济学、博弈论与信息经济学第二节 博弈论概述第三节 信息经济学概述,9,新古典经济学假定,市场参与者的数量足够多从而市场是充分竞争的。信息是完全的,参与人之间不存在信息不对称问题,即一方并不比另一方拥有更多信息。,10,诺贝尔经济学奖获得者,1994年,三位博弈论专家即数学家纳什(Nash)、经济学家海萨尼(Harsanyi)和泽尔滕(Selten)。1996年,两位将博弈论应用于非对称信息下机制设计的经济学家莫里斯(Mirrlees)和维克里(Vickrey)。2001年三位运用博弈论研究信息经济学的经济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞(Spence)。,11,1957年的纳什,12,老年纳什,13,美丽心灵的剧照,14,经济学发展趋势,经济学研究越来越转向个体,寻求宏观经济的微观基础经济学越来越转向人与人关系(或企业与企业关系)的研究,尤其是人与人之间行为相互影响的研究。经济学越来越重视对信息的研究,特别是信息不对称对人的行为和制度安排的影响。,15,两个概念,价格歧视:同一种商品在同一家商店(或企业)针对不同的消费者实行不同的价格。三种形式:完全价格歧视、二级价格歧视、三级价格歧视价格分散:同一种商品在不同商店即使针对同样的消费者价格也不一样。,16,第二节 博弈论概述,概念博弈的分类若干经典的博弈论例子,17,博弈的分类及对应的均衡概念,18,若干经典的博弈论例子,完全信息静态博弈完全信息动态博弈不完全信息静态博弈不完全信息动态博弈,19,完全信息静态博弈的几个例子,囚徒困境(Prisoners dilemma)智猪博弈剪刀、石头、布性别战斗鸡博弈市场进入阻挠,20,囚徒困境,21,纳什均衡,纳什均衡是一个由所有参与人的最优战略组成的战略组合,此时,给定别人战略的情况下,没有任何单个参与人有积极性选择其他战略,从而没有任何人有积极性打破这种均衡。,22,卡特尔,23,囚徒困境例子1:价格战,出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利,但实际上却是相互杀价,结果都赚不到钱。当一些商家共谋将价格抬高,消费者实际上不用着急,因为商家联合维持高价的垄断行为一般不会持久,可以等待垄断的自身崩溃,价格就会掉下来。,譬如,2000年我国几家生产彩电的大厂商合谋将彩电价格维持高位,他们搞了一个“彩电厂家价格自律联盟”,并在深圳举行了由多家彩电厂商首脑参加的“彩电厂商自律联盟高峰会议”。当时,国家有关部门还未出台相关的反垄断法律,对于这种在发达国家明显属于违法行为的所谓“自律联盟”,国家在法律上暂时还是无能为力的。寡头厂商在光天化日之下进行价格合谋,并且还通过媒体大肆炒作,这在发达国家是不可思议的。但是,尽管政府当时无力制止这种事情,公众也不必担心彩电价格会上涨。这是因为,“彩电厂商自律联盟”只不过是一种“囚徒困境”,彩电价格不会上涨。在高峰会议之后不到二周,国内彩电价格不是上涨而是一路下跌。这是因为厂商们都有这样一种心态:无论其他厂商是否降价,我自己降价是有利于自己的市场份额扩大的。即降价是厂商的“占优策略”。,24,囚徒困境例子2:民航联营协议,1998年底有些航空公司的票价低到34折,当年民航业出现行业性亏损。在此背景下,民航总局于1999年2月和国家计委联合发出“禁折令”。但到1999年10月,由于多种原因,一些航空公司开始私下打折,在2000年3月出现了所谓“三折事件”,即市场传言西南航空公司机票打3折,成都至广州票价从1040元下降到仅312元,比火车卧铺票还低100多元。看来“禁折令”已受到挑战,为此,民航总局于2000年3月25日组织各大航空公司签署航线联营协议。,这个新协议的大意是:将同飞一条航线的航空公司联合起来,按照民航总局统一核定的票价售票,由民航总局进行统一结算。民航总局声称“联营”的目的是制止乱打折,抑制恶性竞争。2002年11月民航总局决定不再组织进行航线联营,同时取消联营航线结算、清算。,25,囚徒困境例子3:公共草地被过度放牧,草地属于“可再生资源”,如果限制放牧的数量,没有被牛羊吃掉的剩余草皮还会重新长出大面积草场,但如果不限制放牧规模,过多的牛羊将草吃得一光二净,则今后不会再有新草生长出来,草场就会消失。,由于公共草地的产权没有界定,政府也没有对放牧作出规模限制,此时牧民们就是否放牧、放牧多少牲畜的决策就是一个囚徒困境的博弈。牧民们的思维实际上就是一种策略思维:他们会想,如果别人放牧的少,那么我放牧得多就可以吃更多的草,可以获得更大的利益;如果别人也放牧得多,那么我放牧得少就吃亏了,我也应该放牧得多,甚至更多,显然,放牧多的牛羊是牧民的“占优策略”(不放牧或放牧少是“劣势策略”),最终是每个人都选择放牧很多牛羊,草场的承受力超过极限,被过度放牧,导致草地消失、沙漠化。,26,智猪博弈,27,圣餐杯的故事占优策略,在美国电影印第安纳.琼斯与最后的十字军东征的最后场面里,琼斯、他的父亲和一名纳粹分子全都聚集在安放圣餐杯的地方。眼看纳粹分子只差一步就要得到圣餐杯,琼斯父子却无论如何都不愿意助纣为虐。于是,纳粹分子打了琼斯父亲一枪。只有具备起死回生力量的圣餐杯才能救他父亲,在这种情况下,琼斯只好引他们走向圣餐杯。不过,前面还有一个最后的挑战:琼斯必须在十几个杯子当中做出选择,选出耶稣基督用过的圣餐杯;只有圣餐杯才能使人长生不老,其他杯子却会致人与死地。,28,圣餐杯的故事占优策略,纳粹头子迫不及待地拿起一个华丽的黄金杯,喝下里面的圣水,却突然倒地而死,因为他选错了。琼斯选了一个木头杯,那是一个木匠用的杯子。他一边大叫“只有一个办法可以证实”,一边将杯里的水倒出一点在圣水器上,自己先喝了下去,希望自己选中的就是生命之杯。当琼斯发现自己没有搞错,立即把杯子送到他父亲那里,圣水果然治愈了致命的枪伤。,29,圣餐杯的故事占优策略,其实,琼斯有一个占优策略可以选择。他本来应该先把杯子递给他父亲,没有必要自己亲身尝试。假如琼斯确实选对了杯子,那他父亲就会得救;假如他选错了杯子,那他父亲就会丧命,却至少可以保全琼斯。在将杯子递给他父亲之前,自己测试一下其实毫无用处,这是因为,假如琼斯选错了杯子,那就再也没有第二次机会了琼斯将死于致命之水,而他父亲也会死于致命枪伤。,30,剪刀、石头、布,31,田忌赛马,春秋战国时期,齐威王常与旗下大将田忌赛马。规则是:每次赛三局,每一局齐威王与田忌各出一匹马比赛奔跑速度。每一局中的胜者赢败方一千斤铜。田忌有上、中、下三匹马,而齐威王也有上、中、下三匹马。每次比赛,第一局田忌出上马,齐威王也出上马;第二局田忌出中马,齐威王也出中马;第三局,田忌出下马,齐威王也出下马。齐威王的上马比田忌的上马好,齐威王的中马也比田忌的中马好,齐威王的下马还是比田忌的下马好。于是,每次比赛的结果都是田忌连输三局。,田忌的谋士孙膑了解了田忌的困境后,就打听到这样一个消息:尽管齐威王的上、中、下三匹马都要比田忌的对应上、中、下三匹马好,但碰巧的是田忌的上马可胜齐威王的中马,田忌的中马可胜齐威王的下马。于是,孙膑为田忌献计:下一次比赛中第一局时田忌出下马对齐威王的上马输一局,第二局田忌出上马对齐威王的中马,第三局田忌出中马对齐威王的下马,这样可连赢两局,最后净胜一千斤铜。田忌依计而行,果真赢回一千斤铜。(孙膑用的策略思维),32,如果曹操与诸葛亮一样聪明:三国演义中的华容道博弈 在三国演义中,曹操在赤壁大战中一败涂地,率残兵败将向许都方向逃窜。诸葛亮命关羽率兵在途中阻截曹军。当时,第一批拦截大军是赵云率领的,第二批拦截大军是张飞带队的,第三批才是关羽率部伏击。由于曹军兵多将广,前二批伏击军不能逮住曹操,只是抢劫一些军械马匹之类。,33,待曹军冲过赵云、张飞两道关后,进入关羽的伏击地带。但是,当时关羽与曹操相遇的地方有两条道,一条是华容道,除此外还有另一条道。诸葛亮令关羽伏兵于华容道,并且要求关羽在华容道上点燃树枝冒出烟雾引曹操到来。当时关羽不解,问诸葛亮,“如果在伏兵之处点火,岂不令曹兵看见而改走另一条道逃脱?”诸荀亮叫关羽不要再问,只如此照办即可。,34,当曹操冲破赵云、张飞的阻截后,来到华容道前,看见华容道上静悄悄的,但有烟火萦绕。曹操大笑道:“孔明以为我会上他的当,故意叫人在华容道上点火让我走另一条道,而他却伏兵于这条道上好逮住我呢!我偏不上他的当!”于是,曹操令大军径直上华容道上而去,结果与关羽大军撞个正着。,35,曹操为何进了孔明的圈套呢?这里的道理是这样的:孔明知道曹操是聪明人,而聪明人见华容道上有烟火会认为华容道上有伏兵,于是会避开华容道而走另一条路。如果孔明令关羽在另一条路等着,曹操就被逮住了。但是,曹操不仅聪明,而且还聪明过人,他也知道孔明的如此盘算来诱他上钩,他偏不上当,知道点火的华容道上无人,孔明的队伍在另一条道上呢!于是他选择走华容道。,36,但是,依三国演义作者罗贯中的逻辑,孔明总是比曹操计高一筹,按博弈论的术语来说,就是孔明的理性程度要比曹操高上一阶。孔明也知道曹操知道孔明的打算,于是令关羽正好在点火的华容道上等着曹操。三国演义中的这个故事很可能是作者编造的,因为在三国志中并无这一情节。这里,罗贯中假设了曹操在智力上比孔明差一些,才有华容道上被关羽抓住,要不是关羽旧情难忘,曹操就死无葬身之地了。,37,但是,如果我们不假定曹操比孔明要笨一些,而是相反假定曹操与孔明一样聪明,则曹操又知道孔明知道曹操知道孔明的打算,曹操就会知道关羽在华容道上等着他呢?此时曹操就避开华容道走另一条路。但是,这还没有完,因为若孔明知道曹操知道孔明知道。显然,最终的结果是曹操与孔明玩混合战略博弈,曹操随机地以1/2的概率选择走华容道和另一条路,孔明也以1/2的概率令关羽守华容道或另一条路。,38,于是,三国演义中的这一情节就应作如下改写:诸葛亮抛出一枚硬币,决定关羽是守华容道呢还是另一条道,而曹操也掷出一枚硬币,决定是走华容道呢还是走另一条路。平均看来,曹操有1/2的概率逃脱,而关羽也只有1/2的概率抓住曹操。如果说关羽在华容道上抓住了曹操,则纯属偶然、并非孔明比曹操计高一筹所致!,39,性别战,40,斗鸡博弈,41,市场进入阻挠(静态),42,完全信息动态博弈举例,扩展形式子博弈精炼纳什均衡不可置信的威胁与承诺行动,43,市场进入阻挠(动态),44,市场进入阻挠(动态):子博弈,(0,300),(40,50)(-10,0),进入 不进入,合作 斗争,进入者,在位者,45,市场进入阻挠(动态):威胁可置信,(0,300),(40,50)(-10,0),进入 不进入,合作 斗争,进入者,在位者,46,为什么大人物、大公司要聘请常年律师?,大人物、大公司对声誉十分看重,因而为一些不良人物或公司通过诽谤大人物、大公司企图迫使大人物、大公司花钱“私了”而获利。这是因为,尽管对于一些无端的指控,大人物、大公司可望通过法律手段(打官司)而出清了结,但打官司请律师会增加他们额外的成本。如果能花稍少一些钱“私了”,则既使自己清白又省钱,同时诽谤者也获得收入。,大人物、大公司为了避免这种无端的损失,干脆花钱请常年律师,律师费用已经一次性支付,打官司不会带来额外的花费。这是一个承诺行动,它告诉潜在的诽谤者,大人物、大公司一旦受到无端诽谤必定会让他们吃官司。这样,大人物、大公司因此承诺行动而使自己得到保护,避免了许多无端指控的发生。,47,投资决策之一,某公司A打算采取“多角化”经营战略,因此他希望与另一家公司B合作从事一项新产品的开发研制工作。此项新产品研制工作需要研制经费9万元,预期研制成功后的收益为20万元。B公司投入技术人员及5万元开发费用,同事要求A公司投入4万元。B公司许诺在新产品开发成功后与A公司六四分成。由于此项新产品经过了权威认证,开发成功并实现预期收益是没有问题的。问题:A公司应否投资4万元参加研制?,48,投资决策之二,如果B的承诺可信,其实对双方都是个好事,因为收益都提高了。怎样使之可信呢?一个办法就是:B违约的行为必须受到惩罚,提高违约成本。比如,法律制度,A可以状告B违约,如果法律健全,A肯定会赢,假定赢后法院会判给A原来的投资加上利息共5万元,B则将失去所有的收入。问题:新的均衡是什么?,49,投资决策之一,50,投资决策之二,(4,0),(0,20),(5,0),(8,12),A,B,A,投资,不投资,分,不分,打,不打,51,市场进入(不完全信息静态博弈),在位者:高成本情况 低成本情况,52,贝叶斯纳什均衡,贝叶斯纳什均衡是这样一种战略组合:给定自己的类型和别人类型的概率分布的情况下,每个参与人的期望效用都达到了最大化。即没有人有积极性选择其他战略。,53,爱情博弈(不完全信息静态博弈),求爱者:品德高尚 品德恶劣,54,精炼贝叶斯均衡,精炼贝叶斯均衡是所有参与人战略和信念的一种组合,这种组合满足:(1)给定每个人有关其他人类型的信念的情况下,他的战略选择是最优的;(2)每个人有关他人类型的信念都是使用贝叶斯法则从所观察到的行为中获得的。,55,第三节 信息经济学概述,一、信息经济学的分类二、委托人与代理人三、几个例子保险市场的道德风险和逆向选择劳动力市场的信号传递,56,信息经济学的分类,