第十三章博弈论和竞争策略.ppt
《第十三章博弈论和竞争策略.ppt》由会员分享,可在线阅读,更多相关《第十三章博弈论和竞争策略.ppt(37页珍藏版)》请在三一办公上搜索。
1、第十三章 博弈论和竞争策略,几个经典的博弈,囚徒的困境赌胜博弈性别之战,囚徒的困境与破解,囚徒的困境是图克(Tucker)1950年提出的该博弈是博弈论最经典、著名的博弈该博弈本身讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各种社会问题,可以揭示市场经济的根本缺陷。上一章我们发现寡头市场存在囚徒困境。囚徒困境还在我们生活中的很多地方存在,例如军备竞赛等等。,囚徒困境的破解合作,在这里我们不妨将条件放宽,允许囚犯A和B在审讯室李一起单独呆上10分钟,然后再决定是否坦白。很明显,双方交流的主旨就是建立攻守同盟,克服自利心理,甚至可能订立一个口头协议,要求双方都不去坦白。然后
2、,双方再单独被提审。我们不妨设想,囚犯A的心理,他一定会认为,如果囚犯B遵守约定的话,则自己坦白就可获得自由;如果囚犯B告密的话,若不坦白就会被终生囚禁。事实上,囚犯A的策略并没有因为简单的沟通或协议而摆脱两难境地。恋人们在恋爱中的海誓山盟,最终还是分手;企业之间相互沟通信誓旦旦,价格战仍然会爆发;美苏两国经常会晤,甚至签订核不扩散条约,但军费一年高过一年。这些现象都反映了上面所说明的问题。,囚徒困境的破解合作,以协议形式的合作,具有约束力,实际上是改变了得益矩阵。例如,存在一个黑帮老大,他告诉两个囚徒,如果因为坦白而让自己的兄弟坐牢,坦白的人将被做掉,那么囚徒的困境也就破解了。因为此时的得益
3、矩阵已经改变。,-3,-3,-5,-5,-100,-10,-10,-100,不坦白,不坦白,坦白,坦白,囚徒B,囚徒A,囚徒困境的破解实例,1971年,美国国会通过了禁止在电视上做烟草广告的法律。令许多人奇怪的是,财大气粗的各大烟草公司反应相当平静,并没有动用其庞大的社会资源和影响力阻止这个法律的通过。政府管制最终的结果是,尽管烟草广告因受到限制而减少,可是烟草公司的利润却提高了。实际上,政府禁令不仅没有打击烟草公司,反而是把陷入白热化广告战的各大烟草集团从“囚徒困境”中解放了出来。这个时候国家出台法令对于烟草行业来说反而是个好事,烟草公司靠自己做不到的事情,政府做到了。因为国家法律具有强制性
4、的作用,相当于是烟草集团之间签订了极具约束力的协议,同时政府承担了监督烟草公司是否违反协议的成本。,囚徒困境的破解重复博弈,囚徒的困境是静态的,因而是有限的博弈,双方实际上只进行一次博弈,而在现实生活中,博弈往往是重复的。在经济中面临囚徒困境的双方,在每次的博弈中,各厂商都会造成关于他们的行为的名声,并且研究他们的竞争者的行为。下图是一个囚徒的困境,假设这个博弈一次次的重复进行,例如,你和你的竞争者每个月的头一天同时宣布你们的价格,此时应该如何选择策略?,重复博弈中的策略选择,罗伯特阿克赛罗的研究表明,在重复博弈中“针锋相对”(以牙还牙)的策略是最有策略。即,我从一个高价开始,只要你继续合作,
5、也定高价,我就会一直保持下去,一旦你降低你的价格,我马上也会降低我的价格,如果你以后决定合作并在提高价格,我马上也会提高我的价格。对于无限重复的博弈,针锋相对是可行的,而且往往会破解囚徒的困境,即双方都定高价,或者说两个囚徒都不坦白。考虑一下,在有限次博弈中,又会如何?,重复有限次博弈的策略选择,假设博弈只进行有限次数N个月。如果我们的竞争者是理性的,并且相信我也是理性的,它就可以这样推理:“因为对手采取以牙还牙的策略,我在最后一个月之前不能削价竞争,我应该在最后一个月削价,这样我在最后一个月就能赚到较大的利润,接着博弈就结束了,竞争者也没办法报复”。可是我们也会这样想,即在最后一个月定低价。
6、由于我们和竞争者都是理性的,他也会预料到我在最后一个月会定低价,从而他会在倒数第二月就定低价,同样的道理我也会在倒数第二月定低价最后,我们又落入了囚徒的困境。在实际中,虽然博弈是有限次的,但是由于厂商们不知道博弈会进行多久,最后一个月降价的基础就不存在了,这时候厂商们就会像在无限博弈中一样采用针锋相对的策略。佛家讲因果律,儒家讲究“财自道生,利缘义取”。从囚徒困境看来,如果一味地想算计别人,算来算去,最后算计到自己头上来了。如果我们将囚徒困境中的有期徒刑改为死刑,那么“机关算尽太聪明,反误了卿卿性命”用在这里是再恰当不过的了。,赌胜博弈与混合策略,赌博、竞技等构成的博弈问题,在经济中也有许多应
7、用,赌胜博弈也是一类重要的博弈问题,对经济竞争和合作也有很大启示。赌胜博弈的特点是一方得等于另一方失,不可能双赢,属于“零和博弈”。所谓纯策略是指参与者在他的策略空间中选取惟一确定的策略。有时,纯策略并不是博弈中的最佳策略。所谓混合策略是指参与者采取的不是惟一的策略,而是其策略空间上的概率分布。,赌胜博弈田忌赛马,取胜关键:不让对方猜到自己策略,尽可能猜出对方策略,最常见混和策略就是猜硬币游戏。比如在足球比较开场,裁判将手中的硬币抛掷到空中,让双方队长猜硬币落下的正反面。由于硬币落下是正是反是随机的,概率应该都是1/2。那么,猜硬币游戏的参与者都是1/2的概率选择正与反,这时博弈达到混和策略纳
8、什均衡。再比如我们儿时玩的“剪、布、锤”就不存在纯策略均衡,对每个小孩来说,自己采取出“剪”、“布”还是“锤”的策略应当是随机的。一旦一方知道另一方出其中某个策略的可能性增大,那么这个对弈者在游戏中输的可能性就增大。因此,每个小孩的最优混合策略是采取每个策略的可能性是l3。在这样的博弈中,每个小孩各取三个策略的13是纳什均衡。由此可见:纯策略是参与者一次性选取的,并且坚持他选取的策略;而混合策略是参与者在各种备选策略中采取随机方式选取的。在博弈中,参与者可以改变他的策略,而使得他的策略选取满足一定的概率。当博弈是零和博弈时,即一方所得是另外一方的所失时,此时只有混合策略均衡。对于任何一方来说,
9、此时不可能有纯策略的占优策略。,混合博弈警察与小偷,某个村庄上只有一名警察,他要负责整个村的治安。小村的两头住着两个全村最富有的村民A和B,A、B分别需要保护的财产为2万元、1万元。整个小村某一天来了个小偷,要在村中偷盗A和B的财产,这个消息被警察得知。因为分身乏术,警察一次只能在一个地方巡逻;而小偷也只能偷盗其中一家。若警察在某家看守财产,而小偷也选择了去该富户家,就会被警察抓住;若警察没有看守财产的富户家而小偷去了,则小偷偷盗成功。一般人会凭着感觉认为,警察当然应该看守富户A家财产,因为A2万元的财产而B只有1万元的财产。实际上,对于警察的一个最好的做法是,警察抽签决定去A还是B家。因为A
10、家的财产是B家的2倍,所以用两个签代表A家,比如如果抽到1、2号签去A家,抽到3号签去B家。这样警察有23的机会去A家进行做看守,13的机会去B家做看守。而小偷的最优选择是:以同样抽签的办法决定去A家还是去B家实施偷盗,只是抽到1、2号签去A家,抽到3号签去B家,那么,小偷有l3的机会去A家,23的机会去B家。这些数值是可以通过联立方程准确计算出的。,赌胜博弈猜硬币博弈,赌胜博弈石头、剪子、布,0,0,1,-1,-1,1,-1,1,1,-1,0,0,1,-1,-1,1,0,0,石 头,剪 子,布,博弈方2,石 头,剪 子,布,博弈方1,石头剪子布的策略探讨,从数学上来讲,最优玩法(根据博弈论)
11、其实就是一种随机的选择,因此,当排除心理因素后,这是一个简单并且直观的游戏,就如同和计算机玩一样。但是,这里所说的“最优”是指不存在有比期望的随机概率更好的玩法。然而,对手如果不是采用“最优”策略,而是采用某种“次优”策略的话,采用随机玩法并不一定是最好的玩法。事实上,如果对手是人或者非随机程序的话,那么几乎可以肯定他采用的是某种“次优”策略,这种情况下,针对对手的弱点可以设计出一个更好的策略。基于这种思路而设计的Roshambot计算机程序,轻松击败了人类玩家(甚至包括它的开发者Perry Friedman,他曾经在2001年8月击败7名对手,包括前世界扑克大赛冠军Phil Hellmuth
12、,并赢得800美元的奖金)。选手之间的策略可包括应用心理学去预测,或者干扰对手的行为。使用迷惑性的语言(例如:“敦厚老实的石头哟,可是战无不胜的啊!”)去干扰对手的作法是允许的。真正的石头、剪子、布的比赛是一个有趣的心理学较量。石头、剪子、布的策略是随机地选一个,但是人类不能达到真正随机,所以比赛的技术在于利用对手的非随机性。某些有经验的选手能连续达到比赛决赛就能证明技术能影响比赛结果,性别之战,小两口偏好不同,男的喜欢足球,女的喜欢歌剧,但是他们更喜欢在一起进行活动。得益矩阵如下所示。在这个博弈中有两个纳什均衡。只要有事先的沟通,两个纳什均衡都有可能实现。这个博弈还有一个混合策略均衡:男以2
13、/3的概率选择摔跤,1/3的概率选择看歌剧;女的以1/3的概率选择摔跤,以2/3的概率选择看歌剧。你可以验证如果男的选择了混合策略,女的也只有选择混合策略,而没有其他更好的策略。在这个例子中混合策略所得到的结果是随机的,双方的期望得益都是2/3。,极大化极小策略,纳什均衡及其依赖于个人理性。各博弈方的策略选择不仅取决于自己的理性,也取决于对手的理性。如下图所示,如果博弈方2碰巧错误的选择了“左”,那对博弈方1来说损失就相当大了。所以如果博弈方1是一个谨慎的人,且考虑到博弈方2不一定清楚博弈或不一定理性,博弈方1可能选择“上”,这将保证赚到1元,并不会损失1000元。这种策略就是极大化极小策略。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十三 博弈论 竞争 策略

链接地址:https://www.31ppt.com/p-4722392.html