博弈论及经典案例简介.ppt
《博弈论及经典案例简介.ppt》由会员分享,可在线阅读,更多相关《博弈论及经典案例简介.ppt(88页珍藏版)》请在三一办公上搜索。
1、,博弈论及经典案例,比赛规则:马按奔跑的速度分为上中下三等,等次不同装饰不同,各家的马依等次比赛,三赛二胜。比赛前田忌按照孙膑的主意,第一场,用上等马鞍将下等马装饰起来,冒充上等马,与齐威王的上等马比赛;第二场,用上等马与齐威王的中等马比赛;第三场,田忌的中等马和齐威王的下等马比赛。结果二比一,田忌赢了齐威王。在双方条件相当时,对策得当可以战胜对方;在双方条件相差很远时,对策得当也可将损失减低到最低程度。,假如你正在和朋友用手机通电话,突然信号断了。这时,你会立即拨电话过去,还是等你的朋友拨电话过来?,很显然,你是否应拨电话过去,取决于你的朋友是否会拨过来。如果你们其中一方要拨,那么另一方最好
2、是等待;如果一方等待,那么另一方就最好是拨过去。因为如果双方都拨,那么就会出现线路忙;如果双方都等待,那么时间就会在等待中流逝。,这,就是博弈!,*在一场博弈中,你必须考虑对方的选择以确定你自己的最优选择,而对方也必须考虑你的选择来确定他的最优选择。*你从博弈中得到的,不仅取决于你自己的行动,也取决于对方的行动。如果你知道恋人不会打过来(如以前断线就是她在等电话,如果你的手机包月额度很难用完而她的接听免费),那么你的最优行动就是拨过去。*博弈最本质的特征是:双方的行动相互影响又相互依赖,博弈无处不在,石头、剪子、布,0,0,1,-1,-1,1,-1,1,1,-1,0,0,1,-1,-1,1,0
3、,0,石 头,剪 子,布,博弈方2,石 头,剪 子,布,博弈方1,划拳博弈,老虎,鸡,虫,杠子,老虎,鸡,虫,杠子,0,0,1,-1,0,0,-1,1,-1,1,0,0,1,-1,0,0,0,0,-1,1,0,0,1,-1,1,-1,0,0,-1,1,0,0,博弈论之“数学”的特征,只是数学思维、数学符号,有些符号怪模怪样,甚至不会读,但很少有什么艰深的数学这里的符号比较麻烦,因为它和代数中的纯粹抽象而无意义的符号不同,在脑子里要时刻记得它们的实际意义但要熟悉这种简捷、抽象的思维方式,记住这些符号的代表意义所以,一个比较有效的学习方法是重复,博弈论简介,博弈论(Game Theory)又名对策
4、论,游戏论博弈论,英文为Game theory,是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。博弈论试图研究既存在冲突又存在合作的情况下(如寡头垄断)人们的决策行为。博弈是一种势态,在该势态中,两个或更多的参与人都在追求他们各自的利益,没有人能够支配结果。博弈的过程就是一个策略上的相互作用过程。这使得任何一方的行为都必须考虑到对方可能作出的反映。,博弈论研究对象,博弈论是研究理性的决策主体在其行为发生直接的相互作用时的策略选择及策略均衡的理论。博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应策略(给自己带来最大收益的策略)。冲突、竞争现象的定量分析理
5、论。参加竞争的各方为了获胜而需研究出一组对付对方的策略。,博弈论的产生和发展,(1)我国古代围棋、国际象棋(印度)等;(2)1912年,数学家翟墨罗把对策从模拟模型抽象为数学模型;(3)第一次、第二次世界大战,军事对策应用于战役和战略研究;(4)1944年,冯诺意曼、摩根斯特合写了“博弈论和经济行为”,推动了博弈论在经济管理中的应用;(5)近年来,由于纳什、泽尔腾、海萨尼获诺贝尔经济学奖(1994),进一步推动了博弈论的研究。,博弈论的产生和发展,学弈(孟子告子):弈秋,通国之善弈也。使弈秋侮二人弈,其一人专心致志,惟弈秋之为听;一人虽听之,一心以为有鸿鹄将至,思援弓缴而射之。虽与之俱学,弗若
6、之矣。为是其智弗若与?吾曰:非然也。,1.博弈在中国,博弈又称博戏,是一门古老的游戏。世本说,“乌曹作博”,乌曹乃是夏代著名之能工巧匠。千百年来,博弈更是与人们的生活紧紧相连,从博棋到牌戏,从斗戏到彩票,中华民族的历史长河中就这样形成了别具风情的博弈文化,从孙子兵法到三十六计从田忌赛马到孙庞斗智从运筹帷幄到韬光养晦从曹刿论战到论持久战,1943年,冯诺依曼和摩根斯顿发表博弈论和经济行为的一书,,标志着博弈论作为一门独立科学的开始,也标志着新古典经济学进入了一个新的发展阶段。,2.博弈论的开山之作,二、基本概念,局中人或参与者(Players)规则(rules):规定博弈各方的行动顺序、方式、以
7、及最终的结果等。策略(Strategy):一整套的行动方案,规定了各种情况下的行动。比如:敌进我退,敌退我追,敌驻我扰,敌疲我打。,相机策略(contingent strategy):仅在不确定事件发生时才会采取的策略。如:人不犯我,我不犯人;人若犯我,我必犯人。行动:局中人在特定条件下的行为支付(Pay-off):博弈结束时,各方得到的收益。策略均衡:参与者之间稳定的、可预测的互动行为模式,就是策略均衡。,上策均衡:我所做的是不管你做什么我所能做的最好的你所做的是不管我做什么你所能做的最好的,NASH均衡:我所做的是给定你所做的我所能做的最好的你所做的是给定我所做的你所能做的最好的,上策与上
8、策均衡,所谓上策,是指这样一种策略,即不管对手采取什么策略,这种策略都是最优的。,而当对局者选择的都是上策的时候,这种均衡叫做上策均衡,所谓均衡是指一种稳定的结局,当这种结局出现的时候,所有的对局者都不想再改变他们所选择的策略。,纳什均衡,纳什均衡是指在对手策略既定的情况下,各自对局者所选择的策略都是最好的。,上策均衡与纳什均衡的区别:,上策均衡是指不管你选择什么策略,我所选择的是最好的;不管我选择什么策略,你所选择的是最好的。,纳什均衡是指给定你的策略,我所选择的是最好的;给定我的策略,你所选择的是最好的。,上策均衡是纳什均衡的一种特殊情况,但纳什均衡却不一定是上策均衡。,纳什均衡的意义,所
9、以“纳什均衡”是对冯诺依曼和摩根斯特恩的合作博弈理论的重大发展,甚至可以说是一场革命。,合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。,其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。,纳什均衡是指在对手策略既定的情况下,各自对局者所选择的策略都是最好的。,A、B、C三人决斗,每人有2颗子弹,每次发一枪。A、B、C的命中概率分别为0.3、0.8、1.0。三人依次发射,两轮后对决结束。每次可以选择向对手发射,也可以放空枪。射中即死。问
10、在这场博弈中A的最优策略。,故事模型,B(80%),C(100%),A:30%,分析过程,的行动选择集合()对空发射,()射,()射如对空发射,有80%的可能杀死(必然射,因为一定选择射击,则必死);然后有30%可能杀死(仅,;必射);如未能杀死,则向射击(存活概率0.2)。对局结束。存活概率为0.8*(0.3+0.7*0.2)0.352。如未射死,则射杀,然后要么成功射杀,要么被射杀;存活概率为0.2*0.3=0.06。总体存活概率41.2%。概率树工具,对空发射:存活概率为0.8(0.3+0.70.2)+0.20.3=41.2%,A可以采取的行动,向C发射:存活概率为0.30.2(0.7+
11、0.30.2)+0.741.2%=33.4%,向B发射:存活概率为0.741.2%=28.84%,再说三个枪手,A和B似乎达成了某种默契:在C被干掉之前,他们相互不是敌人。这不难理解,毕竟人总要优先考虑对付最大的威胁,同时这个威胁还为他们找到了共同利益,联手打倒这个人,他们的生存机会都上升。而且,从悲观的角度看,他们恐怕也活不到需要相互拼个你死我活的时候。但这个“同盟”也是很不牢固的,两个人都在时时权衡利弊,一旦背叛的好处大于默契的好处,他们马上就会翻脸。,再说三个枪手,在这个“同盟”里,最忠诚的是B 只要C不死,他就不会背叛;A就要滑头多了,在前面轮流开枪的例子中,他不朝C开枪,从同盟者的角
12、度说,就是没有履行义务,而把盟友送上危险的境地,这不是因为道德水平不同,而是处境不同。是C的头号目标,这个敌人一定要向他开枪的,完全没有回旋的余地;而A不同,他随时愿意牺牲换取下次自己的先手之利。除了压力较小之外,而且还有一个动力驱使A背叛,那就是一旦干掉C后,的机会比他要大,他至少要保持先下手,才可能一争高下。,诸葛亮在隆中对中提出“跨有荆益、东有孙权、北图中原”,他舌战群儒,力劝东吴孙权与刘备联盟。,三国中的博弈联吴抗魏,所以,弱者总是有动力去维持一个稳定的三角形结构:与次强者联盟,但是却不愿真正消灭强者。,火烧赤壁一战,孙刘联军大败曹操,曹操北逃。诸葛亮明知关羽重义气,必然放走曹操,为何
13、还将捉曹重任交给关羽?,三国中的博弈华容道,结论:诸葛亮并不想杀掉曹操 曹操一死,刘备亦亡矣!,有人会问:既然放操,为何又设三重拦截?如果孙权知道诸葛放操,则孙刘联盟瓦解,因此,既要放,又不能让孙权看出是有意放。,揭示思想:一个人,在社会上的生存不仅取决于其能力大小,还要看其威胁到的人。,现实例子:总统竞选,实力最弱的开始时总是表现低调,实力强劲与实力中等者互相攻击,狼狈不堪,这时最弱的竞选者粉墨登场。,“功高震主”,“木秀于林,风必摧之”,一个对他人利益不构成威胁的人,自然不会是他人意欲除掉的对象,反而能在各种政治风云中幸存下来。能力最强,本事最大的人,反而最有可能走向悲剧结果。的存活概率只
14、有14%。能力处于中间状态的,是最可能存活的。:56%能力最弱的,也可以比最强者有更大的生存机会。:41.2%。,三国中的博弈孙刘联盟的瓦解,孙权不但“火烧赤壁”打败曹操,更在此后还长期承担了对抗曹操的主要任务。而刘备虽在赤壁之战中也出了力,但此后几年未与曹操打过大仗(也就是没有尽联盟义务)。倒是趁此机会扫荡地方势力,扩充地盘,直至占据两川,将曹操赶出汉中,又派关羽北伐,水淹七军,不但取代了孙权原来的老二地位,甚至有可能击败曹操,成为新的老大。孙权地位跌落到老三,他的策略也随之改变。于是孙权趁关羽北伐后方空虚之机,与曹操合谋,夺取了荆州,杀死关羽。结果是同盟破裂,刘备兴兵报仇,又被孙权打败。蜀
15、汉从此衰落,东吴也面临了两面作战的不利局面。,三国中的博弈孙刘联盟的瓦解,如果分析一下孙权的心理,我们可能对他的背信弃义有更多同情。赤壁之战尽管符合他的利益,但到底是他出力挽救了刘备,此后他不但把荆州长期借给刘备,还把妹妹嫁给了这个老头子。他尽了同盟的义务,曾与曹操大战数次,不仅损兵折将(他的大将太史慈、董袭、陈武等都在战斗中阵亡),他自己也险些在逍遥津送命。可从收益上说,他与刘备是“牛打江山马坐殿”,感到不平衡是正常的。,可是从对策论来看,孙权却犯了一个大错误,由于嫉妒,他过早和刘备翻脸,致使两败俱伤。这就好比枪手A突然翻脸向开火。坐收渔利的当然是C。虽然曹操的继任者曹丕没能抓住机会夹攻孙权
16、,一举消灭这两个敌手,但蜀和吴此后已经没有可能打败魏国了。那么,孙权的最优策略是什么?回想上面的枪手决斗就明白了。既然已经落到A的地位,就该以A的策略行事。让刘备去和曹操恶斗,自己扩充势力,养精蓄锐,随机应变。无论两者胜负,自己都能从中渔利。,三国中的博弈孙刘联盟的瓦解,面对诸葛亮的空城,司马懿真的是不敢攻城吗?,三国中的博弈空城计,既然“兔死狗烹”,那么猎狗最好不要让兔子全部死掉。,公路塞车,大家都遵守交规,一个人违规进入自行车道,得便宜,但如果每人都这样,则人人都吃亏。如每个人都守规矩,则一个不守规矩的就会获得好处,每个人都不守规矩,则人人都失利。,囚徒困境模型,两人因盗窃被捕,警方怀疑其
17、有抢劫行为但未获得确凿证据可以判他们犯了抢劫罪,除非有一人供认或两人都供认。即使两人都不供认,也可以判他们犯盗窃物品的轻罪。囚徒被分离审查,不允许他们之间或通信息,并交代政策如下:如果两人都供认,每个人都将因抢劫罪加盗窃罪被判3年监禁;如果两人都拒供,则两人都将因盗窃罪被判半年监禁;如果一人供认而另一个拒供,则供认这被认为有功而免受处罚,拒供者将因抢劫罪、盗窃罪以及拒供重判5年。,囚徒困境赢利表(Payoff Table),乙,甲,囚徒困境,每个囚徒都会发现,如果对方拒供,则自己供认便可立即获得释放,而自己拒供则会被判0.5年,因此供认是较好的选择。,如果对方供认,则自己供认将被判3年,而自己
18、拒供则会被判5年,因此供认是较好的选择。,由于每个囚徒都发现供认是自己更好的选择,因此,博弈的稳定结果是两个囚徒都会选择供认。这就是博弈的纳什均衡。,攻守同盟?很难达成:隔离审查,每个人都担心对方背弃盟约。,囚徒困境的启示,“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。,经济学中的理性人成立吗?,传统经济学的鼻祖亚当斯密在其传世经典国民财富的性
19、质和原因的研究中这样描述市场机制:“当个人在追求他自己的私利时,市场的看不见的手会导致最佳经济后果。”这就是说,每个人的自利行为在“看不见的手”的指引下,追求自身利益最大化的同时也促进了社会公共利益的增长。即自利会带来互利。传统经济学秉承了亚当斯密的思想。传统经济学认为:人的经济行为的根本动机是自利,自私是个好东西,每个人都有权追求自己的利益,没有私社会就不会进步,现代社会的财富是建立在对每个人自利权利的保护上的。因此经济学不必担心人们参与竞争的动力,只需关注如何让每个求利者能够自由参与尽可能展开公平竞争的市场机制。只要市场机制公正,自然会增进社会福利。,个人理性与集体理性的冲突,但是囚徒困境
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈 论及 经典 案例 简介

链接地址:https://www.31ppt.com/p-2721660.html