第十章博弈论初步.ppt
《第十章博弈论初步.ppt》由会员分享,可在线阅读,更多相关《第十章博弈论初步.ppt(66页珍藏版)》请在三一办公上搜索。
1、第十章 博弈论初步Game Theory,博弈论概述纳什均衡序贯博弈与重复博弈进入威慑,第一节 博弈论概述,什么是博弈?拍卖金钱海盗博弈田忌赛马围棋和象棋,上,中,下,中,上,下,赢,输,田忌,赢,输,赢,输,输,赢,赢,输,输,赢,输,赢,赢,输,赢,输,齐王,1、博弈主体(局中人、参与人players)主体是理性的经济人,力图实现自身利益最大化2、游戏规则游戏顺序、游戏方法等3、策略(strategy)个人在博弈中的行为选择降价、提价;打人、骂人、沉默使狙击还是AK;躲在角落还是进攻,一、博弈的基本要素,4、支付(收益 payoff)策略带来的结果:打人、骂人、沉默5、信息完全信息、不完全
2、信息对方的收益状况、策略状况等对方是否知道我的信息6、均衡(equilibrium)均衡:所有参与人最优战略的组合,博弈论的定义1、John C.Harsanyi在他1994年获得诺贝尔经济学奖的获奖辞中的定义:博弈论是关于策略相互作用的理论,就是说,它是关于社会形势中理性行为的理论,其中,每个局中人对自己行动的选择必须以他对其他局中人将如何反应的判断为基础。2、张维迎的定义:博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。,1、分类的不同标准A、主体:两人博弈、多人博弈(有单人博弈吗?)B、行动顺序:静态、动态C、信息情况:完全、不完全D、支付情况:零和、常和、变
3、和(蕴涵了双赢和多赢的可能)E、能否达成有约束力的协议:合作博弈、非合作博弈,二、博弈的分类,2、普遍采用的分类标准及其组合A、行动顺序:静态、动态B、信息情况:完全、不完全C、四种基本组合:完全信息静态 完全信息动态 不完全信息静态 不完全信息动态,第二节 纳什均衡,一、博弈的均衡经济学的均衡,是当其他条件不改变时,当事人的行为也不改变并且是约束条件下能够使得当事人达到最好的一种状态。博弈均衡,是各自都考虑到自己对手的策略行动之后所做出的行动,这个行动组合就是博弈的均衡。即参与人在最大化各自的支付时所选取的策略组合。,二、囚徒困境Prisoners Dilemma,Prisoner A,Co
4、nfess,Dont Confess,Confess,DontConfess,Prisoner B,Prisoners Dilemma,上策(dominant strategy):无论对方做什么,对我来说这么做都是最好的。,无论对方如何选择,每个人的最优选择:坦白。所以,我们可以预测,结果将是(坦白,坦白),个人理性与集体理性的冲突,“囚徒困境”表明个人理性与集体理性的冲突。这样的例子很多:寡头竞争,军备竞赛,公共产品的供给和搭便车行为,等等;许多的制度就是为解决“囚徒困境”而存在的;和尚挑水的故事,三、占优均衡(dominant-strategy equilibrium),一般来说,由于每个
5、参与人的效用依赖于所有人的选择,因此每个人的最优选择(战略)也依赖于所有其他人的选择(战略)。但在上述例子中,一个人的最优选择并不依赖于他人的选择。这样的最优战略,被称为“占优战略”(dominant strategy)。由所有参与人的占优战略构成的战略组合被称为“占优均衡”。上策均衡:是一种非常稳定的均衡。,占优均衡(dominant-strategy equilibrium),占优战略均衡的出现只要求所有人都是理性的,但不要求每个参与人知道其他参与人是否理性。囚徒困境博弈有占优均衡,所以其结果很容易预测。,夫妻争斗博弈,丈夫,妻子,动口,动手,动口,动手,0.5,1,1,1,1.5,1,0
6、,0,有些博弈没有占优均衡,但通过剔除“坏”战略,我们可以预测博弈的结果。如“智猪博弈”,按,等待,按,等待,3,1,2,4,7,1,0,0,“劣”战略:无论对方选择什么,如果自己选择A得到的总是收益小于选择B得到的收益,A就是相对于B的劣战略。,大猪,小猪,四、纳什均衡,1、纳什均衡的定义:设 是n人博弈G;的一个策略组合。如果对于每个局中人,对于所有 都成立,则我们称策略组合 是该博弈的一个纳什均衡。,如果用 表示除 之外的所有参与人,则上述定义可以简化为:设 是n人博弈G;的一个策略组合。如果对于每个局中人,对于所有 都成立,则我们称策略组合 是该博弈的一个纳什均衡。,纳什简介:约翰纳什
7、生于1928年6月13日。父亲是电子工程师与教师,第一次世界大战的老兵。纳什小时孤独内向。纳什的数学天分大约在14岁开始展现。他在普林斯顿大学读博士时刚刚二十出头,但他的一篇关于非合作博弈的博士论文和其他相关文章,确立了他博弈论大师的地位。在20世纪50年代末,他已是闻名世界的科学家了。然而,30岁的时候,纳什和他惟一儿子都罹患精神分裂症。半个世纪之后,在他妻子(艾利西亚麻省理工学院物理系毕业生)的精心照料下,和她的儿子一样,纳什教授渐渐康复,并在1994年获得诺贝尔经济学奖。影片美丽心灵是一部以纳什的生平经历为基础而创作的人物传记片。该片荣获2002年奥斯卡金像奖。,纳什均衡:举例,广告博弈
8、这是否是一个囚徒困境?,企业1,企业2,摊位博弈,1、两个摆摊的,请问他们各自应该在哪点摆摊?2、类似的问题还包括:加油站或者加气站的选址总统竞选,占优策略,Dominant Strategies“Im doing the best I can no matter what you do.”“Youre doing the best you can no matter what I do.”,纳什均衡,Nash Equilibrium“Im doing the best I can given what you are doing”“Youre doing the best you can g
9、iven what I am doing.”,陈屹立,Kobe Bryant,上,下,下,上,10,10,5,5,10,10,5,5,篮球博弈,交通博弈与交通规则,靠左行,靠右行,靠左行,靠右行,1,1,1,1,-1,-1,-1,-1,2、多重纳什均衡,法律和社会规范如何协调预期,法律和社会规范就是这种协调预期的规则,帮助人们在多个纳什均衡中筛选一个特定的纳什均衡。社会规范是通过习惯、长期的交互博弈产生的行为规则,法律是立法机关制定的行为规则,但不论是法律还是社会规范,它们的功能之一都是协调预期。,交通规则的演变,在多个纳什均衡之间不存在优劣之分时,偶然事件对选择具有重要意义;从历史上来考察,
10、许多交通规则一开始并不体现为法律,而是长期演化而来的。在欧洲大陆的早期,道路行走规范是非常地方化的,有些地方采用靠左走的习惯,有些地方采用靠右走的习惯,是不统一的。只是随着道路的增加和地区间交往的扩大,地方性的习惯才逐步演变为区域性的规范,然后有演变为全国性的规范。但直到世纪前,道路规则也仅仅是作为规范而得到遵守,而不是作为交通法律而得到执行。现在欧洲大陆的靠右走的规则是在法国兴起的。,交通规则的演变,在法国大革命以前,贵族的马车习惯上是靠左行的,穷人在路上看到富人的马车来了,要站在马路的右边。因此,靠左行与“特权阶级”相联系,而靠右行被认为更为“民主”。随着法国大革命,作为一个革命的象征,规
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十 博弈论 初步

链接地址:https://www.31ppt.com/p-4751983.html