第五讲博弈论ppt课件.ppt
《第五讲博弈论ppt课件.ppt》由会员分享,可在线阅读,更多相关《第五讲博弈论ppt课件.ppt(123页珍藏版)》请在三一办公上搜索。
1、主 要 内 容,1.博弈论概述2.完全信息静态博弈3.完全信息动态博弈,一博弈论概述,保罗萨缪尔森说:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解。”人们在日常生活中进行着博弈,与配偶,朋友,陌生人,老板/员工,教授等。类似的博弈也在商业活动、政治和外交事务、战争中进行着在任何一种情况下,人们相互影响以达成彼此有利的协议或者解决争端。博弈论为众多学科提供了分析的概念和方法:经济学和商学,政治科学,生物学, 心理学和哲学。,1与传统微观经济学的比较,传统经济学涉及的个人决策,是在给定价格参数和收入的条件下,追求效用最大化的决策(消费者均衡或生产者均衡);个人效用只依赖于自己的
2、选择,而外在于他人的选择;个人最优选择只是价格和收入的函数而不包含其他人选择的函数。 在博弈论看来,个人效用不仅依赖于自己的选择,而且依赖于他人的选择;个人的最优选择是其他人选择的函数。,1.1与传统微观经济学的比较,一致性利益最大化原则均衡原则不一致人与人之间的关系-个人理性导致集体非理性-设计协调性机制-满足个人理性前提下达到集体理性信息不完全-委托-代理理论、信号传递与信息筛选模型,1.2 博弈论的发展简史,博弈思想最早产生于我国古代。 早在两千多年的春秋时期,孙武在孙子兵法中论述的军事思想和治国策略,就蕴育了丰富和深刻的对策论思想。孙武的后代孙膑,为田忌谋划,巧胜齐王,这个著名的“田忌
3、赛马”,就是典型的对策思想的成功运用。,1.2 博弈论的发展简史,一、 起源法国经济学家奥古斯丁古诺(Augustin Cournot 1838)古诺模型英国经济学家弗朗西斯埃奇沃斯(Francis Edgeworth 1881)伯川德(Bertrand)和斯坦克伯格(Stackelberg),二、 早期突破E策墨罗(EZermelo)于1913年对于象棋游戏的研究。证明了象棋游戏总是有解,即在棋盘的任何一种状态,两个参与者中的一个有赢的策略。开创了求解一类博弈的技巧,即后退归纳法,三、近代(1) 约翰冯诺依曼(John von Neumann)于1928发表的论文(2) 1944年,科学家冯
4、诺伊曼和经济学家奥斯卡摩根斯坦合著博弈与经济行为的理论(The theory of Games and Economic Behaviour)被公认为是博弈论的开山之作。,以往的数学是在物理学的基础上发展起来的,描述的是客观世界行为,而经济学研究的对象更像是一场游戏中的参与者,相互之间预期对方的行动,因此,描述、观察研究对象就需要一系列的数学工具,这一套新的数学工具,被他们命名为博弈论。,奥斯卡摩根斯坦( Oskar Morgenstern),19021977,生于西里西亚的戈尔利策。1944年加入美国籍。热心于将数学应用于人类的各种战略问题(不管是商业、战争,还是科学研究),以便获得最大利益
5、和尽可能地减少损失。他认为 这些原理也同样适用于哪怕简单得象抛掷硬币这样的游戏,因而提出了对策论(博弈论)。,约翰冯诺依曼 ( John Von Neumann),19031957,美藉匈牙利人。18岁与老师合作发表第一篇数学论文,22岁获数学博士学位。1927年一1929年冯诺依曼相继在柏林大学和汉堡大学担任数学讲师。1931年成为美国普林斯顿大学的第一批终身教授。1933年转到该校的高级研究所,成为最初六位教授之一,并在那里工作了一生 冯诺依曼是普林斯顿大学、宾夕法尼亚大学、哈佛大学、伊斯坦堡大学、马里兰大学、哥伦比亚大学和慕尼黑高等技术学院等校的荣誉博士是美国国家科学院、秘鲁国立自然科学
6、院和意大利国立林且学院等院的院士 1954年任美国原子能委员会委员;1951年至1953年任美国数学会主席。“计算机之父”“博弈论之父”。,冯诺依曼和摩根斯坦的贡献,1,提出博弈的概念;2,对效用理论给予公理依据;3,零和博弈(Zero-sum Games)的最优解;4,引进博弈论的一种形式,即合作博弈(cooperative Games),博弈论的发展简史,四、发展 1、纳什均衡(Nash-Equilibrium)1950年,约翰 纳什(John Nash)引入均衡(解)的概念,即纳什均衡,将博弈论从零和博弈推进到非零和博弈(即参与人会出现双赢或双输的情况) 合作博弈中的讨价还价模型定义非合
7、作博弈及证明均衡解的存在纳什获得1994年诺贝尔经济学奖,2、 子博弈完美纳什均衡和贝叶斯纳什均衡(Subgame-Perfect Nash-Equilibrium; Bayes-Nash Equilibrium)1965年和1975年兰哈德泽尔藤(Reinhard Selten)把纳什均衡推广到动态博弈,并提出子博弈完美纳什均衡;1967-1968年间,约翰海萨尼(John Harsanyi)把纳什思想推广到不完全信息模型,提出贝叶斯均衡;他们与纳什一起分享1994年诺贝尔经济学奖,3、 不对称信息条件下交易的对策1996年诺贝尔经济学奖获得者詹姆斯莫里斯教授和威廉姆维克瑞教授在20世纪60
8、、70年代提示不对称信息对交易带来的影响,并提出相应对策。,4、 信息经济2001年诺贝尔经济学奖授予美国乔治阿克尔洛夫教授、迈克尔斯彭斯教授、约瑟夫斯蒂格利茨教授。20世纪70年代他们提示当代信息经济的核心,信息是有价值的。1970年阿克尔洛夫提出旧车市场模型并提出:市场不能解决所有问题,信息是有价值的1973年斯彭斯通过剖析人才市场盛行的造假行为指出人才市场存在用人单位与应聘者之间的信息不对称 ,造成“劣币”驱逐“良币”现象斯蒂格利茨将信息不对称理论应用于保险和金融市场,5 2005年,以色列经济学家罗伯特-奥曼和美国经济学家托马斯-谢林,因“通过博弈论分析加强了我们对冲突和合作的理解”所
9、作出的贡献而获奖。,三、博弈论与诺贝尔经济学奖获得者,1994年诺贝尔经济学奖获得者,美国人约翰-海萨尼(John C. Harsanyi) 和美国人约翰-纳什(John F. Nash Jr.)以及德国人莱因哈德-泽尔腾(Reinhard Selten) 获奖理由:在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响 。,约翰纳什1928年生于美国,约翰海萨尼1920年生于美国,莱因哈德泽尔腾,1930年生于德国,1996年诺贝尔经济学奖获得者,英国人詹姆斯莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞(William Vickrey) 获奖理
10、由:前者在信息经济学理论领域做出了重大贡献,尤其是不对称信息条件下的经济激励理论的论述;后者在信息经济学、激励理论、博弈论等方面都做出了重大贡献。,詹姆斯莫里斯1936年生于英国,威廉维克瑞,1914-1996,生于美国,2001年诺贝尔经济学奖获得者,三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz) 获奖理由:在“对充满不对称信息市场进行分析”领域做出了重要贡献。,2005年诺贝尔经济学奖获得者,以罗伯特奥曼色列经济学家罗伯特奥曼(Robert J. Auman
11、n)和美国经济学家托马斯谢林(Thomas C. Schelling) 获奖原因:“通过博弈论分析加强了我们对冲突和合作的理解”所作出的贡献而获奖。,1博弈论在经济学领域中应用最广泛,最成功;博弈论的许多成果也是借助于经济学的例子来发展引申的; 2经济学家对博弈论的贡献也越来越大,特别是在动态分析和不完全信息引入博弈后,例如克瑞普斯,威尔逊都是经济学家; 3最根本性的原因是经济学和博弈论的研究模式是一样的,都强调个人理性,即追求给定条件下效用最大化。,博弈专家之所以获经济学奖,原因大致有三点:,博弈论的基本概念,博弈是指一些个人、团队或组织,面对一定的环境条件,在一定的规则下,同时或先后,一次
12、或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自从中取得相应结果的过程。 博弈论就是描述在这种形势下各方理性地选择自己的行动所实现的结果,分析各决策主体的行为发生相互作用时的决策以及这种决策的均衡问题。,例:房地产开发,1、A B两个开发商,投资1亿;2、如果市场上有两栋房出售,需求大,每栋:1.4亿;需求小,每栋:7千万; 如果市场上有一栋房出售,需求大,每栋:1.8亿;需求小,每栋:1.1亿;3、开发与不开发。,8种可能的结果,1、需求大,A开发,B不开发,则A的利润8千万, B的利润为0;2、需求大,A开发,B开发,则A的利润4千万, B的利润4千万;3、需求大,A不开发,B
13、开发,则A的利润0, B的利润为8千万;4、需求大,A不开发,B不开发,利润各为0,5、需求小,A开发,B不开发,则A的利润1千万, B的利润为0;6、需求小,A开发,B开发,则A的利润-3千万, B的利润-3千万;7、需求小,A不开发,B开发,则A的利润0, B的利润为1千万;8、需求小,A不开发,B不开发,利润各为0,博弈三要素、信息及博弈均衡,(1)局中人(player):指参加博弈的各个决策个体,既可以是自然人,也可以是团体。局中人都是“理性”的,即他清楚地了解自己的目标或利益所在,在决策时考虑自己的知识(信息)以及对其他局中人策略的期望,总是采取最佳行动(或策略)以实现其支付的最大化
14、。 虚拟局中人:自然,是外部随机变量,对所有利益主体都无差异。一般用i=1,n代表参与人,N代表自然,(2)行动与战略( actions or strategies) 。行动是局中人在博弈的某个时点的决策变量;每一个局中人的所有可能选择的行动的集合称这该局中人的行动空间(action space);所有局中人的行动的一个有序集合称为该博弈的一个行动组合(action profile); ai 表示第i个参与人的一个特定行动;Ai=ai表示可供i选择的所有行动的集合;在n人博弈中,n个参与人的行动的有序集a=(a1,., ai,.an)称为行动组合,(2)战略( strategies) 是局中人
15、在所有给定信息集(信息集是局中人在特定时刻进行决策时所面对的集合)下的行动规则,他规定局中人在什么时候选择什么行动。 si 表示第i个参与人的一个特定战略;Si=si表示可供i选择的所有可选择的战略集合;在n人博弈中,n个参与人每人选择一个战略,n维向量s=(s1,., si,.sn)称为一个战略组合,(3)信息(information):是局中人有关博弈的知识,特别是有关其他局中人的特征(如策略空间、支付函数等等)和行动的知识。信息集(information sets)是局中人在特定时刻进行决策时,所面对的信息变量值的集合。共同知识(common knowledge)是指“所有局中人知道,所
16、有局中人知道所有局人知道,”(或信息)。如果局中人的策略选择、支付函数等都是共同知识,则称之为完全信息(complete information ),否则就是不完全信息(incomplete information ),(4)支付(pay off):指在一个特定的策略组合下,局中人得到的效用水平或期望效用水平。一个局中人的支付是所有局中人的策略选择的函数,它不仅取决于自己的策略选择,而且还取决于(他所设想的)所有其他局中人的策略选择,任何一个局中人改变自己的策略都将影响其他局中人的支付水平,即,局中人之间的利益是相互牵制的和制约的。所有局中人的支付的一个有序集合称为博弈的一个支付组合(payo
17、ff profile。 Ui=Ui(s1,s2,si sn) 参与博弈的多个局中人的收益可用一个矩阵或框图表示,这种矩阵或框图叫做收益矩阵。,(5)博弈均衡(games equilibrium):是指所有局中人的最优策略组合。S*=(S1*,Si*, Sn*)其中, Si*是第i个参与人在均衡情况下的最优策略,它是i的所有可能的战略中使Ui或Eui最大化的战略。,(5)博弈均衡(games equilibrium):为了把一个特定的参与人与其他参与人相区别,用那么,说,博弈的类型,根据博弈者选择的策略,博弈论可划分为合作博弈与非合作博弈。纳什(Nash)、泽尔腾(Selten)和豪尔绍尼(Ha
18、rsanyi)(1994诺贝尔经济学奖获得者)的主要贡献在于非合作博弈方面,而且现在大多数经济学家论及博弈时,也主要是指非合作博弈。,合作博弈和非合作博弈的区别在于人们的行动为相互作用时,当事人能否达成一个具有约束力(binding agreement)的协议。若有,就是合作博弈;否则就是非合作博弈。 合作博弈强调的是团体理性、效率、公正和公平。非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的。,从局中人行动的先后顺序可划分为静态博弈(Static game)和动态博弈(dynamic game)。静态博弈是指在博弈中,局中人同时选择行动或虽非同时行动但后行动者
19、并不知道先行动者采取了什么具体行动。动态博弈是指局中人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。,从局中人是否具有有关其他参与人(对手)的特征、策略空间及支付函数方面的知识的角度,可划分为完全信息博弈(game of complete information)和不完全信息博弈(game of incomplete information)。,博弈的分类,零和博弈与非零和博弈(zero-sum game and non-zero-sum game),如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为零,这个博弈就叫零和博弈;相反,如果一个博弈在所有各种对局下全体参与人之
20、得益总和不总是保持为零,这个博弈就叫非零和博弈。零和博弈是利益对抗程度最高的博弈。,常和博弈与非常和博弈(constant-sum game and variable-sum game),如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为一个常数,这个博弈就叫常和博弈;相反,如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为一个常数,这个博弈就叫非常和博弈。常和博弈也是利益对抗程度最高的博弈。非常和(变和)博弈蕴含双赢或多赢。,博弈的表述方式:战略式与扩展式,战略式表述又称为标准式表述,在这种表述中,所有参与人同时选择各自的战略,所有参与人选择的战略一起决定每个参与人的支付。
21、,博弈的表述方式:策略式与扩展式,策略式:支付矩阵,扩展式:博弈树,A,博弈论进入主流经济学,反映了经济学发展的以下几个趋势:,第一,经济学研究的对象越来越转向个体,放弃了一些没有微观基础的假定,如消费函数及其投资函数、销售最大化等,一切从个人效用函数及其约束条件开始,解约束条件下的个人效用函数及其约束条件开始,解约束条件下的个人效用最大化问题而导出行为及均衡结果。,第二,经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响和作用,人们之间的利益冲突与一致,竞争与合作的研究。 第三, 经济学越来越重视对信息的研究,特别是信息不对称对个人选择及制度安排的影响。,完全信息静态博弈,一、
22、占优战略均衡二、重复剔除的占优战略均衡三、纳什均衡四、混合战略纳什均衡五、纳什均衡的存在性与多重性,完全信息静态博弈的几点特性,同时出招,出招一次; 知道博弈结构与游戏规则(共同知识); 不管是否沟通过,无法做出有约束力的 承诺(非合作),一、占优战略均衡,通常情况下,每个局中人的支付是博弈中所有参与人策略的函数,故每个局中人的最优策略选择依赖于所有其他参与人的策略选择。但在一些特殊博弈中,一个参与人的最优策略选择可能并不依赖于其他参与人的策略选择,即无论其他参与人选择什么策略,他的最优策略是唯一的,这种最优策略被称为“占优策略”(dominant strategy)。定义:在博弈G=N,(S
23、i)iN,(Ui)iN中,如果对所有的参与人i,si*是它的占优战略,那么所有参与人选择的战略组合(s1*,sn*)成为该对策的占优战略均衡。,例:“囚徒困境” 囚徒困境是博弈论中的经典案例。该故事讲的是,两个嫌疑犯作案后被警察抓住,分别被关在不同的房间里进行审讯。警察知道两人有罪,但缺乏有力的证据,除非两人之中有一个坦白。警察告诉每个人,他们的可选择的策略与支付如下表:,一、占优策略均衡,在该博弈中,每个囚徒有两种可能选择的策略:坦白和抵赖。显然,无论同伙选择什么策略,每个囚徒的最优策略都是“坦白”。如,B选择坦白,若A选择坦白时支付为-8,选择抵赖时支付为-10,因而坦白比抵赖好;若B选择
24、抵赖,A坦白时的支付为0,抵赖时为-1,因而坦白比抵赖好。即是说,“坦白”是A的占优策略。同样,“坦白”也是B的占优策略。,“囚犯困境” 的扩展,两个寡头企业选择产量公共产品的供给军备竞赛经济改革 结论:一种制度安排,要发生效力。必须是一种纳什均衡;否则,制度安排便不能成立。,价格大战,支付,百事可乐,可口可乐,二、重复剔除的占优战略均衡,在绝大多数博弈中,并不存在占优策略均衡。但在有些博弈中,仍可应用占优的逻辑找出均衡。 案例:“猪智博弈” 猪圈里有两头猪(大猪和小猪),猪圈一头有一猪食槽,另一头安装着一个按制猪食供应的按钮,按一下钮,有8个单位的猪食进槽,但需2个单位的成本。两头猪有两种策
25、略:按钮和等待。具体的博弈支付和结果如下表:,按按钮对对吃食量的影响,猪智博弈,依赖于小猪的策略:若小猪选“等待”,大猪的最优策略是“按”;若小猪选“按”,大猪的最优策略为“等待”。因此,不能用上述占优策略找出均衡。 可能的均衡是什么呢?若小猪是理性的,他只会选“等待”,因为“等待”严格优于“按”。假定大猪知道小猪是理性的,则会预测到小猪的选择;此时,大猪的最优选择只能是“按”。因此,(按,等待)是该博弈唯一的均衡。 找出上述均衡的思路是:先找出某个参与人的劣策略(假定存在),把它剔除,重新构造一个不包含已剔除策略的新博弈;然后再剔除新博弈中某个参与人的劣策略;直至剩下一个唯一的策略组合。该策
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 博弈论 ppt 课件
链接地址:https://www.31ppt.com/p-1356734.html