《经济博弈论》PPT课件.ppt
经济博弈论,1,主讲人:薛凤,博,局戏也。弈,围棋也。,Game Theory,第一章 导论,博弈论定义博弈论历史与发展经典博弈模型博弈结构与分类,3,故事导入,4,5,什么是博弈,*,博弈一词最早见于论语孟子阳货第十七篇,子曰:“饱食终日,无所用心,难矣哉!不有博弈者乎?为之,犹贤乎已。”朱熹论语集注:“博,局戏也。弈,围棋也。”,新华字典、现代汉语词典、辞源等对博弈的解释,除了指围棋外,也泛指赌博。,甘肃出土:六博木俑,绪论:什么的博弈,*,博弈论译自英文Game Theory。Game在英文中的含义有“游戏”则Game Theory就表示“游戏理论”,在这类游戏活动中,一旦身体条件、技术水平等因素既定以后,策略选择的好坏就是左右游戏结果的关键因素。特别引起人们兴趣的是参赛者之间在策略选择上具有相互依存性,游戏的结果不仅取决于自身的策略选择,还取决于其他参赛者的策略选择。每位参赛者在做出自己的选择时必须充分考虑其他参赛者的选择。,Game Theory正是研究这类具有相互依存性的策略选择问题的理论。,游戏的共同特征:,*,1.都有一定的规则2.都有一个结果3.策略至关重要4.策略和利益相互依存,例如:,1.1.2 一个非技术性定义,博弈:就是一些个人、队组或其他组织,面对一定的环 境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。包含四个方面博弈的参加者(Player)博弈方各博弈方各自可选择的全部策略(Strategies)或行为(Actions)进行博弈的次序(Order)博弈方的得益(Payoffs),*,博弈论的应用范围:,博弈论,政治,经济,法律,军事,外交,经济,1994年诺贝尔经济学奖 德国柏林大学莱因哈德赛尔腾因在非合作博弈的均衡分析理论方面做出了开创性贡献、对博弈论和经济学产生了重大影响获奖。美国普林斯顿大学数学系教授约翰纳什,因提出在非合作博弈理论中起着核心作用的纳什均衡概念获奖。,2005年诺贝尔经济学奖 以美双重国籍经济学家罗伯特奥曼和美国经济学家托马斯谢林因在博弈论分析方面的研究获奖。,2007年诺贝尔经济学奖 三位美国经济学家里奥尼德赫维茨、埃里克马斯金、罗杰迈尔森以创立和发展机制设计理论方面的贡献获得诺贝尔经济学奖。,*,博弈论,博弈论可以作为社会科学的一种一般分析方法,同时也是分析和说明我们日常生活中遇到的问题的学问。,美国史密斯学院经济学助理教授詹姆斯米勒在其著作中写到:“不理解博弈论的人,在与掌握博弈论的人相处时,很容易就在战术上失去优势。”,当代经济学全才保罗萨缪尔森也说过:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解。”,博弈论不仅影响着社会科学的研究和发展,更重要的是它正改变着人们的思维习惯。,*,博弈论,博弈论的学习目的:,初步认识博弈论的基本思想和典型问题,建立策略思维的意识,了解策略思维的方法。,更重要的是不但要知道博弈论说了些什么,而且要学习运用博弈论的思想和方法分析现实生活中遇到的各种问题,把它当成分析和描述自己身边事情的有效方法,提高观察问题、分析问题、解决问题的能力。,无论你学到了多少博弈论的概念和方法,当你真正面临一个具体问题时,都不能生搬硬套。解决问题的关键是开动自己的大脑,冷静地将各种理论、方法和具体情况综合起来思考,找出尽可能好的解决办法。,如何学习博弈论,*,博弈论研究什么从我们身边说起,研究具有相互依存性的策略选择问题,为何学习博弈论遵从社会活动规律,建立策略思维的意识了解策略思维的方法,如何学习博弈论问题导向归纳提炼联系实际,通过典型问题理解基本方法,1.2 几个经典博弈模型,1.2.1 囚徒困境(利益是什么?理性问题等。进化问题等),甲、乙一起携枪准备作案,被警察发现抓了起来,分别审讯,如果两人都不坦白,各判1年1人坦白则免予起诉,另1人重判8年2人都坦白,则各判5年假设甲、乙都是理性的,甲、乙坦白还是不坦白?,1.2 几个经典博弈模型,1.2.1 囚徒困境(利益是什么?理性问题等。进化问题等),-5,-5,0,-8,-8,0,-1,-1,坦 白,不坦白,坦 白,不坦白,两个罪犯的得益矩阵,囚徒 2,囚徒1,一、基本模型,囚徒1:坦白囚徒2:坦白,囚徒困境,博弈论,囚徒甲和囚徒乙是参与博弈的两方,称为博弈方(局中人)。,甲和乙都各有两个选择,称为行动或者策略。如果甲选择了抵赖、乙选择了供认,称为一个对局或者策略组合,记为(抵赖,坦白)。,一个对局下博弈方的所得,即博弈的结果,称为收益或者支付,放在一起称为得益矩阵。左下方为甲的收益,右上方为乙的收益。对局(抵赖,坦白)的结果记为(8,1)。,*,囚徒困境,博弈论,供认是甲的上策,供认也是乙的上策,(供认,供认)是一个上策均衡,双方的得益为(5,5)。,博弈论中假设博弈方都是理性人,就是局中人在博弈中总是以自身利益最大化为决策的原则。,相对来说,抵赖称为甲的下策,抵赖也是乙的下策。下策不应该使用,删除后只剩下(供认,供认)一个策略组合,即为均衡策略组合。,*,囚徒困境,博弈论,可以将供认看成背叛同伙的策略;抵赖是与同伙合作的策略。,由于双方无法串供,也无法相信对方一定会与自己合作,所以只能从自身利益最大化来选择,即选择背叛的策略。,*,价格竞争,博弈论,经济学中将市场分为四类:完全竞争、垄断竞争、寡头垄断和完全垄断。完全垄断指市场中只有一个卖家;完全竞争指市场中有充分多个卖家和买家,任何人都不能单独影响市场价格,是理想的市场状态。在这两种市场中人们都不必担心策略的相互作用。因为完全垄断情况下只有一个卖方,没有竞争者;而在完全竞争情况下,一家公司不可能跟踪极其多的竞争者的所有行动。在现实中最多见的市场情况是寡头垄断和垄断竞争。,其中寡头垄断往往出现在生产高度集中的行业。如钢铁、石油、汽车、飞机、家电等。寡头厂商为保持自身地位会采取种种排他措施,产生博弈问题。,当市场上只有几家公司时,局中人必须考虑自己的行动对竞争对手可能产生的影响。同时也要分析竞争者可能做的事情。否则,危险便会接踵而至。而博弈论正是擅长分析这一类问题的方法。,*,二、双寡头削价竞争,政府组织协调的必要性和重要性,寡头1:低价(70)寡头2:低价(70),囚徒困境的理解,显然,不论是从两个囚徒整体来看,还是从他们各自来看,两人都供认的结局都不如两人都抵赖的结局。由于这种结局具有必然性,虽然不理想但又很难摆脱,所以称为囚徒困境。囚徒困境模型同时揭示了两个矛盾:一个是个体理性与团体理性之间的矛盾,从个体利益最大化出发的行为往往不能实现团体的最大利益;另一个是个体理性本身的内在矛盾,即使从个体利益最大化出发的行为最终也不一定能真正实现个体的最大利益,甚至会得到相当差的结果。,*,囚徒困境的理解,博弈论,囚徒困境是很多社会现象的简单抽象,可以说是理性的人类社会活动最形象的比喻。它准确地描述了人类社会中所存在的互相之间不信任和相互防范的一面。在无法改变他人选择的情况下,背叛常常是使自己避免风险的最好选择。上述结论是在理性人假设之下得到的。理性人可以理解为广义上的利己之人。人是生而利己的,利他是后天习得的,其实也是一种利己的扩大化。利己而不损人,利人而不损己。损人利己,长不了,好不了;损己利人,多不了,也长不了。利己心是推动社会发展的原动力。,*,1.2.2 赌胜博弈,一、田忌赛马,赌胜博弈的理解,博弈论,1.本博弈中,各博弈方千万不能让对方知道或者猜中自己的策略。也就是说任何一方的策略必须以随机的方式选择而不能有规律。2.对双方而言,6种决策本身相互之间没有优劣之分。3.这种博弈如果只进行一次,双方的策略选择和最终的博弈结果是无法确定的。如果进行多次,则此得益矩阵会告诉我们多次博弈后的平均结果(第二章具体讲),*,二、猜硬币博弈,取胜关键:双方利益严格对立,不能让另一方猜到自己的策略。尽可能猜出对方策略,三、石头、剪子、布,0,0,1,-1,-1,1,-1,1,1,-1,0,0,1,-1,-1,1,0,0,石 头,剪 子,布,博弈方2,石 头,剪 子,布,博弈方1,1.2.3 产量决策的古诺模型,一、三厂商离散产量,产量决策的古诺模型:是一个典型的经济博弈模型,即寡头之间通过产量进行竞争的模型,市场出清价格:一个市场的容量是有限的,若能够将商品全部销售出去的价格,假设各厂商的生产是无成本,并且同时决策自己的产量。则先排除三厂商不可能选择的范围(不可能超过20,否则降价处理,也不可能超过10.)我们用比较和试探方法来确定本博弈的均衡产量,例(4,8,6),该博弈的均衡结果应该是各厂商各生产5个单位的产量,市场价格为5,三厂商的利润都为25.即使开始没有选择这个产量组合,长期也一定会调整到这个组合,二、n个厂商连续产量,假设有n个博弈方,假设产量是连续可分的,则即使将超过厂商生产能力的产量去掉以后,每个厂商都有无限多种可供选择的产量。也就是活各博弈方的选择策略是无穷大,意味着不能用矩阵列出来。,可以看出:厂商的利益既与自身的产量有关,还与其他厂商的产量有关。,1.3 博弈结构和博弈分类,1.3.1 博弈中的博弈方博弈方:独立决策、独立承担博一结果的个人或组织一、单人博弈(最优化策略):只有一个博弈方的博弈例一:单人迷宫,1.两个圆圈称为“选择节点”或“节点”也称作“信息集”A,B表示两节点博弈方选择的地点。数字1表示唯一的博弈方。引出的两条线表示该点可供选择的策略。三个黑点表示终点。括号中的数字表示得益。,博弈的扩展形表示法有直观明了的好处,与得益矩阵相比,能反映出博弈过程中的选择,行为的先后次序。特别适合“动态博弈”,例二:运输路线,单人博弈实质个体最优化问题,二、两人博弈(囚徒困境,猜硬币,田忌赛马)两个博弈方的利益方向可能一致掌握信息多的博弈方并不一定保证利益也较多个人追求最大自身利益的行为,常常并不能导致实现社会的最大利益,也常常不能真正实现个人自身的最大利益三、多人博弈可能存在破坏者:其策略选择对自身的利益并没有影响,但却会对其他博弈方的利益产生很大的,有时甚至是决定性的影响(P25,2)多人博弈的表示问题:得益矩阵、扩展形、描述、函数等,1.3.2 博弈中的策略,策略:博弈中各博弈方的选择内容。(定性定量、简单复杂、对称不对称。存在理解和建模选择)不同博弈方之间不仅可选策略不同,而且可选策略数量也可不同例:A和B洽谈某处产业收益,A为买方,B卖房,A有“高中低”三种选择,B只有“接受,拒绝”两种策略。有限博弈:每个博弈方的策略数都是有限的。可用得益矩阵,扩展形或简单罗列方法表示。无限博弈:至少有某些博弈方的策略有无限多个。可用数集或者函数表示,1.3.3 博弈中的得益,得益:各博弈方从博弈中所获得的利益。也是各博弈方追求的根本目标及行为和判断的主要依据。得益有正有负零和博弈:所有博弈方博弈的总和为0。也称为“严格竞争博弈”。博弈方之间利益始终是对立的,偏好通常不同 猜硬币,田忌赛马,石头-剪刀-布常和博弈:博弈方之间利益的总和为常数。博弈方之间的利益是对立的且是竞争关系 分配固定数额的奖金、利润,遗产官司变和博弈:零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率问题的重要性。囚徒困境、产量博弈、制式问题等,1.3.4 博弈的过程,静态博弈:所有博弈方同时或可看作同时选择策略的博弈 田忌赛马,猜硬币,古诺模型,投标活动动态博弈:各博弈方的选择和行动又先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动 弈棋、市场进入、领导追随型市场结构等重复博弈:同一个博弈反复进行所构成的博弈,提供了实现更有效略博弈结果的新可能 长期客户、长期合同、信誉问题a.有限次重复博弈:重复一定次数后肯定会结束的博弈b.无限次重复博弈:似乎或者近似认为无限次不断重复的博弈,1.3.5 博弈的信息结构,完全信息博弈:各博弈方都完全了解所有博弈方各种情况下的得益(囚徒困境,田忌赛马,猜硬币)不完全信息博弈:至少部分博弈方不完全了解其他博弈方得益的情况的博弈,也称为“不对称信息博弈”(投标,拍卖)完美信息博弈:每个轮到行为的博弈方对博弈的进程完全了解的博弈(弈棋)不完美信息博弈:至少某些博弈方在轮到行动时不完全了解此前全部博弈的进程的博弈,1.3.6 博弈方的能力和理性,完全理性和有限理性完全理性:有完美的分析判断能力和不会犯选择行为的错误有限理性:博弈方的判断选择能力有缺陷区别:如果一方是有限理性,则他们的策略行动和博弈结果通常与完全理性假设基础上的预测有很大差别,一般介绍博弈论的基本思想,原理和模型的时候按照完全理性,然后对博弈方的理性能力局限做一些讨论。,个体理性和集体理性个体理性:以个体利益最大为目标集体理性:追求集体利益最大化一般我们讨论问题时,以个体理性为重,除非特别说明。合作博弈:允许存在有约束力协议的博弈非合作博弈:不允许存在有约束力协议的博弈大部分情况下的博弈都是非合作博弈,我们更重视非合作博弈。这是因为:1.主导人们行为方式的主要是个体理性,而不是集体理性。2,集体理性是更高级更复杂的理性,研究的难度比较大。,1.3.7 博弈的分类和博弈理论的结构,非合作博弈和合作博弈非合作博弈范围内:完全理性博弈和有限理性博弈静态博弈,动态博弈,重复博弈完全信息静态博弈和不完全信息静态博弈,完全且完美信息动态博弈,完全但不完美信息动态博弈,不完全信息动态博弈零和博弈和非零和博弈,单人博弈和多人博弈,小结:,、按参与人的多少分:单人博弈和多人博弈、按策略空间是否有限分:有限策略博弈和无限策略博弈,、按各策略组合下参与人支付之和情况分:零和博弈、常和博弈和变和博弈,、按参与人行动的顺序分:静态博弈和动态博弈,、按信息是否完全分:完全信息博弈和不完全信息博弈,、按信息是否完美分(动态博弈):完美信息动态博弈和不完美信息动态博弈,1.4 博弈论历史和发展简述,博弈论历史没有公认答案对具有策略依存特点决策问题的研究可上溯到18世纪初甚至更早博弈论真正的发展在本世纪博弈论总体上仍然是发展中的学科,博弈论的早期研究,2000年前我国古代的“齐威王田忌赛马”1500年前巴比伦犹太教法典“婚姻合同问题”等。1838年古诺寡头模型。1883年伯特兰德寡头竞争模型。1913年齐默罗象棋博弈定理、“逆推归纳法”1921-1927年波雷尔混合策略的第一个现代表述,有数种策略两人博弈的极小化极大解 1928年诺伊曼和摩根斯坦扩展形博弈定义,证明有限策略两人零和博弈有确定结果,冯.诺伊曼和摩根斯坦1944博弈论和经济行为Theory of Games and Economic Behavior,引进扩展形(extensive form)表示和正规形(normal form)或称策略形(strategy form)、矩阵形(matrix form)表示提出稳定集(stable sets)解概念正式提出创造博弈论一般理论的主意给出博弈论研究的一般框架、概念术语和表述方法,博弈论第一个研究高潮,本世纪40年代末和50年代初,1950年纳什提出“纳什均衡”(Nash equilibrium)概念和证明纳什定理,发展非合作博弈的基础理论。1950年Melvin Dresher和Merrill Flood在兰德公司(美国空军)“囚徒的困境”(Prisons dilemma)博弈实验,(Howard Raiffa)独立进行这个博弈实验;1952-1953年期间(L.S.Shapley)和(D.B.Gillies)提出“核”(Core)作为合作博弈的一般解概念Shapley提出了合作博弈的“Shapley值”(Shapley value)概念等。奥曼(R.J.Aumann)“40年代末50年代初是博弈论历史上令人振奋的时期,原理已经破茧而出,正在试飞它们的双翅,活跃着一批巨人。”,50年代中后期一直到70年代博弈论发展的青年期,1954-1955年提出了“微分博弈”(Differential games)的概念。奥曼则在1959年提出了“强均衡”(Strong equilibrium)的概念。“重复博弈”(Repeated games)也是在50年代末开始研究的,这自然引出了关于重复博弈的“民间定理”(Folk theorem)。1960年(Thomas C.Schelling)引进了“焦点”(Focal point)的概念。博弈论在进化生物学(Evolutionary Biology)中的公开应用也是在60年代初出现的。,塞尔腾(Selten)1965提出“子博弈完美纳什均衡”(subgame perfect Nash equilibrium)1975年提出的“颤抖手均衡”(Trembling hand perfect equilibrium)概念。海萨尼(Harsanyi)1967-1968的三篇后来成为在现代经济学和博弈论中占极其重要地位的信息经济学奠基石的,构造不完全信息(incomplete inforrmation)博弈理论的系列论文,提出分析不完全信息博弈问题的标准方法,以及“贝叶斯纳什均衡”(Bayesian Nash equilibrium)的概念。海萨尼1973年提出关于“混合策略”的不完全信息解释,以及“严格纳什均衡”(Strict Nash equilibrium)概念。70年代“进化博弈论”(Evolutionary game theory)的重要发展,主要有(John Maynard Smith)1972年引进了“进化稳定策略”(Evolutionarily stable strategy,ESS)概念等。“共同知识”(Common knowledge)在博弈论中的重要性,也因为奥曼1976年的文章而引起了广泛的重视。,40年代末到70年代末是博弈论发展的重要阶段,这个时期博弈理论仍然没有成熟,理论体系还比较乱,概念和分析方法很不统一,在经济学中的作用和影响还比较有限,但这个时期博弈论研究的繁荣和进展却是非常显著的。对这一阶段博弈论研究的迅速发展,除了理论发展自身规律的作用以外,全球政治、军事、经济特定环境条件的影响(战争和冷战时期的军事对抗和威慑策略研究的需要,经济竞争、国际经济竞争的加剧),以及经济学理论发展本身的需要等,都起了重要的作用。正是因为有了这一阶段博弈论研究的繁荣发展,才有80、90年代博弈论的成熟和对经济学的博弈论革命。,80、90年代是博弈论走向成熟的时期,1981(Elon Kohlberg)“顺推归纳法”(Forward induction)克瑞泼斯(David M.kreps)和威尔孙(Robert Wilson)1982年提出“序列均衡”(Sequential equilibria)1982年斯密(John Maynard Smith)出版了进化和博弈论()1984年由伯恩海姆(B.D.Bernheim)和皮尔斯(D.G.Pearce)提出“可理性化性”(Rationalizability)海萨尼和塞尔腾1988年提出了在非合作和合作博弈中均衡选择的一般理论和标准,1991年弗得伯格(D.Fudenberg)和泰勒尔(J.Tirole)首先提出了“完美贝叶斯均衡”(Perfext Bayesian equilibrium)的概念,博弈论和经济学诺贝尔奖,1994:纳什、海萨尼(J.Harsanyi)、塞尔顿(R.Selten)1996:莫里斯(James A.Mirrlees)和维克瑞(william Vickrey)2001:Akerlof,Spence,stiglitze2002:实验经济学、心理经济学,