《微观经济学第十章博弈论初步.ppt》由会员分享,可在线阅读,更多相关《微观经济学第十章博弈论初步.ppt(18页珍藏版)》请在三一办公上搜索。
1、第10章博弈论初步10.1本章框架结构图博弈论在20世纪50年代由数学家约翰冯诺依曼(Von Neumann)和经济学家奥斯卡摩根斯坦(Morgenstern)引入经济学,目前已经成为主流经济分析的主要工具,对寡头理论、信息经济学等经济理论的发展作出了重要贡献。,一、博弈论的几个基本概念博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。在策略性环境中,每一个人进行的决策和采取的行动都会对其他人产生影响。因此,每个人在进行策略性决策和采取策略性行动时,要根据其他人的可能反应来决定自己的决策和行动。1博弈参与人参与人或称局中人,是指博弈中的决策主体,即在博弈中进行决策的个体。参与
2、人既可以是个人,也可以是团体(企业或国家)。每个参与人的目标是通过选择行动使自己的效用最大化。2策略策略是指参与人选择行为的规则,也就是指参与人应该在什么条件下选择什么样的行动,以保证自身利益最大化。3支付函数支付函数也称为效用函数,表明了博弈的参与人采取的每种策略组合的结果或收益,它是所有参与人策略或行动的函数,是每个参与人真正关心的东西。4支付矩阵参与博弈的多个参与人的收益可以用一个矩阵或框图表示,这样的矩阵或框图称之为支付矩阵,也称之为博弈矩阵或收益矩阵。其中,博弈参与人、参与人的策略和参与人的支付构成了博弈须具有的三个基本要素。表10-1即为一个支付矩阵。表10-1支付矩阵,二、同时博
3、弈:纯策略均衡“同时博弈”是参与人同时进行决策或行动的博弈。在同时博弈中,在给定其他参与人的策略时,某个参与人的最优策略称之为该参与人的条件优势策略(简称条件策略),而包括该参与人的条件策略以及这些条件在内的所有参与人的策略组合称之为该参与人的条件优势策略组合(简称条件策略组合)。1占优策略在一些特殊的博弈中,一个参与人的最优策略可能并不依赖于其他人的选择。也就是说,无论其他参与人采取什么策略,该参与人的最优策略是惟一的,这样的策略称之为占优策略。如表10-2所示,通过对支付矩阵的分析可以看出,如果A、B两厂商都是理性的,则这个博弈的结果是两厂商都做广告,即不管一个厂商如何决定,另外一个厂商都
4、会选择做广告。这种策略均衡称之为占优策略均衡(equilibrium in dominant strategies)。表10-2广告博弈的支付矩阵,2纳什均衡并不是每个博弈的各个参与人都有一个占优策略。如表10-3所示,通过对支付矩阵的分析可以看出,现在厂商A没有占优策略,它的最优决策取决于厂商B的选择。如果厂商B做广告,则厂商A最好也做广告;但如果厂商B不做广告,厂商A不做广告又是最好的选择。这种均衡就是纳什均衡(Nash equilibrium)。所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。即如果在一个策略组合中,当所有其他人都不改变
5、策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。表10-3广告博弈的支付矩阵,3纳什均衡与占优策略均衡的区别每一个占优策略均衡一定是纳什均衡,但并非每一个纳什均衡都是占优策略均衡。纳什均衡是有条件的占优策略均衡。一个博弈可能存在一个以上的纳什均衡,但是一个博弈也可能不存在纯策略纳什均衡,如表10-4所示。表10-4没有纳什均衡的同时博弈【例10.1】下列说法错误的是()。A占优策略均衡一定是纳什均衡B纳什均衡不一定是占优策略均衡C占优策略均衡中,每个参与者都是在针对其他参与者的某个特定策略而做出最优反应D纳什均衡中,每个参与者都是在针对其他参与者的最优反应策略而做出最优反应【答案
6、】C【解析】占优策略均衡中,不论其他参与者采取何种策略,每个参与者都会选择其自身的最优策略。,4寻找纳什均衡的方法条件策略下划线法对于一个简单的“二人同时博弈”,可以用一个以二元数组为元素的支付矩阵来表示,并用“条件策略下划线法”来确定它的纳什均衡。具体步骤如下:(1)把整个博弈的支付矩阵分解为两个参与人的支付矩阵。(2)在第一个(即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大者,并在其下画线。(3)在第二个(即位于整个博弈矩阵上方的)参与人的支付矩阵中,找出每一行的最大者,并在其下画线。(4)将已经画好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个博弈的支付矩阵。(
7、5)在带有下划线的整个的支付矩阵中,找到两个数字之下均画有线的支付组合。由该支付组合代表的策略组合就是博弈的纳什均衡。表10-5寡头博弈:合作与不合作,【例10.2】考虑两寡头厂商A和B的如下支付矩阵,二者的(纳什)均衡策略组合为()。A(U,L)B(D,R)C(U,R)D(D,L)【答案】B【解析】在一个纳什均衡里,任何一个参与者都不会改变自己的最优策略如果其他参与者均不改变各自的最优策略,即要求任何一个参与者在其他参与者的最优策略选择给定的条件下,其选择的策略也是最优的。对于本题,当B选择U时,A会选择R,因为;当B选择D时,A会选择R,因为。当A选择L时,B会选择U,因为;当A选择R时,
8、B会选择D,因为。因此,依据纳什均衡定义,可知 是纳什均衡。,5囚徒困境囚徒困境的博弈模型的假设条件是:甲、乙两个被怀疑为合谋偷窃的嫌疑犯被警方抓获,但警方对他们偷窃的证据并不充分。他们每一个人都被单独囚禁,并单独进行审讯,即双方无法互通信息。警方向这两个嫌疑犯交待的量刑原则是:如果一方坦白,另一方不坦白,则坦白者从宽处理,判刑1年;不坦白者从重处理,判刑7年。如果两人都坦白,则每人都各判刑5年。如果两个都不坦白,则警方由于证据不足,只能对每个人各判刑2年。表10-6的支付矩阵描述了这一博弈。表中的报酬均为负数,以表示判刑的年数。表10-6囚徒困境通过分析可以看出,囚徒困境的博弈有一个占优策略
9、均衡(坦白、坦白)。但是,如果两人都是选择不坦白(即合作),则都可以获得最好的结局。很清楚,囚徒困境的占优策略均衡反映了一个矛盾:即个人理性和团体理性的冲突。,三、同时博弈:混合策略均衡并不是所有的博弈都存在纳什均衡。比如,如表10-7所示。这博弈就不存在纯策略纳什均衡,但却存在混合策略纳什均衡。混合策略纳什均衡是这样一种均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都为自己确定了选择每一种策略的最优概率。表10-7社会福利博弈所有参与人的混合策略的组合构成“混合策略组合”。混合策略组合与参与人的支付的乘积之和为参与人的期望支付。当其他参与人的混合策略确定之后,某个参与人选择的可
10、以使自己的期望支付达到最大的混合策略是该参与人的条件混合策略(其几何表示为“条件混合策略曲线”)。不同参与人的条件混合策略曲线的“交点”就是混合策略条件下的纳什均衡。可以证明,混合策略均衡总是存在的。,【例10.3】在一条狭窄巷子里,两个年青人骑着自行车相向而行。每人都有两个策略,即或者选择“冲过去”或者选择“避让”。如果选择“避让”,不管对方采取什么策略,他得到的收益都是0。如果其中一个人采取“冲过去”的策略,如果对方采取“避让”,那么他得到的收益是9;如果对方不避让,那么他得到的收益是-36。这个博弈有两个纯策略纳什均衡和()。A一个混合策略纳什均衡,即两人都以80%概率选择“避让”,以2
11、0%的概率选择“冲过去”B两个混合策略纳什均衡,即每个青年人轮流采取避让或者冲过去C一个混合策略纳什均衡,即一人以80的概率选择“避让”,另一人以20的概率选择“冲过去”D一个混合策略纳什均衡,即两人都以40的概率选择“避让”,以60的概率选择“冲过去”【答案】A【解析】根据题中条件可写出两人的收益矩阵,如表10-8所示。表10-8两人的收益矩阵从收益矩阵可看出,这个博弈有两个纯策略纳什均衡(冲过去,避让),(避让,冲过去)。设甲选择冲过去的概率为,乙选择冲过去的概率为。对于甲来说,应该使冲过去的期望收益等于避让的期望收益,即,解得;对于乙来说,也应该使其冲过去的期望收益等于避让的期望收益,即
12、,解得。所以,存在一个混合策略纳什均衡。,四、序贯博弈“序贯博弈”是参与人的决策和行动有先有后的博弈。描述序贯博弈的更加方便也更加自然的工具是“博弈树”。博弈树由“点”(包括“起点”、“中间点”、“终点”)、连接点的“线段”以及标在这些点和线段旁边的文字和数字组成。在博弈树中,一个纳什均衡代表一条均衡的路径。在该均衡路径上,没有哪个参与人愿意单独改变自己的策略。图10-1博弈树在序贯博弈中,可能存在多个纳什均衡的情况。在多个纳什均衡中,有些可能并不合理。所谓对纳什均衡的“精炼”,就是要从众多的纳什均衡中进一步确定“更好”的纳什均衡。纳什均衡的精炼方法通常是使用所谓的“逆向归纳法”,具体包括以下
13、两个步骤:第一步,先从博弈的最后阶段的每一个决策点开始,确定相应参与人此时所选择的策略,并把参与人所放弃的其他策略删除,从而得到原博弈的一个简化博弈。第二步,再对简化博弈重复步骤一的程序,直到最后,得到原博弈的一个最简博弈。这个最简博弈,就是原博弈的解;而在存在多重纳什均衡时,它就是对纳什均衡的精炼。,【例10.4】在下面的博弈树中,确定纳什均衡和逆向归纳策略。答:纳什均衡是(决策1,决策3)、逆向归纳策略也是(决策1,决策3)。分析如下:(1)(决策1,决策3)是一个纳什均衡。在该策略组合上,没有哪个参与人愿意单独改变自己的策略。首先,参与人B不会单独改变自己的策略。如果它单独改变策略,即将
14、原来的决策3变为决策4,参与人B的支付将从原来的3下降到0。其次,参与人A也不会单独改变自己的策略。如果它单独改变策略,即将原来的决策1变为决策2,则策略组合就成为(决策2,决策3),参与人A的支付将从原来的1下降到0。(2)采用逆向归纳法,可以判断出逆向归纳策略也是(决策1,决策3)。首先,如果参与人A选择决策1,参与人B肯定不会选择决策4。另一方面,如果参与人A选择决策2,参与人B肯定不会选择决策4。在此情况下,考察参与人A的选择。由博弈树可以看出,参与人A的最优选择是决策1。最终结果是,参与人A选择决策1,参与人B选择决策3,即最优策略组合为(决策1,决策3)。,10.3名校考研真题详解
15、一、名词解释1纳什均衡(Nash equilibrium)浙江大学2005研;厦门大学2006、2008研;中南财经政法大学2007、2009研;财政部财政科学研究所2008研;西安交通大学2009研答:纳什均衡(Nash Equilibrium)又称为非合作均衡,是博弈论的一个重要术语,以提出者约翰纳什的名字命名。纳什均衡是指这样一种策略集,在这一策略集中,每一个博弈者都确信,在给定竞争对手策略决定的情况下,他选择了最好的策略。纳什均衡是由所有参与人的最优战略所组成的一个战略组合,也就是说,给定其他人的战略,任何个人都没有积极性去选择其他战略,从而这个均衡没有人有积极性去打破。与其相联系的一
16、个概念是占优策略均衡。占优策略均衡指这样一种均衡,不管其对手采取什么策略,该竞争者采取的策略都是最优策略。纳什均衡指每一个竞赛者都确信,在给定竞争对手策略决定的情况下,他选择了最好的策略。占优均衡是一种纳什均衡。占优均衡若存在,只存在惟一均衡,而纳什均衡可能存在多重解。2混合策略北京交通大学2004研;东北大学2007研;华中科技大学2008研答:混合策略是指在博弈中,博弈方的决策内容不是确定性的具体的策略,而是在一些策略中随机选择的概率分别的策略。混合策略情况下的决策原则有以下两个:(1)博弈参与者互相不让对方知道或猜到自己的选择,因而必须在决策时利用随机性来选择策略,避免任何有规律性的选择
17、。(2)博弈参与者选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过有针对性倾向的某一种策略而在博弈中占上风。,二、简答题1说明纳什均衡与纳什定理的基本概念。南开大学2005研答:(1)纳什均衡是指这样一种策略集,在这一策略集中,任何一个博弈者在其他参与者的策略给定的条件下,其选择的策略是最优的。所以,给定其他人的策略,任何个人都没有积极性去选择其他策略,从而这个均衡没有人有积极性去打破。(2)纳什定理的含义是:对于任何一个 个人参与的非合作博弈(零和或非零和博弈),如果每个参与者都只有有限策略,那么一定存在至少一个纳什均衡解。,2表10-9为两竞争对手的博弈结果矩阵:表10-9两竞
18、争对手的博弈结果矩阵请问:什么是纳什均衡?求出该博弈的所有可能的纳什均衡,利用图形说明求出的纳什均衡的意义。中山大学2010研答:纳什均衡又称为非合作博弈均衡,指如果其他参与人不改变自己的策略,任何一个参与人都不会改变自己策略的均衡状态。即如果给定参与人B的选择,参与人A的选择是最优的,并且给定参与人A的选择,参与人B的选择也是最优的。那么,这样一组策略就是一个纳什均衡,即给定其他人的选择,每个参与人都作出了最优的选择。从表10-10该博弈结果矩阵可知存在两个可能的纳什均衡:两竞争对手均奋争,两竞争对手均妥协。不论A、B均奋争还是均妥协,总的博弈效果是产生了3个效用,与一方奋争另一方妥协效用大
19、。表10-10博弈状态及其效用值从表10-10可以看出,两竞争对手均奋争和两竞争对手均妥协都是纳什均衡解,并且带来的总效用一样。,三、计算题1甲、乙两个学生决定是否打扫宿舍。无论对方是否参与,每个参与人的打扫成本都是8;而每个人从打扫中的获益则是5乘以参与人数。(1)请用一个博弈简单描述上述情景。(2)找出该博弈的所有纳什均衡。中山大学2010研解:(1)共有以下四种情况:当甲乙都参与时,每个人的收益均为。当甲参与乙不参与时,甲收益为,乙收益为。当甲不参与乙参与时,甲收益为,乙收益为。当甲乙都不参与时,每个人的收益均为0。具体博弈矩阵如表10-11所示:表10-11博弈的收益矩阵(2)从表10
20、-11中可以看出,该博弈的纳什均衡是甲不参与乙也不参与,这一均衡解也是占优策略均衡。从参与人甲的角度看,不论参与人乙参与不参与打扫宿舍,不参与打扫宿舍都是参与人甲的较好的选择。同样的情形,从参与人乙的角度看,不参与打扫宿舍也是参与人乙的较好的选择。所以,这是一个占优策略均衡,即双方都没有动力去改变这一局面,最后谁都不去打扫宿舍。可以看出,如果甲乙两人都参与打扫宿舍,则他们的境况就要比在其他选择下更好一些。(参与,参与)是帕累托有效率的策略组合,而(不参与,不参与)则是帕累托低效率的策略组合。双方从自己的理性出发的最优策略,从社会看来是最糟糕的策略。,2假定一寡头市场有A、B两个厂商计划推出新产
21、品,有两种产品可供选择:一为高品质产品H,另一为低品质产品L,如果这两个厂商采取的策略与其利润的关系为:式中每格前一数字为A利润,第二数字为B利润。(1)若这两个厂商同时决定新产品,它们利润会是多少?(2)若A先推出新产品,然后B推出新产品,它们的利润各为多少?若B先推出呢?上海交通大学2007研解:(1)若这两个厂商同时推出新产品,则A推出L时,B必选H,但B选H时,A不会选L而要选H。因此,(L,H)不是均衡。如果A选H时,B必须H,因为如选L,利润只有10,因此,(H,H)会是一个纳什均衡。当A、B两个厂商都选择高品质产品H时,这两个厂商都将获得的利润为20。,(2)若A先推出新产品,然后B再推出新产品,则会形成一个动态博弈。此博弈序列将呈现如图10-2的博弈树形状。图10-2动态博弈从图10-2可见,A先推出新产品的话,肯定选择高品质产品H,于是B只能选择高品质产品H。可见,这时A的利润是20,B的利润也是20。若B先推出新产品,然后A再推出新产品,则此博弈序列将呈现如图10-3的博弈树形状。图10-3动态博弈从图10-3可见,B先推出新产品的话,肯定选择高品质产品H,于是A只能选择高品质产品H。可见,这时A的利润是20,B的利润也是20。,
链接地址:https://www.31ppt.com/p-5976007.html