微观经济学第十章博弈论初步.ppt
《微观经济学第十章博弈论初步.ppt》由会员分享,可在线阅读,更多相关《微观经济学第十章博弈论初步.ppt(18页珍藏版)》请在三一办公上搜索。
1、第10章博弈论初步10.1本章框架结构图博弈论在20世纪50年代由数学家约翰冯诺依曼(Von Neumann)和经济学家奥斯卡摩根斯坦(Morgenstern)引入经济学,目前已经成为主流经济分析的主要工具,对寡头理论、信息经济学等经济理论的发展作出了重要贡献。,一、博弈论的几个基本概念博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。在策略性环境中,每一个人进行的决策和采取的行动都会对其他人产生影响。因此,每个人在进行策略性决策和采取策略性行动时,要根据其他人的可能反应来决定自己的决策和行动。1博弈参与人参与人或称局中人,是指博弈中的决策主体,即在博弈中进行决策的个体。参与
2、人既可以是个人,也可以是团体(企业或国家)。每个参与人的目标是通过选择行动使自己的效用最大化。2策略策略是指参与人选择行为的规则,也就是指参与人应该在什么条件下选择什么样的行动,以保证自身利益最大化。3支付函数支付函数也称为效用函数,表明了博弈的参与人采取的每种策略组合的结果或收益,它是所有参与人策略或行动的函数,是每个参与人真正关心的东西。4支付矩阵参与博弈的多个参与人的收益可以用一个矩阵或框图表示,这样的矩阵或框图称之为支付矩阵,也称之为博弈矩阵或收益矩阵。其中,博弈参与人、参与人的策略和参与人的支付构成了博弈须具有的三个基本要素。表10-1即为一个支付矩阵。表10-1支付矩阵,二、同时博
3、弈:纯策略均衡“同时博弈”是参与人同时进行决策或行动的博弈。在同时博弈中,在给定其他参与人的策略时,某个参与人的最优策略称之为该参与人的条件优势策略(简称条件策略),而包括该参与人的条件策略以及这些条件在内的所有参与人的策略组合称之为该参与人的条件优势策略组合(简称条件策略组合)。1占优策略在一些特殊的博弈中,一个参与人的最优策略可能并不依赖于其他人的选择。也就是说,无论其他参与人采取什么策略,该参与人的最优策略是惟一的,这样的策略称之为占优策略。如表10-2所示,通过对支付矩阵的分析可以看出,如果A、B两厂商都是理性的,则这个博弈的结果是两厂商都做广告,即不管一个厂商如何决定,另外一个厂商都
4、会选择做广告。这种策略均衡称之为占优策略均衡(equilibrium in dominant strategies)。表10-2广告博弈的支付矩阵,2纳什均衡并不是每个博弈的各个参与人都有一个占优策略。如表10-3所示,通过对支付矩阵的分析可以看出,现在厂商A没有占优策略,它的最优决策取决于厂商B的选择。如果厂商B做广告,则厂商A最好也做广告;但如果厂商B不做广告,厂商A不做广告又是最好的选择。这种均衡就是纳什均衡(Nash equilibrium)。所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。即如果在一个策略组合中,当所有其他人都不改变
5、策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。表10-3广告博弈的支付矩阵,3纳什均衡与占优策略均衡的区别每一个占优策略均衡一定是纳什均衡,但并非每一个纳什均衡都是占优策略均衡。纳什均衡是有条件的占优策略均衡。一个博弈可能存在一个以上的纳什均衡,但是一个博弈也可能不存在纯策略纳什均衡,如表10-4所示。表10-4没有纳什均衡的同时博弈【例10.1】下列说法错误的是()。A占优策略均衡一定是纳什均衡B纳什均衡不一定是占优策略均衡C占优策略均衡中,每个参与者都是在针对其他参与者的某个特定策略而做出最优反应D纳什均衡中,每个参与者都是在针对其他参与者的最优反应策略而做出最优反应【答案
6、】C【解析】占优策略均衡中,不论其他参与者采取何种策略,每个参与者都会选择其自身的最优策略。,4寻找纳什均衡的方法条件策略下划线法对于一个简单的“二人同时博弈”,可以用一个以二元数组为元素的支付矩阵来表示,并用“条件策略下划线法”来确定它的纳什均衡。具体步骤如下:(1)把整个博弈的支付矩阵分解为两个参与人的支付矩阵。(2)在第一个(即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大者,并在其下画线。(3)在第二个(即位于整个博弈矩阵上方的)参与人的支付矩阵中,找出每一行的最大者,并在其下画线。(4)将已经画好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个博弈的支付矩阵。(
7、5)在带有下划线的整个的支付矩阵中,找到两个数字之下均画有线的支付组合。由该支付组合代表的策略组合就是博弈的纳什均衡。表10-5寡头博弈:合作与不合作,【例10.2】考虑两寡头厂商A和B的如下支付矩阵,二者的(纳什)均衡策略组合为()。A(U,L)B(D,R)C(U,R)D(D,L)【答案】B【解析】在一个纳什均衡里,任何一个参与者都不会改变自己的最优策略如果其他参与者均不改变各自的最优策略,即要求任何一个参与者在其他参与者的最优策略选择给定的条件下,其选择的策略也是最优的。对于本题,当B选择U时,A会选择R,因为;当B选择D时,A会选择R,因为。当A选择L时,B会选择U,因为;当A选择R时,
8、B会选择D,因为。因此,依据纳什均衡定义,可知 是纳什均衡。,5囚徒困境囚徒困境的博弈模型的假设条件是:甲、乙两个被怀疑为合谋偷窃的嫌疑犯被警方抓获,但警方对他们偷窃的证据并不充分。他们每一个人都被单独囚禁,并单独进行审讯,即双方无法互通信息。警方向这两个嫌疑犯交待的量刑原则是:如果一方坦白,另一方不坦白,则坦白者从宽处理,判刑1年;不坦白者从重处理,判刑7年。如果两人都坦白,则每人都各判刑5年。如果两个都不坦白,则警方由于证据不足,只能对每个人各判刑2年。表10-6的支付矩阵描述了这一博弈。表中的报酬均为负数,以表示判刑的年数。表10-6囚徒困境通过分析可以看出,囚徒困境的博弈有一个占优策略
9、均衡(坦白、坦白)。但是,如果两人都是选择不坦白(即合作),则都可以获得最好的结局。很清楚,囚徒困境的占优策略均衡反映了一个矛盾:即个人理性和团体理性的冲突。,三、同时博弈:混合策略均衡并不是所有的博弈都存在纳什均衡。比如,如表10-7所示。这博弈就不存在纯策略纳什均衡,但却存在混合策略纳什均衡。混合策略纳什均衡是这样一种均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都为自己确定了选择每一种策略的最优概率。表10-7社会福利博弈所有参与人的混合策略的组合构成“混合策略组合”。混合策略组合与参与人的支付的乘积之和为参与人的期望支付。当其他参与人的混合策略确定之后,某个参与人选择的可
10、以使自己的期望支付达到最大的混合策略是该参与人的条件混合策略(其几何表示为“条件混合策略曲线”)。不同参与人的条件混合策略曲线的“交点”就是混合策略条件下的纳什均衡。可以证明,混合策略均衡总是存在的。,【例10.3】在一条狭窄巷子里,两个年青人骑着自行车相向而行。每人都有两个策略,即或者选择“冲过去”或者选择“避让”。如果选择“避让”,不管对方采取什么策略,他得到的收益都是0。如果其中一个人采取“冲过去”的策略,如果对方采取“避让”,那么他得到的收益是9;如果对方不避让,那么他得到的收益是-36。这个博弈有两个纯策略纳什均衡和()。A一个混合策略纳什均衡,即两人都以80%概率选择“避让”,以2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 微观经济学 第十 博弈论 初步

链接地址:https://www.31ppt.com/p-5976007.html