完全信息静态博弈:纳什均衡.ppt
《完全信息静态博弈:纳什均衡.ppt》由会员分享,可在线阅读,更多相关《完全信息静态博弈:纳什均衡.ppt(67页珍藏版)》请在三一办公上搜索。
1、,博弈分析的目的是预测博弈的均衡结果,即给定每个参与人都是理性的,什么是所有参与人最优的策略组合?纳什均衡是完全信息静态博弈解的一般概念,也是所有其他类型博弈解的基本要求。我们先介绍几种纳什均衡解的特殊情况,再定义一般意义下的纳什均衡。,完全信息静态博弈:纳什均衡,一、占优策略均衡,什么是“占优策略均衡”占优策略均衡求解举例对“囚徒困境”模型结果的说明“囚徒困境”模型的应用“囚徒困境”与社会福利,1、什么是“占优策略均衡”,一般来说,由于每个参与人的得益是博弈中所有参与人的策略的函数,因此每个参与人的最优策略选择依赖于所有其他参与人的策略选择。但在一些特殊的博弈中,一个参与人的最优策略可能可以
2、不依赖于其他参与人的策略选择。也就是说,不论其他参与人选择什么策略,他的最优策略是唯一的,这样的最优策略被称为“占优策略”。如果一个博弈中,某个参与人有占优策略,那么该参与人的其他可选择策略就被称为“劣策略”。在一个博弈中,如果所有参与人都有占优策略存在,那么占优策略均衡是可以预测到的唯一的均衡,因为没有一个理性的参与人会选择劣策略。,例 囚徒困境博弈,乙,招 不招,不招,招,甲,对于甲来说,不论乙选择“招”还是“不招”,他选择“招”都比选择“不招”为好。因此,“招”是占优策略,“不招”是相对于“招”的劣战略,他不会选择劣战略。类似的,“招”也是乙的占优策略。所以,在“囚徒困境”模型里,(招,
3、招)是占优策略均衡。,2、占优策略均衡求解举例,下面这个博弈是否存在占优策略均衡?,乙,甲,a,b,a,b,对于甲而言,不论乙选择什么,a都是甲的占优策略;类似的,a也是乙的占优策略。所以,(a,a)是这个博弈的占优策略均衡。,3、对“囚徒困境”博弈结果的说明,如果每个人都选择不招,各被判刑1年,显然比都判刑8年好。但在这样的一次博弈中,这个结果达不到,因为它不满足个人理性的要求,(不招,不招)不是一个均衡。即使两个囚徒在作案之前建立一个攻守同盟也没有用,因为事到临头没有人有积极性去遵守这个协定。这反映了一个深刻的问题,即合作与利己之间的冲突。合作的结果会使博弈各方的状况更好,但由于追求利己,
4、使得共同利益无法达到最大化。(个人理性和集体理性的冲突),4、“囚徒困境”博弈的应用,应用一 价格战,乙,甲,a,b,a,b,出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利,但实际上却是相互杀价,结果都赚不到钱。,百事可乐,低价,高价,可口可乐,低价,高价,应用二 军备竞赛:美苏争霸的“囚徒困境”,20多年前,美国和苏联是世界上的两个超级大国,他们相互对垒。假定每一方都有两种策略,一个是扩军,发展战略核武器等;另一个是裁军,直至不设军备。扩军所需军费为2000亿美元,彻底裁军则军费为0.如果一方裁军、另一方扩军,则裁军方会遭受很大损失,甚至丧失主权,我们简单地把这种情况下裁军方的
5、得益记作-,即负无穷大。假定扩军方掠夺到一个有限数额的财富10000亿美元,由于付出2000亿美元军费,则扩军方的 得益是8000亿美元。,美苏两国如果不搞军备竞赛,各自把资源用于民品生产,不是很好吗?问题是,如果我把资源用于民品生产,而你增加军费支出,我不就受到威胁吗?这样对我不好。纳什均衡是两国都大量增加军费预算,两国的社会福利都变得更糟。,苏联,美国,扩军,裁军,扩军,裁军,军备竞赛博弈,应用三 公共产品的供给,设想有两户相居为邻的农家,十分需要有一条好路从居住地通往公路。修一条路的成本为4,每个农家从修好的路上获得的好处为3。如果两户居民共同出资联合修路,并平均分摊修路成本,则每户居民
6、获得净的好处(得益)为3-4/2=1;当只有一户人家单独出资修路时,修路的居民获得的得益为3-4=-1(亏损),“搭便车”不出资但仍然可以使用修好的路的另一户人家获得得益3-0=3。,修路博弈,张三,修,不修,修,不修,李四,我们看到,对两家居民来说,“修路”都是劣战略,因而他们都不会出资修路。这里,为了解决这条新路的建设问题,需要政府强制性地分别向每家征税2单位,然后投入4单位资金修好这条对大家都有好处的路,并使两家居民的生活水平都得到改善。,这就是我们看到的为什么大多数路、桥等公共设施都是由政府出资修建的原因。同样的道理,国防、教育、社会保障、环境卫生等都由政府承担资金投入,私人一般没有积
7、极性承担这方面服务的积极性和能力。,应用四 寡头竞争,设想在一个镇上只有两个居民杰克和吉尔拥有能生产饮用水的水井。每周六,杰克和吉尔决定抽取多少加仑水,带到镇上,并以市场所能承受的价格出售。为了简单起见,假设杰克和吉尔可以没有成本地想抽取多少水就抽取多少水。镇上水的需求可以表示如下,小镇水需求情况,如果两人合作,结成卡特尔,则能够达到总收益的最大化。即两人总共生产60加仑(二人平均划分市场的话,每人将生产30加仑),以每加仑60美元的价格出售,总收益为3600美元,每人得到1800美元收益。但是,追求私利的结果是两人将各生产40加仑,各获得收益1600美元。,寡头博弈,世界石油的大部分生产国家
8、形成了一个卡特尔,称为世界石油输出国组织(OPEC).欧佩克于1960年成立,目前共有12个成员国,它们是:阿尔及利亚、伊朗、伊拉克、科威特、利比亚、尼日利亚、卡塔尔、沙特阿拉伯、阿联酋、委内瑞拉、安哥拉、厄瓜多尔。此外,过往成员包括印度尼西亚和加蓬。这些国家控制了世界石油储藏量的四分之三。正如任何一个卡特尔一样,欧佩克努力确定每个成员国的生产水平,力图通过协调减少产量来提高其产品的价格。欧佩克想维持石油的高价格。但是,每个成员都受到增加生产以得到更大利润份额的诱惑。因此,欧佩克成员常常就减少产量达成协议,然后又私下违背协议。,应用五 做广告,当两个企业用广告来吸引相同的顾客时,它们面临与囚犯
9、两难处境类似的问题。考虑两家烟草公司万宝路和骆驼面临的决策。,广告博弈,骆驼,做广告,不做广告,做广告,不做广告,万宝路,尽管两家企业都不做广告状况会更好,但是两家都选择了做广告。1971年,国会通过了禁止在电视上做香烟广告的法律。令许多观察者奇怪的是,烟草公司并没有利用它们政治上相当大的影响力去反对这项法律。这项法律为烟草公司做了一件它们自己做不到的事:它通过强制实现了低广告高利润的合作,结果解决了囚犯的两难处境问题。,5、“囚徒困境”与社会福利,囚犯的两难处境描述生活中的许多情况,并说明了,即使合作使每个参与者的状况变好,要维持合作也是困难的。这种缺乏合作从整个社会角度来看是一个问题吗?回
10、答取决于环境。警察审问两个嫌犯的情况下,嫌犯之间缺乏合作是合意的,因为它使警察可以制止更多的犯罪行为。这种情况对囚犯来说是两难处境,但对社会其他人来说是一种福音。在企图维持垄断利润的寡头情况下,缺乏合作是合意的。因为垄断结果对寡头是好的,但对物品的消费者是坏的。而在军备竞赛中,非合作均衡对社会和参与者都是不好的。,二、重复剔除的占优均衡,在每个参与人都有占优策略的情况下,占优策略均衡是一个非常合理的预测。不过,在绝大多数博弈中,占优策略均衡是不存在的。但在有些博弈中,我们仍可以应用占优的逻辑找出均衡。,“重复剔除严格劣策略”的思路“智猪博弈”“智猪博弈”的应用对重复剔除的占优均衡的说明,1、“
11、重复剔除严格劣策略”的思路,严格劣策略重复剔除博弈1,A,左,中,上,下,B,右,对A来讲,没有占有策略。因此该例没有占优策略均衡。观察B,无论A选“上”还是“下”,“右”的得益严格少于“中”的得益。我们说B的“右”策略严格劣于“中”策略,理性的B不会选择它,因此可将之剔除。得到的得益矩阵为:,此时,A的“下”策略相对其“上”策略是严格劣的,再把它剔除出去。得到得益矩阵为:,严格劣策略重复剔除博弈2,A,左,中,上,下,B,这时,明显可以看出,最后的均衡策略是(上,中);A、B各自得益为1和3.,严格劣策略重复剔除博弈3,A,左,中,上,B,总结“重复剔除严格劣策略”思路:,首先找出某个参与人
12、的严格劣策略(假定其存在),把这个劣策略剔除掉,重新构造一个不包含已剔除策略的新的博弈;然后再剔除这个新的博弈中某个参与人的严格劣策略;继续这个过程,一直到只剩下一个唯一的策略组合为止。这个唯一剩下的策略组合就是这个博弈的均衡解,称为“重复剔除的占优均衡”。,2、智猪博弈,猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有8单位的猪食进槽,但每按一下按钮会耗去2单位的成本。如果大猪先到食槽,则大猪吃到7单位食物,小猪仅能吃到1单位食物;如果两猪同时到食槽,则大猪吃5单位,小猪吃3单位食物;如果小猪先到,大猪、小猪各吃4单位食物。,乙,甲,a,b,a,b
13、,小猪,大猪,按,等待,按,等待,首先剔除小猪的劣策略“按”;此时“等待”成为大猪的劣策略,将之剔除;剩下的唯一策略组合(按,等待)是这个博弈唯一的均衡。结果是大猪选择“按”,小猪选择“等待”,得益分别为2和4个单位。,3、“智猪博弈”的应用,应用一 大股东与小股民的角色差异 股份公司里,股东应承担起监督经理的职能。但是,监督成本是很高的。这里,大股东相当于智猪博弈中的大猪,小股东相当于小猪。大股东因为利益攸关会担当起搜集信息监督经理的责任,小股东则“搭便车”,坐享其成。,应用二 公共产品的提供,囚徒困境博弈解释了各家经济实力大致相当情形下公共品的提供问题。如果双方经济实力相差很大,可以用智猪
14、博弈来解释。村里住两户人家,一户富,一户穷,有一条路年久失修。这时候,富户一般会承担起修路的责任,穷户则很少这样干。因为富户家常常是高朋满座,坐车坐轿的都来,而穷户家只是自己穿着旧鞋走路,路修好了他走起来舒服,路修不好他也无所谓。,4、对重复剔除的占优均衡的说明,参与人B,参与人A,L,R,U,D,(U,L)是重复剔除的占优均衡。因为,A百分之百地确信B是理性的因而会选择L,那么U是A的最优选择。但是,即使有千分之一的概率B会选择R,则D就优于U.,重复剔除的占优均衡不仅要求每个参与人是理性的,而且要求“理性”是参与人的共同知识,即所有人知道所有人是理性的,所有人知道所有人知道所有人是理性的,
15、如此等等。,三、纳什均衡,纳什均衡的含义对纳什均衡含义的强化理解纳什均衡的价值纳什均衡、占优策略均衡、重复剔除的占优均衡三者的关系划线法,1、纳什均衡的含义,含义:各博弈方都不愿单独改变策略(因为单独改变没好处)的策略组合。,乙,招 不招,不招,招,甲,囚徒困境博弈,用纳什均衡的含义检验以前的例子,A,左,中,上,下,B,右,张三,修,不修,修,不修,李四,2、对纳什均衡含义的强化理解,设想有一个居民点,居民住宅沿着一条公路均匀地排开(如下图)。现在有两家杂货铺要在这个居民点开张,他们卖的东西一样,价格也完全一样。那么,两家杂货铺开在什么地方好呢?,1/4,1/2,3/4,1,店铺选址,居民到
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 完全 信息 静态 博弈 均衡

链接地址:https://www.31ppt.com/p-5960634.html