纳什均衡.ppt
《纳什均衡.ppt》由会员分享,可在线阅读,更多相关《纳什均衡.ppt(24页珍藏版)》请在三一办公上搜索。
1、精品课程运筹学,第二节 纳什均衡,2.1 纳什均衡的概念,2.2 纳什均衡的求解,2.3 混合策略和混合纳什均衡,精品课程运筹学,第二节 纳什均衡,纳什均衡是对策 论中一个重要的概念。尤其在非合作对策分析中具有十分关键的作用。通过对经典对策模型的分析知道:对于对策中的每一个局中人,真正成功的措施应该是针对其他局中人所采取的每次行动,相应地采取有利于自己的策略。于是,每一个局中人应采取的策略必定是他对其他局中人策略的预测的最佳反应。Nash均衡正是体现这一基本原则。,精品课程运筹学,第二节 纳什均衡,2.1 纳什均衡的概念 用 表示一个对策,若一个对策中有 个局中人,每个局中人可选策略的集合分别
2、用 表示;表示局中人 的第 个策略,其中 可取有限个值、也可取无限个值;对策方 的得益用 表示;是各对策方策略的多元函数,个局中人的对策 常写成=,精品课程运筹学,第二节 纳什均衡,定义8.2.1 在对策=中,如果有由各个对策方的各选取一个策略组成的某个策略组合 中,任一对策方 的策略为,都是对其余策略方策略的组合 的最佳策略,即 对任意 都成立则称 为一个纯策略纳什均衡。,精品课程运筹学,第二节 纳什均衡,例8.2.1“囚徒的困境”警察抓住了两个罪犯,但是警察局缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪,就能确认罪名成立。为了得到所需的口供,警察将这两名罪犯分别关押以防止
3、他们串供或结成攻守同盟,并分别跟他们讲清了他们的处境和面临的选择:如果他们两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判1年徒刑;如果两人中有一人坦白认罪,则坦白者立即释放而另一人将重判8年徒刑;如果两人都坦白认罪,则他们将被各判5年监禁。,精品课程运筹学,第二节 纳什均衡,局中人为两个囚徒,两个人都有两种策略(坦白、不坦白),两人的策略集共有四个 元素。我们用-1、-5、-8分别表示被判刑的得益,用0表示被释放的得益,则可由下面的得益矩阵将此对策予以表示:表8.2.1,精品课程运筹学,第二节 纳什均衡,对囚徒l来说,囚徒2有坦白和不坦白两种选择,假设囚徒2选择的不坦白,则对囚徒l来说,不坦
4、白得益为一l,坦白得益为O,应该选择坦白;假设囚徒2选择的是坦白,则囚徒1不坦白得益为一8,坦白得益为一5,他更应该选择坦白。囚徒2唯一的选择也是坦白。例8.2.2 设某村庄有3个农户,该村有一片大家都可自由牧羊的公共草地。由于这片草地的面积有限,草的数量只能让数量有限的羊吃饱,如果在此草地上放牧的羊的实际数量超,精品课程运筹学,第二节 纳什均衡,过这个限度,每只羊都无法吃饱,从而羊的产出就会减少,甚至只能勉强存活或要饿死。假设这些农户只有夏天才到公共草地放羊,而每年春天决定养羊的数量,各农户在决定自己养羊的数量时是不知道其他农户的养羊数量的,各农户养羊数的决策是同时作出的。假设下面信息知道的
5、:每只羊的产出(价格)是羊只总数的减函数,,为第 个农户饲养羊的数量,每只羊的饲养成本为8元。,精品课程运筹学,第二节 纳什均衡,第一个农户是这样决策的:自己养羊的得益为=-8=-8 为方便起见,设羊数量是可分的。不管其他农户数量如何,第一人总希望自己收益最大。由此得出:每个农户都得出与此相同的结论:,精品课程运筹学,第二节 纳什均衡,三条曲线的交点()就是纳什均衡。联立解之:(只)此为三农户同时独立决定数量时所获得的稳定结果。任何单方面的擅自改变会使自己受损。各自得益为784,三农户总收益为2352。从总体利益的角度来考察公共草地上羊的最佳数量。设羊的总数为,则总得益为:=112-,精品课程
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 均衡
链接地址:https://www.31ppt.com/p-5437219.html