完全信息静态非合作博弈.ppt
《完全信息静态非合作博弈.ppt》由会员分享,可在线阅读,更多相关《完全信息静态非合作博弈.ppt(63页珍藏版)》请在三一办公上搜索。
1、2023/9/18,博弈论 重庆大学 刘辛,1,第二章 完全信息静态博弈,本章介绍完全信息静态博弈。完全信息静态博弈即各博弈方同时决策,且所有博弈方对各方收益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等。,2023/9/18,博弈论 重庆大学 刘辛,2,本章分六部分,2.1基本分析思路和方法2.2纳什均衡2.3无限策略博弈分析和反应函数2.4混合策略和混合策略纳什均衡2.5纳什均衡的存在性2.6纳什均衡的选择和分析方法扩展,202
2、3/9/18,博弈论 重庆大学 刘辛,3,2.1 基本分析思路和方法,2.1.1 占优均衡2.1.2 严格下策反复消去法2.1.3 划线法2.1.4 箭头法,2023/9/18,博弈论 重庆大学 刘辛,4,2.1.1 占优均衡,占优策略:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的收益始终高于其它的策略,至少不低于其他策略的策略举例:囚徒的困境中的“坦白”;双寡头削价中“低价”。占优均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的占优,必然是该博弈比较稳定的结果占优均衡不是普遍存在的,2023/9/18,博弈论 重庆大学 刘辛,5,2.1.2 严格下策反复消去法,严格下
3、策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略严格下策反复消去:,2023/9/18,博弈论 重庆大学 刘辛,6,2.1.3 划线法,2023/9/18,博弈论 重庆大学 刘辛,7,2023/9/18,博弈论 重庆大学 刘辛,8,2.1.4 箭头法,2023/9/18,博弈论 重庆大学 刘辛,9,2.2 纳什均衡,2.2.1 纳什均衡的定义2.2.2 纳什均衡的一致预测性质2.2.3 纳什均衡与严格下策反复消去法,2023/9/18,博弈论 重庆大学 刘辛,10,2.2.1 纳什均衡的定义,策略空间:博弈方 的第 个策略:博弈方 的收益:博弈:纳
4、什均衡:在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合 中,任一博弈方 的策略,都是对其余博弈方策略的组合 的最佳对策,也即 对任意 都成立,则称 为 的一个纳什均衡,2023/9/18,博弈论 重庆大学 刘辛,11,2.2.2 纳什均衡的一致预测性质,一致预测:如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈的最终结果只有纳什均衡才具有一致预测的性质一致预测性是纳什均衡的本质属性一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能,202
5、3/9/18,博弈论 重庆大学 刘辛,12,2.2.3 纳什均衡与严格下策反复消去法,占优均衡肯定是纳什均衡,但纳什均衡不一定是占优均衡命题2.1:在n个博弈方的博弈 中,如果严格下策反复消去法排除了除 之外的所有策略组合,那么 一定是该博弈的唯一的纳什均衡命题2.2:在n个博弈方的博弈中 中,如果 是 的一个纳什均衡,那么严格下策反复消去法一定不会将它消去 上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的,2023/9/18,博弈论 重庆大学 刘辛,13,2.3 无限策略分析和反应函数,2.3.1 古诺的寡头模型2.3.2 最佳反应函数2.3.3 伯特兰德寡头模
6、型2.3.4 公共资源问题2.3.5 反应函数的问题和局限性,2023/9/18,博弈论 重庆大学 刘辛,14,2.3.1 古诺的寡头模型,寡头产量竞争以两厂商产量竞争为例,2023/9/18,博弈论 重庆大学 刘辛,15,以自身最大利益为目标:各生产2单位产量,各自收益为4以两厂商总体利益最大:各生产1.5单位产量,各自收益为4.5,两寡头间的囚徒困境博弈,2023/9/18,博弈论 重庆大学 刘辛,16,2.3.2 最佳反应函数,古诺模型的最佳反应函数,理性局限和古诺调整,2023/9/18,博弈论 重庆大学 刘辛,17,2.3.3 伯特兰德寡头模型,价格竞争寡头的博弈模型产品无差别,消费
7、者对价格不十分敏感,2023/9/18,博弈论 重庆大学 刘辛,18,2.3.4 公共资源问题,公共草地养羊问题,以三农户为例 n=3,c=4,2023/9/18,博弈论 重庆大学 刘辛,19,合作:总体利益最大化,竞争:个体利益最大化,2023/9/18,博弈论 重庆大学 刘辛,20,2.3.5 反应函数的问题和局限性,在许多博弈中,博弈方的策略是有限且非连续时,其收益函数不是连续可导函数,无法求得最佳反应函数,从而不能通过解方程组的方法求得纳什均衡。即使收益函数可以求导,也可能各博弈方的收益函数比较复杂,因此各自的反应函数也比较复杂,并不总能保证各博弈方的最佳反应函数有交点,特别不能保证有
8、唯一的交点。,2023/9/18,博弈论 重庆大学 刘辛,21,2.4 混合策略和混合策略纳什均衡,2.4.1 严格竞争博弈和混合策略的引进2.4.2 多重均衡博弈和混合策略2.4.3 混合策略和严格下策反复消去法2.4.4 混合策略反应函数,2023/9/18,博弈论 重庆大学 刘辛,22,2.4.1 严格竞争博弈和混合策略的引进,一、猜硬币博弈,(1)不存在前面定义的纳什均衡策略组合(2)关键是不能让对方猜到自己策略这类博弈很多,引出混合策略纳什均衡概念,2023/9/18,博弈论 重庆大学 刘辛,23,二、混合策略、混合策略博弈 和混合策略纳什均衡,混合策略:在博弈 中,博弈方 的策略空
9、间为,则博弈方 以概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且 混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈)。混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。,2023/9/18,博弈论 重庆大学 刘辛,24,三、一个例子,该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析,策略 收益博弈方1(0.8,0.2)2.6博弈方2(0.8,0.2)2.6,2023/9/18,博弈论 重庆大学 刘辛,25,五、小偷和守卫的博弈,加重对保安的处罚:短期中的效果是使保安真正尽职在长期中并
10、不能使保安更尽职,但会降低盗窃发生的概略,Pt 小偷偷的概率,2023/9/18,博弈论 重庆大学 刘辛,26,加重对小偷的处罚:短期内能抑制盗窃发生率长期并不能降低盗窃发生率,但会是的守卫更多的偷懒,2023/9/18,博弈论 重庆大学 刘辛,27,2.4.2 多重均衡博弈和混合策略,一、夫妻之争的混合策略纳什均衡,夫妻之争博弈的混合策略纳什均衡 策略 收益博弈方1(0.75,0.25)0.67博弈方2(1/3,2/3)0.75,2023/9/18,博弈论 重庆大学 刘辛,28,二、制式问题,制式问题混合策略纳什均衡 A B 收益厂商1:0.4 0.6 0.664厂商2:0.67 0.33
11、1.296,2023/9/18,博弈论 重庆大学 刘辛,29,三、市场机会博弈,进 不进 收益厂商1:2/3 1/3 0厂商2:2/3 1/3 0,2023/9/18,博弈论 重庆大学 刘辛,30,2.4.3 混合策略和严格下策反复消去法,2023/9/18,博弈论 重庆大学 刘辛,31,2.4.4 混合策略反应函数,猜硬币博弈,2023/9/18,博弈论 重庆大学 刘辛,32,夫妻之争博弈,2023/9/18,博弈论 重庆大学 刘辛,33,2.5 纳什均衡的存在性,纳什定理:在一个由n个博弈方的博弈 中,如果n是有限的,且 都是有限集(对),则该博弈至少存在一个纳什均衡,但可能包含混合策略。



- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 完全 信息 静态 合作 博弈

链接地址:https://www.31ppt.com/p-6043784.html