《博弈论通讲》PPT课件.ppt
《《博弈论通讲》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《博弈论通讲》PPT课件.ppt(77页珍藏版)》请在三一办公上搜索。
1、目 录,第一章 博弈论概述第一篇 非合作博弈理论第二章 完全信息静态信息博弈-纳什均衡第三章 完全信息动态搏弈-子博弈精炼纳什均衡第四章 不完全信息静态博弈-贝叶斯纳什均衡第五章 不完全信息动态博弈-精练贝叶斯纳什均衡,第一章 博弈论概述-人生处处皆博弈,博弈论(game theory,又译为对策论,游戏论)定义:研究决策主体的行为在直接相互作用时,人们如何进行决策、以及这种决策如何达到均衡。开始于-冯.诺曼(Von Neumann)与摩根斯坦(Morgenstern)在1944年合作的博弈论与经济行为(The Theory of Games and Economic Behaciour)19
2、94年纳什,泽尔腾,海萨尼因研究博弈论而获得当年的诺贝尔经济学奖博弈论由此而被大家所熟知1994,1996,2001,2005年博弈论四摘诺贝尔经济学奖,1.博弈论多学科交叉领域,博弈论研究的是:当成果无法由个体完全掌握,而结局须视群体共同决策而定时,个人为了取胜,应该采取什么策略博弈论成为通用方法论,经济学、政治学、管理、军事、外交、国际关系、公共选择、犯罪学“深蓝”和“更深的蓝”使用动态博弈理论编写程序,后来战胜了无敌的卡斯帕罗夫,2.为什么会有博弈?,博弈:决策主体在互相对抗中,对抗双方(或多方)互相依存的一系列策略和行动的过程集合参与人的利益有冲突博弈是一个过程集合(参与人、策略、行动
3、、信息等)。把博弈视为集合是思维从具体到抽象的重要一步博弈的一个本质特征是策略的相互依存性博弈论:专门研究博弈如何出现均衡的规律的学问,3.博弈论概念因素,博弈论分为合作博弈和非合作博弈合作博弈是指当事人达成了彼此合作协议非合作博弈是指一种参与者不可能达成具有约束力的协议的博弈类型,这是一种具有互不相容的情形。非合作博弈研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题。博弈论的基本概念包括:参与人、行动、信息、战略、支付函数、结果、均衡,4.博弈论的要素,参与人是指博弈中选择行动以最大化自身利益(效用、利润等)的决策主体(如个人、厂商、国家)。行动是指参与人的决策变量。
4、战略是指参与人选择行动的规则,它告诉参与人在什么时候选择什么行动。例如,“人不犯我、我不犯人;人若犯我、我必犯人”是一种战略。这里,“犯”与“不犯”是两种不同的行动。战略规定了什么时候选择“犯”,什么时候选择“不犯”。信息是指参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。由于博弈是由不同特征和行为知识的 人 来进行的,所以博弈中 要研究的主要内容 是对手人。如 打麻将,要判断对手有什么牌,并根据其特征判断其可能会编排什么和,以决定自己的战略对策。如果只根据自己的牌来编排怎样去和,而不考虑对手可能有什么大和正在编排之中,不做相宜的应对,则必将失去利益(必输)。,4.博弈论
5、的要素,支付函数是参与人从博弈中获得的效用水平,它是所有参与人战略或行动的函数,是每个参与人真正关心的东西。结果是指博弈者感兴趣的要素的集合。均衡是所有参与人的最优战略或行动的组合博弈分析目的是使用博弈规则(参,行,结)决定均衡。,5.博弈论的条件,1、博弈论是两个或两个以上参与者之间的对策论2、参与人具有理性人假设理性人是指一个很好定义的偏好,在面临定的约束条件下最大化自己的偏好。博弈论说起来有些绕嘴,但理解起来很好理解,那就是每个对弈者在决定采取哪种行动时,不但要根据自身的利益的利益和目的行事,而且要考虑到他的决策行为对其他人可能的影响,通过选择最佳行动计划,来寻求收益或效用的最大化。,6
6、.博弈的数学表述(标准式),例如:在两个寡头产量博弈里,企业是参与人,产量q是战略空间,利润u是支付。战略式表述博弈为:G=q10,q20;u1(q1,q2),u2(q1,q2),7.博弈论的种类,博弈有不同的种类:从行动顺序角度:静态博弈。参与人同时选择行动非同时行动但后行动者并不知道前行动者采取了什么具体行动;动态博弈。参与人的行动有先后顺序且后行动者能够观察先行动者选择的行动。从拥有信息角度:完全信息博弈。每个参与人对所有其他参与人的特征、战略空间、支付函数有准确的知识不完全信息博弈。,8.博弈的划分:,第二章完全信息静态信息博弈-纳什均衡,一.博弈的基本模型二.占优战略均衡,重复剔除的
7、占优均衡,混合战略纳什均衡三.纳什均衡应用举例,案例1-囚徒困境-纳什均衡,囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑1年;如果两人都坦白,各判8年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判10年。于是,每个囚徒都面临两种选择:坦白或抵赖。,案例1-囚徒困境-纳什均衡,设定条件:(1)每个局中人都知道博弈规则和博弈结果的支付矩阵;(2)每个局中人都是理性的(个人理性和个人最优决策);(3)不能“串通”,案例1-囚徒困境-纳什均衡,有限博弈1、参与人的个数是有限的;2、每
8、个参与人可选的战略是有限的。两个人有限博弈的战略表述可以用矩阵形式表述:,案例1-囚徒困境-纳什均衡,囚徒A,囚徒 B,坦白,抵赖,坦白,抵赖,-8大于-100大于-1,对于两个囚徒总体而言,他们设想的最好的策略可能是都不交代。但任何一个囚徒在选择不交代的策略时,都要冒很大的风险,代价很大(坦白,坦白)是纳什均衡,囚徒困境的性质:,个人理性和集体理性的矛盾;个人的“最优策略”使整个“系统”处于不利的状态。从“纳什均衡”引出“看不见的手”(国富论)的一个悖论:从利己目的出发,结果损人不利己。“纳什均衡”提出的悖论动摇了经济学的基石。从“纳什均衡”还可以悟出:合作是有利的“利己策略”,但它必须符合
9、以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是“己所不欲勿施于人”。,完全信息静态博弈:纳什均衡,囚徒困境的几个事例:价格大战(电视机)两个寡头企业选择产量公共产品的供给军备竞赛做广告围观时踮脚尖应试教育污染。1968年,格雷特哈丁成功地将“囚徒的困境”与资源耗竭结合起来,揭示了生态环境问题与囚徒困境的相似之处。贸易自由与壁垒,地方保护主义,案例2:智猪博弈,假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的分别是9
10、个单位和1个单位;大猪小猪同时到槽边,吃到的食物分别是7个单位和3个单位;小猪先到槽边,则大猪吃6个单位小猪吃4个单位。,等待,小猪,大猪,按,等待,按,案例2-智猪博弈,智猪博弈的例子,股市大户和小户(小户跟大户)大企业与小企业(创新研发 模仿)公共产品供给(富户修路,穷户不修),划线法:横向,如果“列”选中一个策略,在我的最佳策略下划线;纵向,如果“行”选中一个策略,在我的最佳策略下划线。某个策略组合中的两个支付之下都有横线,此即较为可能的解。如果这种解只有一组,此即上策均衡。,完全信息静态博弈:纳什均衡基本分析思路和方法,四 纳什均衡,寻找纳什均衡,C2,R1,R2,C1,C3,R3,参
11、与人B,参与人A,(R3,C3)是纳什均衡,例3:性别战(battle of sexes),案例3.性别站,条件:两个人都不愿意分开两个纳什均衡 先动优势所形成的“解”形成的机会,案例四 斗鸡博弈(chicken game)(胆小鬼博弈),有两人狭路相逢,每人有两个行动选择:一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对方获得胜利,这人就很丢面子;如果对方也退下来,双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两人都前进,那么则两败俱伤。因此,对每个人来说,最好的结果是,对方退下来,而自己不退,例4:斗鸡博弈(chicken game)(胆小鬼博弈),
12、案例四斗鸡博弈,斗鸡博弈的例子,公共产品供给:富人修路修与不修(公共产品供给可能是囚徒困境也有可能是智猪博弈更有可能是斗鸡博弈,根据现实情况)冷战期间美苏抢地盘警察与游行队伍夫妻吵架,案例五:进入阻挠(entry deterrance),这是产业组织经济学中的一个例子设想有一个垄断企业已在市场上(称为在位者),另一个企业虎视眈眈想进入(进入者)在位者想保持自己的垄断地位,所以就要阻挠进入者进入 在这个博弈中,进入者有两种战略可以选择:进入还是不进入;在位者也有两种战略:默许或斗争假定进入之前垄断利润为,进入之后寡头利润合为(各得),进入成本为各种战略组合下的支付矩阵亦可列表,例:进入阻挠(en
13、try deterrance),案例五 进入阻碍,这个博弈中有两个纳什均衡,即(进入,默许),(不进入,斗争)为什么(进入,默许)是纳什均衡?因为给定进入者进入,在位者选择默许时得单位利润,选择斗争时得不到利润,所以,最优战略是默许。类似的,给定在位者选择默许,进入者的最优战略就是进入尽管在进入者选择不进入时,默许和斗争对在位者是一个意思,只有当在位者选择斗争时,不进入才是进入者的最优选择,所以,(不进入,斗争)是一个纳什均衡,而(不进入,默许)不是一个纳什均衡。,纳什均衡是完全信息静态博弈的一般概念,也是所有其他类型博弈的基本要求占优战略均衡占优战略均衡就是指所有结果中只有一个最优解如果所有
14、参与人都有占优战略存在,则占优战略均衡是可以预测到的惟一的均衡囚徒困境中,坦白坦白就是占优战略占优战略只要求自己理性,不要求自己知道对方是不是理性,1.2 纳什均衡,占优战略均衡:不论其他人采取什么策略,A之某策略的结果总是最高,即为“占优战略”(dominant-strategy)。如果一个博弈的某个策略组合中的所有策略都是各方的上策,那么这个策略组合将是所有人都愿意选择的,必然是比较稳定的结果,这是“占优战略均衡”(dominant-strategy equilibrium)。反映了所有人的绝对偏好,因此十分稳定。,占优战略均衡(Dominant-Strategy),占优战略均衡定义:在博
15、弈的战略表达式中,如果对于所有的i,Si*是i的占优战略,下列战略组合称为占优战略均衡:,占优战略均衡(Dominant-Strategy),不开发,开发商A,开发,不开发,开发,不开发,开发商B,开发商A,开发,不开发,开发,开发商B,需求小的情况,需求大的情况,博弈的战略式表述,等待,小猪,大猪,按,等待,按,案例2-智猪博弈,大猪有无严格占优战略?,占优战略均衡(Dominant-Strategy),案例1-囚徒困境,囚徒A,囚徒 B,坦白,抵赖,坦白,抵赖,-8大于-100大于-1,-8大于-100大于-1,完全信息静态信息博弈-纳什均衡,一 博弈的基本概念及战略表述二 占优战略均衡三
16、 混合战略纳什均衡四 纳什均衡应用举例,混合战略纳什均衡,纯战略:参与人在每一个给定信息的情况下只选择一个特定的行动混合战略:参与人在每一个给定信息的情况下以某种概率分布随机地选择不同的行动纯战略可视为混合战略的特例步骤:1.以混合策略为对象,重新定义效用函数,即期望效用函数再定义纳什均衡“流浪汉”的纳什均衡:政府以0.5救济,流浪汉以0.2找工作,混合战略纳什均衡,纯战略可以理解为混合战略的特例,即在诸多战略中,选该纯战略si的概率为1,选其他纯战略的概率为0。,等待,小猪,大猪,按,等待,按,反面,正面,反面,正面,案例1社会福利博弈,参与人是政府和流浪汉流浪汉有两个战略:寻找工作,游荡,
17、政府有两个战略:救济,不救济。政府想帮助流浪者前提后者必须试图找工作否则不予帮助,而流浪者能偷懒则偷懒只有在政府不帮助时才会选择找工作,五 混合战略纳什均衡,流浪,流浪汉,政府,救济,不救济,寻找工作,即:流浪汉以0.2的概率选择寻找工作,0.8的概率选择游荡,同样,可以根据流浪汉的期望效用函数找到政府的最优混合战略。0.5,支付最大化法,五 混合战略纳什均衡,假定最优混合战略存在,给定流浪汉选择混合战略(r,1-r),政府选择纯战略救济的期望效用为:3r+(-1)(1-r)=4r-1选择纯战略不救济的效用为:-1r+0(1-r)=-r如果一个混合战略(而不是纯战略)是政府的最优选择,一定意味
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论通讲 博弈论 PPT 课件
链接地址:https://www.31ppt.com/p-5475758.html