exfd经济博弈论3—完全且完美信息动态博弈ppt课件.ppt
《exfd经济博弈论3—完全且完美信息动态博弈ppt课件.ppt》由会员分享,可在线阅读,更多相关《exfd经济博弈论3—完全且完美信息动态博弈ppt课件.ppt(179页珍藏版)》请在三一办公上搜索。
1、第三章 完全且完美信息动态博弈,本章讨论动态博弈(Dynamic Games),所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。本章对动态博弈的概念和分析方法,特别是子博弈完美均衡和逆推归纳法作系统介绍,并介绍各种经典的动态博弈模型。,本章分六节,3.1动态博弈的表示法和特点3.2可信性和纳什均衡的问题3.3子博弈和子博弈完美纳什均衡3.4几个经典动态博弈模型3.5有同时选择的动态博弈模型3.6动态博弈分析的问题和扩展讨论,
2、3.1 动态博弈的表示法和特点,3.1.1 阶段和扩展形表示3.1.2 动态博弈的基本特点,3.1.1 阶段和扩展形表示,动态博弈各个博弈方的选择行为有先后次序,每个博弈方的选择行为会形成依次相连的时间阶段,因此动态博弈中一个博弈方的一次选择行为常称为一个“阶段”(Stage)。动态博弈中也可能存在几个博弈方同时选择的情况,此时博弈方的同时选择构成一个阶段。有些动态博弈的阶段很多,或者博弈方在一个阶段有许多可以选择的行为,此时扩展形表示动态博弈会很困难,或者根本不可能。无法用扩展形表示的动态博弈,通常可以直接用文字描述和数学函数式表示。,例子:仿冒和反仿冒博弈,设有一家企业的产品被另一家企业仿
3、冒,如果被仿冒企业采取措施制止,仿冒企业就会停止仿冒;如果被仿冒企业不采取措施制止,那么仿冒企业就会继续仿冒。 这两个企业在仿冒和制止仿冒的问题上,存在着一个行为和利益相互依存的博弈问题。假设仿冒最多进行2次,每种情况下得益情况如图所示。,3.1.2 动态博弈的基本特点,一、动态博弈的策略和结果在动态博弈中,各个博弈方的选择和行为不仅有先后之分,而且一个博弈方的选择很可能有几次甚至多次,并且在不同阶段的多次行为之间有内在联系,是不可分割的整体。动态博弈博弈方决策的内容,也是决定博弈结果的关键,不是博弈方在单个阶段的行为,而是各博弈方在整个博弈中轮到选择的每个阶段,针对前面阶段的各种情况作相应选
4、择和行为的完整计划,以及由不同博弈方的这种计划构成的组合。这种计划就是动态博弈中博弈方的“策略”。,动态博弈的结果首先是指各博弈方上述类型的策略构成的策略组合。其次,动态博弈的结果是各博弈方的策略组合形成的一条联结各个阶段的“路径”。最后,实施上述策略组合的最终结果,就是上述路径终端处得益数组中的数字。所以,在一个动态博弈中,博弈的结果包括双方(或多方)采用的策略组合,实现的博弈路径和各博弈方的得益。,二、动态博弈的非对称性动态博弈的非对称性先后次序决定动态博弈必然是非对称的。由于后行为的博弈方有更多的信息帮助自己选择行为,可减少决策的盲目性,针对性地作选择,因此处于较有利的地位。对单人博弈,
5、信息越多越有利;而对两人以上的博弈问题来说,信息较多的博弈方并不一定能得到更大的利益。先选择、行为的博弈方常常更有利,有“先行优势”。,3.2 可信性和纳什均衡的问题,3.2.1 相机选择和策略中的可信性问题3.2.2 纳什均衡的问题3.2.3 逆推归纳法,3.2.1 相机选择和策略中的可信性问题,动态博弈仍然是具有策略和利益相互依存性的决策问题。静态博弈分析中针对具有策略和利益相互依存特性决策问题的核心分析方法纳什均衡分析,在动态博弈分析中适用吗?纳什均衡分析在动态博弈中的失效,与动态博弈各博弈方策略中选择行为的“可信性”问题紧密相关。,3.2.1 相机选择和策略中的可信性问题,在实施中,只
6、要符合自己的利益就可以在博弈过程中改变计划。这种问题称为“相机选择”(Contingent play) “相机选择”的存在,使得博弈方在各个阶段、各种情况下会采取行为的“可信性”产生怀疑?,动态博弈中博弈方的策略是他们自己预先设定的,在各个博弈阶段针对各种情况的相应行为选择的计划。这些策略实际上并没有强制力,而且实施起来有一个过程,因此只要符合博弈方自己的利益,他们完全可以在博弈过程中改变计划。我们称这种问题为动态博弈中的“相机选择(Contingent Play)”。相机选择的存在使得博弈方的策略中,所设定的各个阶段、各种情况下会采取行为的“可信性(Credibility)”有了疑问。,不同
7、版本的开金矿博弈分钱和打官司的可信性,基本问题:甲在开采一价值4万元的金矿时缺1万元资金,而乙正好有1万元资金可以投资。设甲想说服乙将这1万元资金借给自己用于开矿,并许诺在采到金子后与乙对半分成,乙是否该将钱借给甲呢?假设金矿的价值是经过权威部门探测确认的,没必要怀疑,则乙最需要关心的就是甲采到金子后是否会履行诺言跟自己平分。,2022/12/28,14,(0,0),3.2.1.1 动态博弈中的扩展式描述I,博弈树game tree,犯人,犯我,不犯我,犯人,不犯人,不犯人,美国,我国,我国,(2,-5),(1,-4),(-2,-3),2022/12/28,15,3.2.1.1 动态博弈中的扩
8、展式描述II,博弈树game tree新产品开发博弈中美战略博弈,开发,开发,不开发,开发,不开发,不开发,A企业,B企业,B企业,(0,0),(0,1),(1,0),(-3,-3),最上方的圆圈表示乙的选择信息集或称选择节点(node)。如果乙选择“不借”则博弈结束,他能保住1万元本钱而甲得不到开矿的利润;如乙选择“借”则到达甲的选择信息集,轮到甲进行选择。三个终端黑点处的数组,表示由各博弈方各阶段行为依次构成的,到达这些终端的“路径”所实现的各博弈方得益。乙决策的关键是要判断甲的许诺是否可信。,一、开金矿博弈I的扩展形,模型描述:甲开采一价值4亿元的金矿时缺1亿元资金,乙有1亿元可投资资金
9、。甲希望乙能投资自己1亿元资金用于开矿,并许诺在采到金子后与乙对半分成问题:乙是否该将钱投资给甲呢?,一般假设博弈方都是以自身利益(得益)最大化为目标的,即他们不考虑道德因素。在这样的原则下,甲轮到行为时的选择必然是“不分”。乙当然清楚甲的行为准则,因此他最终合理的选择是“不借”。对乙来说,本博弈中甲有一个不可信的许诺。有不可信的许诺,使得甲、乙的合作最终成为不可能,这样开金矿的3万元社会净利益无法实现。有什么办法能使甲的许诺变成可信的,从而使乙愿意选择“借”,然后甲遵守诺言选择“分”,最终增加双方的利益呢?,二、有法律保障的开金矿博弈II的扩展形,确实可信的威胁通过法律武器确实可信的威胁(c
10、redible threat)是指,博弈的参与人通过某种行动改变自己的支付函数,从而使得自己的威胁显得可信。参与人为改变博弈结果而采取的措施称为承诺(commitment),如果乙在甲违约时可以用法律武器,即“打官司”保护自己的利益,则双方的选择,以及相关的对对方选择的判断,都会发生变化,进而得到不同的博弈结果。假设打官司的结果是乙能收回本钱1万元,而甲则会失去全部采金收入。,乙打官司的得益比不打官司的得益大,因此即使不考虑惩罚见利忘义的甲的心理快慰,乙的唯一选择也是打官司。甲完全清楚乙的思路,知道乙打官司的威胁是可信的,因此甲符合个体理性的选择是分钱。此时,甲“分”的许诺成了可信的诺言。,在
11、乙的利益受到法律保障的情况下,甲的分钱许诺变成可信的许诺。这样,乙第一阶段选择“借”就成了合理的选择。最终结果是乙在第一阶段选择“借”,甲在第二阶段选择“分”,从而博弈结束。此时乙的完整策略是“第一阶段选择借,若第二阶段甲选择不分,第三阶段选择打官司”,甲的完整策略就是“第二阶段选择分钱”。这就是这个三阶段动态博弈的解。,乙的完整策略:第一阶段选择“投资”,若第二阶段甲选择“不分”,第三阶段选择“打”甲的完整策略:第二阶段选择“分”。动态博弈的解。,结论:在一个由都有私心、都更重视自身利益的成员组成的社会中,完善公正的法律制度不但能保障社会的公平,而且还能提高社会经济活动的效率,是实现最有效率
12、的社会分工合作的重要保障。但是要充分保障社会公平和经济活动的效率,法律制度必须要满足两方面的要求:一是对人们正当权益的保护力度足够大;二是对侵害他人利益者有足够的威慑作用。否则,法律制度的作用就是很有限的甚至完全无效。,如果第三阶段乙选择打官司,并不能收回自己的本钱,而且要进一步承受1万元的损失。此时乙在第三阶段打官司是一种不可信的空头威胁(Incredible Empty Threats)。甲非常清楚乙的这种思路,他知道乙第三阶段打官司的威胁并不是可信的,这样他在第二阶段分钱的许诺自然也就不可信了。乙非常清楚在第一阶段选择不借才是保险的。,三、法律保障不足的开金矿博弈III的扩展形,不可信的
13、空头威胁乙在第三个阶段“打官司”的威胁是一种不可信的空头威胁 (incredible empty threats),结论:在动态博弈问题中,各个博弈方的选择和博弈的结果,与各个博弈方在各个博弈阶段选择各种行为的可信程度有很大关系。有时候虽然有些博弈方很想或会声称要采取特定的行为,以影响和制约对方的行为,但如果这些行为缺乏以经济利益为基础的可信性,那么这些想法或声明最终就不会有真正的效力。,3.2.2 纳什均衡的问题,由乙的策略“第一阶段借,当甲第二阶段选择不分时,第三阶段选择打”,甲的策略“第二阶段无条件分”,构成的策略组合是一个纳什均衡。因为给定对方的策略,双方的策略都是符合自己最大利益的最
14、佳策略,单独偏离对自己都是不利的。在双方的策略下,乙第三阶段的“打”并不需要真正实施,但因为它是保证第二阶段甲会选择“分”的关键,因此乙的策略中必须包含这个选择,即使单独改变这个选择不会影响利益(给定甲没有想到也改变策略),乙也不能随便改变该选择。,3.2.2 纳什均衡的问题,博弈中(不投资-不打,不分)和(投资-打,分)都是纳什均衡。但后者不可信,不可能实现或稳定。为什么会出现这种情况呢?,其实,该博弈中 (不借-不打,不分)和(借-打,分)都是纳什均衡。但后者不可信,不可能实现或稳定。上述纳什均衡不稳定的原因,主要在于如果甲在第二阶段选择了“不分”而不是“分”,乙策略中设定的第三阶段“打”
15、是不可信的,不可能真正实施,理由是该行为对乙自身也是不利的,追求自身利益最大化的乙的理性不允许他这么做。甲只要稍作分析就可以掌握乙的这个弱点,因此不可能理睬乙策略中的“打”官司威胁,在第二阶段不会选择“分”。反过来,乙也不会愚蠢到想靠一个明显不可信的威胁撑腰,冒险将资金借给甲,因此他在第一阶段也不可能“借”。,结论:纳什均衡在动态博弈可能缺乏稳定性,也就是说,在完全信息静态博弈中稳定的纳什均衡,在动态博弈中可能是不稳定的,不能作为预测的基础。,Cont.,根源:纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定,不能解决动态博弈的相机选择引起的可信性问题,结论:纳什均衡在动态博弈可能缺乏稳
16、定性,也就是说,在完全信息静态博弈中稳定的纳什均衡,在动态博弈中可能是不稳定的,不能作为预测的基础。根源:纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定,不能解决动态博弈的相机选择引起的可信性问题。解决途径:动态博弈的有效分析概念,除了要符合纳什均衡的基本要求以外,还必须满足另一个关键的要求,即它必须能够排除博弈方策略中不可信的行为设定,也就是各种不可信的威胁和承诺。,2022/12/28,34,3.2.2.eg 空头威胁I,故事模型历史故事青年作家司马相如与寡妇卓文君相恋,遭到父亲反对。于是,私奔,后得到认可。博弈模型空头威胁Empty Threats会损害威胁者自己利益因而根本不会
17、实施的威胁,常见的例子有子女教育、夫妻关系、研究生复试等。,默认,结婚,断绝父女关系,文君,父亲,(-1,1),(0,-2),(1,-1),2022/12/28,35,3.2.2.eg 空头威胁II,市场进入博弈模型描述均衡结果(进入,默认)在位者打击进入者的威胁是空头的,不可置信的。,打击,不进入,进入,默认,进入者,在位者,(0,100),(50,50),(-10,30),2022/12/28,36,3.2.2.eg 空头承诺I,爱的承诺笑话故事有一位小伙子给心爱的姑娘写了一份情书:亲爱的,我爱你爱得如此之深,以至愿意为你赴汤蹈火,上刀山、下火海在所不惜。我非常想见到你,任凭艰难险阻也挡不
18、住我的脚步。本周六如果不下雨,我就来接你。5.12汶川大地震中的感人故事“先救他”“我会做你的左手”一对分不开的夫妻,最终合葬我们都应该记住,太动听的承诺是往往空头的。但是,我们也应该相信真爱。回顾在前述产品开发博弈中,均衡结果(不开发,(开发,开发)就是企业A的空头承诺,是不可置信的。,2022/12/28,37,3.2.2.eg 空头承诺II,回顾在前述产品开发博弈中,均衡结果(不开发,(开发,开发)就是企业A的空头承诺,是不可置信的。生活中的空头承诺学生对老师的承诺老师,这回让我过吧,以后我会好好学习的老师,先发表一篇达到毕业要求,以后一定会写核心期刊的山盟海誓爱你一万年海枯石烂包过包会
19、不过退款不会再学,2022/12/28,38,3.2.2.egm 空头威胁I,故事模型历史故事青年作家司马相如与寡妇卓文君相恋,遭到父亲反对。于是,私奔,后得到认可。博弈模型空头威胁Empty Threats会损害威胁者自己利益因而根本不会实施的威胁,常见的例子有子女教育、夫妻关系、研究生复试等。,默认,结婚,断绝父女关系,文君,父亲,(-1,1),(0,-2),(1,-1),39,2.2.2.egm 空头威胁II,市场进入博弈模型描述均衡结果(进入,默认)在位者打击进入者的威胁是空头的,不可置信的。,打击,不进入,进入,默认,进入者,在位者,(0,100),(50,50),(-10,30),
20、2022/12/28,40,3.2.2.egmp 承诺行动I,承诺行动Committed Actions使威胁或承诺可信的行动,采取承诺行动过后,实施威胁或承诺符合威胁者或承诺者的利益。在位者的承诺行动在潜在者进入之前,扩大生产能力这解释了现实中大部分垄断企业有闲置生产能力注意:是实实在在的扩大投资,而不是说说而已行胜于言!,扩大生产能力,打击,不进入,进入,默认,进入者,在位者,(0,100,70),(50,50,20),(-10,30,25),在位者,2022/12/28,41,3.2.2.emp承诺行动II,历史和生活中的承诺行动人质与通婚秦王赢政就是人质四大美女之一的王昭君就是政治通婚
21、康熙之女蓝齐儿更是政治牺牲品截断后路项羽破釜沉舟对秦军三国姜维对王经南宋韩世忠对李复恋爱婚姻中的承诺行动为什么要戴戒指?为什么要见双方朋友和双方父母?为什么有厚重的彩礼和隆重的婚礼?,2022/12/28,42,3.2.2.emp 承诺行动III,商业中的承诺行动订金与抵押订餐要交订金按揭购房要抵押质量承诺三包条款“假一赔十”价格承诺国美等补差价措施最后一天血价处理加薪策略不断接到猎头公司的电话信函不断接到竞争对手老总的邀请,2022/12/28,43,3.2.2.emp 承诺行动IV,绑架与劫持中的承诺行动绑架与劫持影视作品中的一种常见情节现实生活中也时有发生歹徒的威胁是空头的吗?可能是,因
22、为他们不想罪上加罪可能不是,因为他们要树立自己言出必行的声誉歹徒的承诺行动有哪些?电话里人质的痛苦和呐喊声照片、录像带、人质的衣物甚至器官警方的威胁是空头的吗?可能是,特别是不知道歹徒是谁的时候可能不是,一旦知道歹徒是谁在哪,2022/12/28,44,2.2.2.emp 承诺行动IV,绑架与劫持中的承诺行动对峙中的谈判拒绝谈判历史上拒绝谈判曾是一种高效方法,汉武帝和曹操都用过实际生活中拒绝谈判也是一种重要策略交出控制权是拒绝谈判的一种具体形式谈判中的承诺歹徒的承诺可信吗?职业歹徒的承诺是可信的,因为他们在树立和维护自己的声誉非职业歹徒的承诺可能也是可信的,因为他们可能不想罪加一等警方的承诺可
23、信吗?是,为了人质的安全不是,为了社会的正义,3.2.3 逆推归纳法,定义:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“逆推归纳法(Backwards Induction)”。逆推归纳法是动态博弈分析最重要、基本的方法。逆推归纳法的逻辑基础:动态博弈中先行为的理性的博弈方,在前面阶段选择行为时必然会考虑后行为博弈方在后面阶段中将会怎样选择行为,只有在博弈的最后一个阶段选择的,不再有后续阶段牵制的博弈方,才能直接作出明确选择。而当后面阶段博弈方的选择确定以后,前一阶段博弈方的行为也就容易确定了。,46,(0,0),3.
24、2.3.1 逆向归纳法I,逆向推理reasoning backward中美战略博弈均衡结果美不犯我,我不犯人我方具有后动优势,犯人,犯我,不犯我,犯人,不犯人,不犯人,美国,我国,我国,(2,-5),(1,-4),(-2,-3),47,3.2.3.2 逆向归纳法II,逆向推理reasoning backward新产品开发博弈均衡结果企业A开发,B不开发企业A具有先动优势,开发,开发,不开发,开发,不开发,不开发,A企业,B企业,B企业,(0,0),(0,1),(1,0),(-3,-3),48,3.2.3.3 逆向归纳法III,逆向推理reasoning backward求以下动态博弈的均衡结果
25、,右,下,上,前,后,左,甲,乙,甲,(2,0),(1,1),(0,2),(3,0),逆推归纳法的一般方法:从动态博弈的最后一个阶段开始分析,每一次确定出所分析阶段博弈方的选择和路径,然后再确定前一个阶段的博弈方选择和路径。逆推归纳到某个阶段,那么这个阶段及以后的博弈结果就可以肯定下来,该阶段的选择节点等于一个结束终端。,50,3.2.3.4 序贯理性与理性操纵I,序贯理性Sequential Rationality每一个行动点上都选择最优行为逆向归纳法遵循了序贯理性原则理性操纵Controlled Rationality利用对方的理性缺点,引诱对方上钩,获取利益有时候就是“大智若愚”比如,黄
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- exfd 经济 博弈论 完全 完美 信息 动态 博弈 ppt 课件
链接地址:https://www.31ppt.com/p-1966902.html