经济博弈论.ppt
《经济博弈论.ppt》由会员分享,可在线阅读,更多相关《经济博弈论.ppt(195页珍藏版)》请在三一办公上搜索。
1、经济博弈论教程,1博弈导论,1.1博弈和博弈论1.1.1概念“博弈论”译自英文Game Theory。其实Game的基本意义是游戏,因此Game Theory直译应该是“游戏理论”。进一步观察还可以归纳出游戏的下列四个共同特征:第一,都有一定的规则。第二,有一个结果。而且结果常能用正或负的数值表示,至少能按照一定的规则折算成数值。第三,策略至关重要。第四,策略有相互依存性。因此博弈论在我国有时也常被称为“对策论”,具体的博弈问题则被称为“对策”问题。,1.1.2定义现在,我们来给博弈下一个定义:博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允
2、许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。规定或定义一个博弈需要设定下列几个方面:(1)博弈的参加者。(2)各博弈方各自可选择的全部策略或行为的集合。(3)进行博弈的次序。不同的次序必然是不同的博弈。(4)博弈方的得益。结果无法量化为数量的决策问题不能放在博弈论中研究。,博弈的基础1、“个体行为理性”-是指个体的行为始终都是以实现自身的最大利益为唯一目标,除非为了实现自身最大利益的需要,否则不会考虑其他个体或社会的利益这样一种决策原则。2、“非合作博弈”-是指在各博弈方之间不能存在任何有约束力的协议,也就是说各博弈方不能公然“串通”、“共谋”的博弈问题。事实上,在我
3、们证明非合作博弈无效率或低效率的同时,就自然说明了存在着合作的可能性和必要性。,1.2几个典型的博弈问题,1.2.1 囚徒的困境,由于这种结果在一次/有限次博弈中具有必然性,无法摆脱,因此叫做“囚徒困境”。启示:当一个社会中的每个个体都只为自身的利益打算时,即使大家都遵守社会规则,个体的行为是不一定符合集体的或社会的利益的,甚至也不一定真能实现个体的最佳利益,即使追求个体利益的动机变为实现社会最大利益的手段的“看不见的手”并不总是存在的。,双寡头削价竞争,这个博弈的最终结果一定是两寡头都采用“低价”策略,即(70,70)。由于双方无法信任对方,即使彼此都完全清楚利害关系和相应的得益,也无法改变
4、这种结局,因此也是一种“囚徒困境”。,1.2.2 赌胜博弈,1、齐威王与田忌赛马,首先,各方不能让对方猜中自己的策略。其次,6种策略本身相互之间并无优劣之分,有依存性。因此,各方应以相同的概率选用。,1.2.3 关于产量决策的COURNOT(古诺)模型,设市场上有 n个厂商,厂商I的产量为qi,整个市场总产量Q=qi,能够将商品全部销出的“市场出清价格”是投放到该市场上的该种商品总量的函数,商品总量越大,市场出清价格就越低,而商品的总量当然就是这n个厂商各自产量的总和。市场出清价格P=P(Q),因此,P=P(Q)=P(qi),得益就是生产的利润,也就是销售收益减去成本后剩下的余额。厂商i的收益
5、为qi*P=qi*P(qi),设每个厂商的平均单位成本为C,因此厂商I生产qi产量的得益为:qi*P(qi)-C*qi=qi*P(qi)-C可见,厂商I的得益不仅取决其自身的产量和成本,还通过价格取决于其他厂商的产量决策,即显示出策略的相互依存性。如果我们假设产量是连续可分的(这时数学处理和讨论较容易),则即使将超过厂商生产能力的不可能的产量去掉以后,每个厂商还都有无限多种可供选择的产量。所以此类问题要用函数表示。,1.3 博弈结构和博弈分类,1.3.1 博弈中的博弈方博弈中独立决策、独立承担博弈结果的个人或组织称为博弈方。1、单人博弈所谓单人博弈就是指只有一个博弈方的博弈。严格地讲,单人博弈
6、已经退化为一般的最优化问题。,单人迷宫,单人迷宫博弈的扩展形,商人的运输路线博弈,走水路的期望得益为:(-7000)*75%+(-16000)*25%=-9250因为925010000,应选水路。若多次碰到同样的决策选择并每次都这样决策,则平均每次费用应接近9250。注释:“风险中性”类型的,即1单位期望得益和1单位确定的得益对他来说是等价的。一种称为“风险偏好”,持这种态度的人认为1单位的期望得益于1单位确定的得益;另一种则正好相反,认为1单位期望得益不如1单位确定的得益,称为“风险规避”。事实上,当博弈方数量达到两个以上后,信息越多得益越大的结论就不一定成立了。,两人博弈第一,需要我们注意
7、的是两人博弈中的两个博弈方之间并不总是相互对抗的,有时候也会出现两博弈方的利益是一致的情形。第二,在两人博弈中,掌握信息较多并不能保证得益也一定较多。第三,我们在囚徒的困境博弈中已经证实了结论:个人追求自身最大利益的行为常常并不能导致实现社会的最大利益,也常常不能真正实现自身的最大利益。,多人博弈有三个或三个以上博弈方参加的博弈我们称为“多人博弈”。在三人以上博弈中还有一个与两人博弈有本质区别的特别,即可能存在“破坏者”。所谓破坏者即一个博弈中具有下列特征的博弈方:其策略选择对自身的得益没有任何影响,但却会影响其他博弈方的得益,有时这种影响甚至有决定性的作用。扩展形适合表示许多多人博弈,特别是
8、动态多人博弈。,用矩阵表示三方博弈,1.3.2 博弈中的策略,博弈中的策略就是博弈中的各博弈方的决策内容,也就是对行为、经济活动水平等等的可能的选择。分为:有限策略博弈和无限策略博弈。无限策略博弈一般只能用函数方式加以表示。1.3.3 博弈中的得益指参加博弈的各方从中获得的利益,因此得益也是有正有负的。1、零和博弈这种博弈的特点是不管各博弈方如何决策,最后的社会得益,即各博弈方得益之和总是为0。零和博弈的特别是各博弈方之间的利益总是相对立的,是“你死我活”的关系,因而相互之间很难和平共处。,因为零和博弈即使重复进行多次也无法改变博弈方之间相互对立的关系。2、常和博弈与上述零和博弈不同,在有些博
9、弈中,每种结果之下各博弈方的得益之和不等于0,但总是等于一个非零常数,这也是一类有特殊意义的博弈,我们称之为“常和博弈”。当然零和博弈本身可被看作是常和博弈的特例。与零和博弈一样,常和博弈中各博弈方之间的利益关系也是对立的,因此这些博弈方之间的基本关系也是竞争。利益的对立性体现在利益的多少。3、变和博弈零和博弈和常和博弈以外的所有博弈都可被称为“变和博弈”。变和博弈即意味着不同策略组合(结果)下各博弈方的得益之和一般是不相同的。变和博弈是最一般的博弈类型,而常和博弈和零和博弈则都是它的特例。,这也就意味着在博弈方之间存在互相配合(不是串通,是指在利益驱动下各自自觉、独立采取的合作态度及行为),
10、争取较大的社会总得益和个人得益的可能性。1.3.4 博弈的过程静态博弈所有博弈方同时或可看作同时选择策略的博弈我们称为“静态博弈”。动态博弈我们把这种各博弈方不是同时,而是先后、依次进行选择、行动,而且后选择、行动的博弈方在自己选择行动之前一般能看到此前其他博弈方的选择、行动的博弈称为“动态博弈”。因此在博弈方之间肯定是有某种不对称性的。因而动态博弈中各博弈方的“策略”就是指这种计划,因此策略与选择、行为之间不能简单等同。,动态博弈举例,重复博弈所谓重复博弈实际上就是同一个博弈反复进行所构成的博弈过程。构成重复博弈的一次性博弈我们称为“原博弈”或“阶段博弈”。因此重复博弈的最少重复次数是两次。
11、这种到一定重复次数后肯定要结束的重复博弈称为“有限次重复博弈”;否则为“无限次重复博弈”。在重复博弈中,我们关心的不是某一次重复的结果或得益,而是原博弈重复进行以后的总体效果或平均效果,也就是说,重复博弈给博弈提供了新的实现更有效率的结果的可能性,重复博弈的重复次数越多,这种可能性就越大。主要因为各方都担心对方在未来的报复,从而目前只能试图合作。,1.3.5 博弈的信息结构,1.关于得益的信息博弈中最重要的信息之一就是关于得益的信息,即每个博弈方在每种结果(策略组合)下的得益情况。一般地,我们将博弈中各博弈方都完全了解所有博弈方各种情况下得益听博弈称为“具有完全信息的博弈”,而将在博弈中至少存
12、在部分博弈方不完全了解其他博弈方得益情况的博弈称为“具有不完全信息的博弈”。,2.关于博弈进程的信息动态博弈中如果轮到行为的博弈方对博弈的进程,即此前行为的各博弈方的行为完全了解,我们称这样的博弈方“具有完美信息的”博弈方,如果动态博弈中的所有博弈方都是具有完美信息的,则该动态博弈称为“完美信息的动态博弈”。动态博弈中轮到行为的博弈方不完全了解此前全部博弈进程时,我们称这样的博弈方“具有不完美信息的”博弈方,有这样的博弈方的动态博弈则称为“不完美信息的动态博弈”。,1.3.6 博弈方的能力和理性,博弈方最主要的行为逻辑包括:他们决策行为的根本目标和他们追求目标的能力。个体理性-以个体利益最大为
13、目标,且有准确的判断选择能力。一、完全理性和有限理性完全理性-以个体利益最大为目标,有完美的分析判断能力和不会犯选择行为的错误。有限理性-博弈方的判断选择能力有缺陷。如果博弈方是有限理性的,那么以完全理性为基础的博弈分析就可能部分失效。,二、个体理性和集体理性,集体理性指至少有部分决策者追求集体利益最大化的情况。一般而言,集体利益最大化不是博弈方的根本目标,人们的行为准则是个体理性。允许存在有约束力协议的博弈称为合作博弈;不允许存在有约束力协议的博弈称为非合作博弈。非合作博弈受重视的原因:1、主导人们行为的基石是个体理性。2、如果证明了非合作博弈的无/低效率,自然就说明了合作的必要性。,第二章
14、 完全信息静态博弈,所谓完全信息静态博弈即各博弈方同时决策,且所有博弈方对博弈中的各种情况下的得益都完全了解的博弈问题。2.1.基本分析思路和方法2.1.1 上策均衡某博弈中,如果不管其他博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终好于其他策略,至少比低于其他策略,则该策略即为“上策”。如果一个博弈的某个策略组合中的所有策略都是各方各自的上策,那么它必然是比较稳定的结果-上策均衡,2.1.2 严格下策反复消去法,对博弈中的任何博弈方都很可能存在这样的情况:不管其他博弈方的策略如何变化,自己的某一策略给他带来的得益总是比其他某些(不必是全部)策略给他带来的得益要小,该“某一策略”我们
15、称为相对于“其他某些策略”的“严格下策”。若对一个博弈运用严格下策反复消去法后,该博弈的策略组合中只有唯一一个的幸存下来,这个幸存的策略组合就是该博弈的结果。严格下策反复消去法有时失效,这是因为由于存在策略间的相互依存性,所以往往不存在绝对的策略优劣关系。,严格下策反复消去法应用举例(1),严格下策反复消去法应用举例(2),严格下策反复消去法有时失效的原因在于有些博弈中的不同策略往往不存在绝对的优劣关系,而是相对的优劣关系。2.1.3 划线法其思路是:先找出自己针对其他博弈方每种策略的最佳对策,然后在此基础上,通过对其他博弈方策略选择的判断,预测博弈可能的结果和确定自己的最优策略。,划线法举例
16、-1,划线法举例-2(有解/无解),划线法举例-3(夫妻之争/题目),划线法举例-3(夫妻之争/结论),该博弈有稳定的解,而无确定的解。,2.1.4 箭头法,其基本思路是:对博弈中的每个策略组合进行分析,考察在每个策略组合处各博弈方能否通过单独改变自己的策略而增加得益。,箭头法举例-1,箭头法举例-2,2.2 纳什均衡,一、纳什均衡我们常用G表示一个博弈;如G 有n个博弈方,每个博弈方的全部可选策略的集合称为“策略空间”,分别用S1,S2,Sn表示;Sij 表示博弈方i 的第 j 个策略,其中 j 可取有限值也可取无限值;博弈方 i 的得益用 ui 表示。n个博弈方的博弈常写成G=S1,.Sn
17、;u1,.un。,定义:在博弈G=S1,.Sn;u1,.un中,如果由各个博弈方的各一个策略组成的某个策略组合(s1*,.sn*)中,任一博弈方 i 的策略 si*,都是对其余博弈方策略的组合(s1*,.,si-1*,si+1*,sn*)的最佳对策,即ui(s1*,.,si-1*,si*,si+1*,sn*)=ui(s1*,.,si-1*,sij,si+1*,sn*)对任意 sijSi 都成立,则称(s1*,.sn*)为 G 的一个“纳什均衡”(Nash Equilibrium)。,简单地讲,我们前述各博弈方都不愿单独改变策略的策略组合就是纳什均衡。求解博弈的主要关键在于寻找各博弈方都不愿或不
18、会单独改变自己策略的策略组合,只要这种策略组合存在且是唯一的,博弈就有绝对确定的解(纳什均衡)定理1:在n个博弈方的博弈 G=S1,.Sn;u1,.un 中,如果严格下策反复消去法排除了除(s1*,.sn*)之外的所有策略组合,那么(s1*,.sn*)一定是该博弈唯一的纳什均衡。定理2:在 n 个博弈方的博弈G=S1,.Sn;u1,.un 中,如果(s1*,.sn*)是 G 的一个纳什均衡,那么严格下策反复消去法一定不会将它消去。,2.3 无限策略博弈分析,2.3.1 古诺的寡头模型设一市场有1、2两家厂商生产同样的产品。如果厂商1的产量为q1,厂商2的产量为q2,则市场总产量Q=q1+q2;
19、设市场出清价格是市场总产量的函数P=P(Q)=8;再设两厂商的平均单位成本相等c1c2。最后求两厂商如何同时决定各自的产量。,求解古诺模型,U1=q1P(Q)c1q1=q18(q1+q2)2q1=6q1q1q2q12U2=q2P(Q)c2q2=q28(q1+q2)2q2=6q2q1q2q22Max(6q1q1q2q12)Max(6q2q1q2q22)6q2*2q1*=06q1*2q2*=0q1*=q2*=2Q=2+2=4 U1=U2=4,检验古诺模型的效率,假设市场上只有一个厂商,看它会如何决策。因为另一家产量为零,意味着另一家垄断市场,我们讲的市场总体利益与独家垄断的利益是一致的。U=P(Q
20、)cQ=Q(8Q)2Q=6QQ2Q*=3 U*=9(与上述结果相比较)各生产者一半实现最大利润的总产量的策略组合(1.5,1.5)不是两厂商时的纳什均衡,也就是说,在这个策略组合(产量组合)下,双方都可以通过独自改变(增加)自己的产量而得到更高的利润,进而实现(2,2)的产量组合,这实际上又陷入了“囚徒困境”。古诺模型在现实中最好的例子就是石油输出国组织的限额和突破。,2.3.3 伯特兰德(Bertrand)寡头模型,该模型研究的商品间具有很强的同质性和替代性,造成消费者对价格极为敏感,于是价格竞争成为寡头企业惯用的竞争手段。这就是典型的经营同质商品商家间围绕商品价格而开展竞争的伯特兰德(Be
21、rtrand)模型。这种情况我们可假设当商家1和商家2价格分别为P1和P2时,他们各自的需求函数用q1=q1(P1,P2)=a1b1P1d1P2和q2=q2(P1,P2)=a2b2P2+d2P1来表示,其中d1、d20表示两商家商品具有一定替代性的替代系数,a1、b1、a2、b2为相应系数。并且,假设两商家无固定成本且边际成本分别为c1和c2,以及两商家同时决策。,在该博弈中,两博弈方为商家1和商家2;他们各种的价格策略空间为s1=0,P1max和s2=0,P2max,其中P1max和P2max是商家1和商家2还能卖出商品的最高价格,两博弈方各自的利润(u1,u2)都是双方价格的函数。u1u1
22、(P1,P2)P1q1c1q1(P1c1)q1(P1c1)(a1b1P1d1P2)u2u2(P1,P2)P2q2c2q2(P2c2)q2(P2c2)(a2b2P2d2P1),我们用反应函数的概念解该博弈。利用上述利润函数在偏导数为0时有最大值可解得两商家针对对方价格策略的反应函数分别为:P1=(a1+b1c1+d1P2)/2b1P2=(a2+b2c2+d2P1)/2b2纳什均衡(P1*,P2*)必是两反应函数的交点,即:P1*=(a1+b1c1+d1P2*)/2b1P2*=(a2+b2c2+d2P1*)/2b2解此方程组,得:P1*=d1(a2+b2c2)/(4b1b2d1d2)+2b2(a1
23、+b1c1)/(4b1b2d1d2)P2*=d2(a1+b1c1)/(4b1b2d1d2)+2b1(a2+b2c2)/(4b1b2d1d2)且(P1*,P2*)为该博弈唯一的纳什均衡。,通过分析可知,当两商家价格策略为(P1*,P2*)时,任何一方都不能通过单方面背离该策略来提高自己的利润;且当双方商品具有很强的同质性与替代性,导致消费者对价格非常敏感时,两商家唯一确定的价格策略是将价格降至其可以维持的最低水平。需要指出的是,这种情况下的纳什均衡(P1*,P2*)和囚徒困境一样,是一种低效率的均衡,远不如各博弈方通过协商、合作可能得到的最佳结果。,2.3.4公共资源问题,在经济学中,所谓公共资
24、源是指具有:(1)没有哪个个人、企业或其他组织拥有;(2)大家都可自由利用这两个特征的自然资源或人类生产的供大众免费使用的设施和财货。这里所讨论的公共资源是大家都可以自由免费利用的严格意义上的公共资源。在人们完全从私人动机出发自由利用公共资源时,公共资源倾向于被过度利用、低效率使用和浪费,并且过度利用会达到使任何利用它的人都无法得到多少实际好处的程度。,设某村庄有n个农户,且该村有一片公共草地。由于草地面积有限,只能让不超过某一数量的羊吃饱,如果实际的羊数超过这个限度,则每只羊无法吃饱,甚至还会饿死。假设农户夏天在草地放羊,而在春天决定养羊数,且彼此不知道其他方的决策信息,这就构成n个农户之间
25、关于养羊数的静态博弈。为了简单起见,假设 n=3,即有3 个农户,每只羊的产出函数为V=100-Q=100-(q1+q2+q3),而购买和照料每只羊的成本c=4。这时3个农户的得益函数分别为:,U1=q1100-(q1+q2+q3)-4q1U2=q2100-(q1+q2+q3)-4q2U3=q3100-(q1+q2+q3)-4q3求得3个农户各自对其他两农户策略的反应函数,得:q1=48-0.5q2-0.5q3 q2=48-0.5q1-0.5q3 q3=48-0.5q1-0.5q2以上方程组的解就是纳什均衡。即 q1=q2=q3=24 u1=u2=u3=576,检验公共资源博弈的效率,设该草地
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 经济 博弈论

链接地址:https://www.31ppt.com/p-2951035.html