博弈论与企业策略.ppt
《博弈论与企业策略.ppt》由会员分享,可在线阅读,更多相关《博弈论与企业策略.ppt(51页珍藏版)》请在三一办公上搜索。
1、第十一章 博弈论与企业策略,一、博弈论概述(一)博弈论的研究对象 博弈论Game Theory研究决策主体的行为发生直接相互作用时的决策,以及这种决策的均衡问题,即,当一个主体的选择受到其他主体选择的影响,而且反过来影响到其他主体选择时的决策问题和均衡问题。(二)博弈论的发展历史 1944年,冯诺依曼Von Neumann和摩根斯坦Morgenstern合作的博弈论和经济行为The Theory of Games and Economic Behaviour 一书出版,提出了预期效用理论等概念,但与现代博弈论关系不大。,1950s,合作博弈发展到鼎盛时期,包括纳什Nash和夏普里Sharple
2、y1953 年的“讨价还价模型”,Gillies和Sharpley1953年关于合作博弈中的“核”core的概念等。同时,非合作博弈也开始创立,纳什在1950年和1951年发表了两篇关于非合作博弈的重要文章,杜克于1950年定义了“囚犯困境”prisoners dilemma,从而基本上奠定了现代非合作博弈的基础。1960s年代后,泽尔滕R.Selten把纳什均衡的概念引入了动态分析,提出了“精炼纳什均衡”的概念。海萨尼J.Harsanyi把不完全信息引入博弈论的研究。克瑞普斯Kreps和威尔逊Wilson 1982年合作发表了关于不完全信息动态博弈的重要论文。,专栏11-1:博弈论在微观经济
3、学中的重要性 1博弈论与新古典经济学 新古典经济学研究的是当外部条件既定时,单个厂商(消费者)的最大化决策问题,即在给定一个价格参数和成本(收入)的条件下,最大化其利润(效用),厂商利润(个人效用)函数只依赖于他自己的选择,而不依赖于其他人的选择;个人的最优选择只是价格和成本(收入)的函数,而不是其他人选择的函数。对单个人来说,其他人对其的影响都被总结在一个参数价格里,决策时,他既不考虑自己的选择对别人选择的影响,也不考虑别人选择对自己的影响。但是,新古典经济学的分析有两个假定条件:一是市场参与者数量足够多,从而市场是竞争性的;二是双方不存在信息不对称的问题。第一个条件在现实中并不具备,在市场
4、参与者人数有限的情况下,即在不完全竞争市场上,人们之间的行为是直接影响的,所以,一个人在决策时,必 须考虑对方的反应,这就是博弈论研究的内容。同时,当信 息不对称时,非价格制度会出现,其显著特征是,参与人之 间行为的相互作用,因此,博弈论又成为分析非价格机制的 重要工具。2博弈论与诺贝尔经济学奖(1)博弈论与诺贝尔奖的授予 1994年诺贝尔经济学奖授予了三位博弈论专家:纳什、泽尔 滕和海萨尼。而1983年,英国wheatsheaf出版社出版的,由 当代在世的最著名的经济学术史专家Mark Blaug根据社会科 学文献引证索引编写的一本经济学家名人录中,收录了 从1970年到1981年间在世的6
5、74位,去世的397位,共计 1071位经济学家的传记。在这本名人录中,没有纳什和泽尔 滕,只有海萨尼,但其名字下注着NE,即没有条款,原因是 他自己没有编写简历。而仅仅十几年后,三人就获得了诺贝,尔经济学奖,说明了博弈论和经济学发展的迅速。2005年度诺贝尔经济学奖则授予持有以色列和美国双重 国籍的罗伯特奥曼和美国公民托马斯谢林。瑞典皇家科学 院说,两位经济学家获奖是因为“他们通过对博弈论的分析 加深了我们对冲突与合作的理解”。这是自1994年之后,博 弈论学者再获诺贝尔经济学奖。谢林,执教于美国马里兰大 学经济学系,同时也是哈佛大学名誉教授。按照评委会的认 定,谢林的贡献,在于显示“某一方
6、可以显而易见地限制自 己的选择,以此强化自身的(竞争)地位;报复的能力可以 比之抵御攻击的能力更为有用;以及不确定的报复比之确定 的 报复更为可靠和更为有效。”评委会说,这些见解“已经证 明与化解冲突和努力避免战争有着相当大的关联”。奥曼执,教于耶路撒冷希伯来大学理性分析中心。奥曼和谢林之所以 一同获奖,是因为他们“以博弈论分析方式增进了我们对于 冲突与合作的理解。”具体到经济领域,他们帮助“解释了诸 如价格战和贸易战之类的经济冲突,以及为什么一些社区相 对于其他社区在管理共有资源方面更为成功。”(2)国外流行教科书中的博弈论 Hal Varian的微观经济分析Microeconomic An
7、alysis是一本在欧美非常流行的高级微观经济学教科书,几乎所有大学的研究生课程都用这本书。在1984年的第二 版中,没有博弈论,甚至书后词汇表中也没有“博弈论”一词。但在1992年第三版就加上了“博弈论”一章,而且有关寡头 竞争这一章也按博弈论理论重写了。,克瑞普斯David Kreps1990年出版的微观经济理论教程 A Course in Microeconomic Theory 是1991年最畅销的经济学教科书,被相当多欧美名牌大学选为研究生教材,其中第三部分就是“非合作博弈”,共219页,占全书的比重超过28%,其本人就是博弈论专家。1990年他因对博弈论的贡献获得美国“克拉克奖”C
8、lark Medel。泰勒尔Jean Tirole1988年出版的产业组织理论一书,是目前最受欢迎的、最流行的产业组织理论教科书,全书的内容都建立在非合作博弈的基础上,以至于作者不得不在最后加上一章“非合作博弈论”,供不熟悉的读者参考。,相关链接111 从日常生活看“博弈论”“博弈论”原本是数学的一个分支,但由于它较好地解 决了对于竞争等问题的可操作性分析,成为经济学中激荡 人心的一个研究领域。可以说,“博弈论”已经改变了经济 学的传统轮廓线。“博弈论”的英语原文是game theory,直译过来就是游戏论、运动论或竞赛论。譬如,在足球比 赛中,双方都想在努力巩固防守的同时,积极进攻以置对 方
9、于“死地”,这种行为就是一种博弈。“弈”在汉语中是下 棋的意思,下棋中的双方行为特征也如同足球比赛中双方 的行为。当然,扩展开来讲,企业之间的竞争、国家之间 的角力等,都是“游戏”,只是游戏的内容不同而已。我国古代有个“田忌赛马”的故事,说的是齐威王与大将田忌各出三匹马一对一比赛三场,由于齐威王的最优、次优和较差的三匹马分别跑得比田忌的三匹马快,所以田忌总是以0:3告负。后来田忌的谋士孙膑给田忌出主意,让,最差的马去与齐威王最快的马比,而让最优的马去赢齐威王次优的马,让次优的马去赢齐威王最差的马,这样便以2:1 取胜。但我们还可进一步设想,如果齐威王知道了田忌的花招后,便会在以后的比赛中也更改
10、出马的次序,当然田忌的出马次序也应改动。双方的出马次序怎样才是最合理的呢?这便是“博弈论”更深层次研究的问题了。2002 年度获奥斯卡大奖的影片枟美丽心灵枠中主角的原型,便是“博弈论”中纳什均衡的创立者约翰 纳什。影片中有这样一个情节:在美国普林斯顿大学的酒吧里,个男生正商量着如何去追求一位漂亮女生,当时还正在大学读书的纳什却在朦胧的“博弈论”思维逻辑引导下喃喃自语:“如果他们 个人全部去追求那漂亮女生,那她一定会摆足架子,谁也不睬。然后再去追其他女孩子,别人也不会接受,因为没人愿意当次品。但如果他们先追其他女生,那么漂亮女生就会感到被孤立,这时再追她就会容易得多。”在纳什眼里,追求女生就是一
11、场“博弈”,而“博弈”是要遵循一定的规则的,是需要“博弈”策略的。,我们再从经济决策上来看“博弈论”。假如你是一个公司的老总,你在决定是否将自己的产品降价以及降价多少时,必须首先要考虑至少以下几个方面的问题:消费者将会增加购买吗?大概会增加多少购买量呢?其他同种产品的厂家也会降价吗?等等。你只要是理性的话,一定会在对这些问题进行考虑的基础上来作出你的决策。所以说,“博弈论”主要是研究各相关行为主体的决策行为相互影响、相互作用的假定条件下,理性的行为主体如何决策,以及这种决策的均衡等问题的。在这里,决策均衡是一个经济学概念,意味着最佳决策或最佳决策的组合。因为只要决策是最佳的,相关的行为主体就不
12、会去改变它,从而使它处于稳定、均衡的状态。再简而言之,“博弈论”就是分析博弈行为和博弈决策的一门科学。资料来源:叶德磊:从日常生活看“博弈论”,文汇报,2005 年10月23 日。,(三)博弈的要素 构成博弈的要素主要包括参与人、行动、战略、支付、信息、均衡、结果等。1.参与人players 一个博弈中的决策主体,其目的是通过选择战略(或 行动),以最大化自己的支付(效用)水平。2.行动actions or moves 行动是参与人在博弈的某个时点的决策变量。1行动集合action set:可供某个参与人(i)选择的所有 行动的集合,写作Ai=ai。2行动组合action profile:n个
13、参与人的行动的有序集 a=(a1,ai,an)。3行动顺序the order of play:根据行动顺序,可以将博 弈分为静态博弈和动态博弈。因此,行动顺序对于博弈 结果非常重要。,3.战略strategies 参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动。战略与行动是不同的概念,战略是行动的规则而不是行动本身,战略要说明什么时候采取什么行动。例如“人不犯我,我不犯人;人若犯我,我必犯人”,就是一个战略,而“犯”与“不犯”是两种行动,这一战略规定了什么时候选择“犯”与“不犯”的行动。可以有的战略还包括:“人不犯我,我必犯人;人若犯我,我不犯人”;“人不犯我,我不犯
14、人;人若犯我,我还不犯人”;“人不犯我,我必犯人;人不犯我,我还犯人”等。在静态博弈时,战略与行动是相同的,因为作为参与人行动的规则,战略必须依赖于参与人获得其他参与人行动的信息,而在静态博弈中,双方同时行动,从而不可能获得对方行动的信息,因此战略选择就变成简单的行动选择。战略必须是完备的。它要给出参与人在每一种可想象到的情况下的行动选择,即使参与人并不预期到这种情况会实际发生。,(1)战略集合strategy set:某参与人i所有可选择的战略的 集合。Si=si。(2)战略组合strategy profile:n个参与人每人选择一个战 略的n为向量。s=(s1,si,sn)。4.支付pay
15、 off 在一个特定的战略组合下,参与人得到的确定的效用水 平,或者是指参与人得到的期望效用水平。支付是博弈参与人真正感兴趣的东西。博弈的一个基本特征是,一个参与人的支付不仅取决于 自己的战略选择,而且取决于所有其他参与人的战略选择。5.信息information 参与人有关其他参与人的特征、战略、行动、支付等的知识 共同知识common knowledge:“所有参与人知道,所有参与人知道所有参与人知道,所有参与人知道所有参与 人知道所有参与人知道”的知识。,6.均衡equilibrium 所有参与人的最优战略的组合,记为s*=(s1*,si*,sn*)。7.结果outcome 即博弈均衡产
16、生的博弈的最终后果,包括均衡及其支付。(五)博弈的分类 1.根据博弈参与人划分(1)单人博弈。其实质是个体的最优化问题,即在一定条 件下选择最优战略。单人博弈区别于两人博弈和多人 博弈的根本之处在于,博弈的信息越多,支付越高。(2)两人博弈。参与人为两人的博弈。(3)多人博弈。三个或三个以上参与人的博弈。其与单人 博弈和两人博弈最大的区别在于,可能存在“破坏 者”,即具有下列特征的参与人:其策略选择对自身支 付没有任何影响,但却会影响其他参与人的支付,有 时甚至是决定性的影响,如奥运会申办。,2.根据战略划分(1)有限博弈(finite game)。一个博弈被称为有限博 弈,如果,第一参与人个
17、数是有限的;第二,每个参与 人可选择的纯战略是有限的。它可以用矩阵式、扩展 式,甚至罗列方式表示。(2)无限博弈(infinite game)。不符合上述两个条件的博 弈。一般用数集或函数式表示。3.根据支付划分(1)零和博弈。无论各参与人如何决策,最后的社会总支付,即各参 与人支付之和总是为零。如猜谜游戏。一是各参与人之间的 利益是对立的,相互之间难以和平共处;二是各参与人为了 多得利益,总不希望对方知道自己选择的战略,因此,这种 博弈的结果是不能完全确定的;三是即使进行重复多次的博 弈,也不会产生新的机会或可能。,(2)常和博弈。各参与人支付之和总是等于一个非零常数。如分配固定 数额的奖金
18、。各参与人之间的利益关系也是对立的,但较易 取得妥协,因而往往有一个确定的结果。在重复博弈中,由 于总支付增加,会创造出许多新结果。(3)变和博弈。在不同的战略组合下,各参与人支付之和是不同的。是 博弈的一般形式。4.根据参与人行动次序划分(1)静态博弈。参与人同时进行战策选择、同时行动;虽然各参与人做 出决策的时间不一定真正一致,但至少在其作出各自选择前 都不知道其他参与人的战略选择;或在指导其他参与人战略 选择后不能改变自己已经做出的选择。,(2)动态博弈。各参与人先后、依次进行选择、行动,而且后选择、行动的参与人在自己选择前一般能看到此前其他参与人的选择、行动的博弈。参与人之间存在不对称
19、性。后行为的参与人可根据先行动的参与人的行动作出针对性选择,而先行动的参与人在决策时,不但看不到后行动参与人的选择,而且还要考虑后行动参与人的反应。(3)重复博弈。同一博弈反复进行所构成的博弈过程。构成重复博弈的一次性博弈称为“原博弈”或“阶段博弈”,其一般是静态博弈。重复博弈的最少重复次数是两次。其中,到一定重复次数后肯定要结束的重复博弈称为“有限次重复博弈”。而无限次重复进行的博弈叫“无限次重复博弈”。在重复博弈中,考察的重点不是某一次重复的结果或支付,而是原博弈重复进行后的总体效果或平均效果,因此,不能把重复博弈割裂为一次次独立的博弈进行分析,而是要将它们作为一个完整的过程和整体进行分析
20、,因此,重复博弈是一种特殊的动态博弈。在重复博弈中,一次静态博弈中的均衡可能会发生变化。,5.根据参与人对其他参与人等的信息划分(1)完全信息博弈(complete information)。若各参与人都完全了解所有参与人的特征、战略、行动,以及在每种战略组合下的支付,并且不存在事前的不确定性,该博弈称为“完全信息博弈”。(2)不完全信息博弈(incomplete information)至少存在部分参与人不完全了解其他参与人相关情况的博弈,称为“不完全信息博弈”。6.根据参与人对博弈进程信息,对动态博弈进行划分(1)动态博弈中,若某参与人行动时,对此前行动的各参与 人(包括“自然”)的选择、
21、行动完全了解,称为“具有完美 信息的”参与人。若其不完全了解此前全部的博弈进程,称 为“具有不完美信息的”参与人。,(2)如果动态博弈中的所有参与人都是具有完美信息的,则 该动态博弈称为“完美信息动态博弈”,perfect information。若动态博弈中存在具有不完美信息的参与人,该博弈称为“不 完美信息动态博弈”,(imperfect information)。二、完全信息静态博弈(一)博弈的战略式表述(strategic form representation)1.战略式表述又称为标准式表述normal form representation 在这种表述中,所有参与人同时选择自己的战
22、略,所有参 与人选择的战略一起决定每个参与人的支付。需要注意得 是参与人“同时选择”的是战略,是参与人行动的全面计划 和准则,而不是行动。因此,战略式表述也可以用来描述 动态博弈。,2.战略式表述的组成及表示(1)博弈的参与人集合:i;=(1,2,n)(2)每个参与人的战略空间:Si,i=1,2,n;(3)每个参与人的支付函数:ui(s1,si,sn),i=1,2,n。所以,G=S1,Sn;u1,un代表战略式表述博弈。3.两人有限博弈的战略式表述的矩阵表述 例:囚犯困境prisoners dilemma,(二)占优战略均衡 1.占优战略(dominant strategy)是指无论其他参与人
23、选择什么战略,该参与人的最优战略是唯一的,这样的最优战略被称为“占优战略”。例如,在“囚犯困境”中,“坦白”是囚犯A的占优战略,“坦白”也是囚犯B的占优战略。2.占优战略均衡(dominant-strategy equilibrium)是指在一个博弈里,如果所有参与人都有占优战略存在,则所有参与人占优战略所组成的战略组合称为“占优战略均衡”。例如,在上例“囚犯困境”中,(坦白,坦白)就是占优战略均衡。这时,个人理性与集体理性产生了冲突。需要注意得是占优战略均衡只要求每个参与人是理性的,不要求“每个参与人是理性的”是共同知识。,(三)重复剔除的占优均衡 1.例子:“智猪博弈”在绝大多数博弈中,占
24、优战略均衡是不存在的。在“智猪博弈”中,按下按钮可有8个单位食物,但要支付2单位成本。若大猪先到,大猪吃7个单位,小猪吃1个单位;小猪先到,各吃4个单位;同时到,大猪吃5个单位,小猪吃3个单位。本例中,尽管“等待”是小猪的占优战略,但大猪没有占优战略,因此,本博弈没有占优战略均衡。,2.重复剔除严格劣战略和重复剔除的占优均衡(iterated dominance equilibrium)(1)劣战略 第一,严格劣战略 1)定义 令si和si是参与人i可选择的两个战略(即 siSi,siSi)。如果对于任意的其他参与人的 战略组合s-i,参与人i从选择si得到的支付严格小于从 选择si得到的支付
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 企业 策略
链接地址:https://www.31ppt.com/p-4517848.html