《身边的博弈论:博弈论与信息经济学浅说》第一稿未定稿(1).docx
-
资源ID:1645010
资源大小:154.89KB
全文页数:66页
- 资源格式: DOCX
下载积分:16金币
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
《身边的博弈论:博弈论与信息经济学浅说》第一稿未定稿(1).docx
4身边的博弈论:博弈论与信息经济学浅说第一稿(未定稿,为北京师范大学出版社某丛书所作)余治国 编著(中国民营企业批判当代中国出版社,转型力:中国企业转型之道清华大学出版社,目前正在创作企业与企业家道德国家行政学院出版社)目录序 言 大博弈的思维观2第一章 什么是博弈论:从秦始皇统一天下谈起31秦始皇因何统一天下?32博弈是一种竞合游戏53博弈论不是“万金油”7第二章 纳什均衡、纯策略与混和策略81从围棋定式谈纳什均衡82从爱情故事谈起:优势策略与房地产开发博弈103房地产博弈、警察捉小偷博弈与纳什均衡114位置博弈与商家策略125猎鹿模型的合作哲学13第三章 “囚徒困境”的启示141“囚徒困境”的深刻哲理142经济自由与效率163“囚徒困境”的破解:无限次重复博弈与有限次重复博弈174威胁、承诺、作弊与惩罚195国家法律206猴子的故事与道德约束217爱克斯罗德试验、针锋相对的策略228.合作、利他主义与爱克斯罗德试验的局限23第四章 “智猪博弈”:对诸多现象的解释251“智猪博弈”的故事252“智猪博弈”与激励机制设计263企业战略与“智猪博弈”274证券市场中的“智猪博弈”28第五章 常见的博弈案例291“斗鸡博弈”与“骑虎难下”292银行会垮掉吗?313如何以弱胜强?324公共地悲剧345少数人博弈与酒吧问题356房地产市场的多人博弈36第六章 信息经济学基础371.信息有价372. 从形象工程谈道德风险393逆向选择的困境:二手车市场为何建立不起来?414.声誉、信号传递与制度设计425所罗门故事与信息甄别44第七章 讨价还价的策略461从情侣博弈谈起462先发优势与后发优势473谈判的要诀:掌握对方心理与妥协484独裁者博弈与劳资谈判49第八章 如何做好一个老板501管理需要建立预期502奖罚分明513强强如何有效联合?534如何接到一个项目?54第九章 民主的悲剧551.社会选择的形式552.非排序式投票563孔多塞投票法则584BORDA法则及其他605投票操纵的方法:民主的悖论606阿罗不可能定理62参考文献:64序 言 大博弈的思维观对于许多非数学专业和经济学专业的人们来说,博弈论可能是一个极为陌生的概念。但在国外,博弈论作为现代经济学的前沿领域,已成为占据主流的基本分析工具。1994年诺贝尔经济学奖即授予三位博弈论专家,1996年诺贝尔经济学奖又授予两位与博弈论一脉相承的信息经济学的开拓者。经济学的三次重大的“革命”,分别是“边际分析革命”、“凯恩斯革命”与“博弈论革命”。博弈论与信息经济学的产生与发展引发了一场深刻的经济学革命,博弈论与信息经济学代表着一种新概念、新方法论、新分析方法和一种全新的思想。经济学家凯恩斯1936年在就业利息与货币通论写过这样一段深刻的话,“经济学家和政治哲学家的思想,不管是正确的还是错误的,其力量之大,往往超出常人意料。事实上,统治这个世界的就只是这些思想。许多实践家自以为绝不受任何知识的影响,却往往当上了一些已故经济学家的奴隶。执政的狂人,自称听到了上帝的指示,实际上却是从若干年前一些学术界劣等思想家那儿拾取了一些怪诞的想法.比起思想的逐渐侵蚀力来,既得利益的势力被过分夸大了。”由此可见,博弈论的思想比任何技术性的分析都要重要。实际上,博弈之道是古已有之,但博弈思想的系统化、数学化却是近几十年的事。正是因为博弈科学是一门新学科,我国管理界、经济界对博弈论与信息经济学的研究还是停留在引进介绍层面上,他们发表的成果大多堆砌庞杂的数学算法与令人眩目的数学模型。虽然博弈论与信息经济学在中国已是一门显学,但却逐渐变成阳春白雪、弃之不用的高深学问或是概念混乱而被滥用到极至。博弈论与信息经济学不仅仅能在学术领域中光彩夺目,在其它领域如军事、管理、体育、政治、公关、个人生活中同样能得到充分利用,甚至在生物学中都可以觅其踪迹。在普通的企业管理中,经营者要熟练地掌握管理之术,必须能够自动自发并自觉地运用博弈论与信息经济学。在日常生活中,人们可以博弈论与信息经济学得思想方法赖分析甚而解决实际问题。正是因为如此,诺贝尔经济学奖获得者保罗·萨缪尔逊(Paul Samuelson)说:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解。”笔者试图在这本小册子中用最浅显的语言描述博弈论与信息经济学的大概思路方法,能用语言可以描述的就尽量少用或不用数学,因此笔者未对博弈论与信息经济学作数学化、系统的证明与阐述。但是,只有这样才能够使似乎高深的博弈论与信息经济学思想很轻松地为普通读者所掌握,并能够让读者应用其思想方法来分析甚至是能够解决身边的实际问题。笔者这里还要解释一下书名的由来,“身边的博弈论”并不是说读者身边看到感受到的博弈论,这样理解未免过于狭窄。这里“身边的博弈论”的含义是,人们身边无处不在的博弈哲学,无论是直接感受到还是从未接触过的社会、政治、法律、军事、经济、管理等现象。由于笔者本人学识有限,对博弈论与信息经济学的理解与研究尚不深刻,错误在所难免,敬请博弈论与信息经济学的方家高人指点,以免贻误广大读者。 余治国2005年9月谨识于安徽工业大学第一章 什么是博弈论:从秦始皇统一天下谈起1秦始皇因何统一天下?2000多年前,雄才大略的秦始皇第一次统一了中国大地,并创建了当时世界上最庞大的帝国,得以名垂青史。从当时的历史条件来看,秦国虽然在商鞅变法之后实力大增,但其经济、政治、军事实力是远远不能与六国总和相匹敌的。这种情况下,六国与秦国的形势就产生了两种针锋相对的可能:其一,六国采用“合纵”政策对抗秦国,也就是各国缔结军事盟约,共同抵御秦国的侵略,秦国若对任一国家发动侵略,其它国家必须无条件出兵营救;其二,六国采用“连横”政策与秦国妥协,也就是各国都与秦国签订友好互助条约,保持双边和平关系。当时七国之中,只有齐国实力比秦国稍逊一筹,成为六国军事同盟的核心。一旦齐国放弃“合纵”政策,六国的军事同盟就土崩瓦解。真实的历史也证明了这一点,秦国对六国联盟的破坏正是从齐国开始的。在这种情况下,秦国与齐国都有两种战略政策可以选择,那就是“合纵”与“连横”。秦国如果默许六国“合纵”,齐国采用“合纵”政策,结果是秦国势力扩张被遏制,而齐国成为六国领袖,势力得以扩张。秦国采取“连横”政策,齐国仍然采取“合纵”政策,结果是秦国与六国处于对峙状态。秦国默许六国“合纵”,齐国却采用“连横”政策与秦国示好,结果是秦国没有吞并六国的野心自然无法一统天下,齐国的势力也没有得以扩张。而历史的真相是,秦国采取“连横”政策,齐国默许秦国的“连横”政策并与秦国建立友好外交关系,齐国最终被灭,千古一帝秦始皇得以名扬千秋。秦国与六国集团之间的争斗实质上就是一种博弈。秦国与齐国之间的战略政策选择正是为了在保持自身能够生存的基础上谋取更大的利益甚至是统一天下。有利益的争夺是博弈的目的,也是形成博弈的基础。经济学的最基本的公设就是经济人或理性人的目的就是为了收益最大化,参与博弈的博弈者正是为了自身收益的最大化而互相争斗。参与博弈的各方形成相互竞争相互对抗的关系,以争得利益的多少决定胜负,一定的外部条件又决定了竞争和对抗的具体形式,这就形成了博弈。如象棋对局的参与者是以将对方的军为目标,战争的目的是为了胜利,古罗马竞技场中角斗士在争夺两人中仅有的一个生存权,企业经营的目的是为了生存发展,而股市中人们所争的很实在,就是金钱。从经济学角度来看,有一种资源为人们所需要,而资源的总量具有稀缺性或是有限的,这时就会发生竞争,竞争需要有一个具体形式把大家拉在一起,一旦找到了这种形式就形成了博弈,竞争各方之间就会走到一起开始一场博弈。孙子兵法上说,“知己知彼,百战百胜。”,可见竞争对抗还有博弈各方拥有信息的特征。比如上一个例子中,秦国与齐国都明白对方的策略,从博弈理论来说,更拗口的说法是秦国知道齐国知道自己的策略,反之齐国亦然,这种句法我们可以一直这么用下去,一直用到打“”,而这正是博弈双方所掌握的信息。因此我们可以了解到,形成一个博弈有4个要素:1博弈要有2个或2个以上的参与者(Player)。在博弈中存在一个必须的因素,那就是不是一个人在一个毫无干扰的真空作决策。比如,前例中只有秦国,而没有与之对抗的六国,就不存在“合纵连横”的博弈。从经济学的角度来看,如果是一个人做决策而不受到他人干扰的话,那就是一个传统经济学或管理学中最经常研究的最优化问题,也就是一个人或一个企业在一个既定的局面或情况下如何决策的问题。最简单一个最优化的例子就是,吸烟伤肺,不吸烟却又伤心,烟民是选择抽烟还是不抽烟,这就需要进行权衡(Tradeoff)。如果这个烟民非单身贵族,而是有妻子或女友,这种情况下就很有可能形成一个博弈。这也就是,博弈者的身边充斥着具有主观能动性的决策者,他们的选择与其它博弈者的选择相互作用、相互影响。这种互动关系自然会对博弈各方的思维和行动产生重要的影响,有时甚至直接影响着其他参与者的决策结果。在冯·诺依曼(Von Neumann)的博弈论奠基之作博弈论与经济行为一书中举过这样一个经典的例子。在鲁滨逊漂流记中,与世隔绝的“鲁滨逊”(Robinson Crusoe)一个人组成一个独立的经济系统,有中学数学水平的人都能够清楚,这只是一个普通的求解最大值的问题。因为鲁滨逊面对的是一些死的数据,而不是有主观意愿的人。一旦“星期五”(鲁滨逊漂流记中鲁滨逊的黑人仆人)加入这个系统,这个经济系统就形成了一个博弈问题。2)博弈要有参与各方争夺的资源或收益(Resources或Payoff)。资源指的不仅仅是自然资源,如矿山、石油、土地、水资源等,还包括了各种社会资源,如人脉、信誉、学历、职位等。如果这些资源是无限供给的,那么我们也不需要为共产主义而奋斗了,因为一步就可以迈入“货恶其弃于地也,不必藏于已,力恶其不出于身也,不必为已。”、“大道之行也,天下为公。”的大同社会。当然,不可否认是,一方面,博弈者之间会发生冲突;另一方面,他们当中也包含着合作的潜力。笔者在这里还要强调一点是,资源是有主观性的。人们之所以会参与博弈是受到利益的吸引,预期将来所获得利益的大小直接影响到竞争博弈的吸引力和参与者的关注程度。经济学的效用理论可以用来解释这个问题,凡是自己主观需要的就是资源,反之亦然。比如,“孩子总是自己的好,妻子总是别人好”:自己的孩子在眼里是无价之宝,而在别人面前相对是无价值的;即使是众人公认的美妻娇眷也会产生审美疲劳,资源的价值不断下降,这正是效用递减规律起了作用。最极端的例子大概就是明代小说镜花缘中所描绘的君子国,人人礼让使得客观的资源就变得毫无价值,自然就不存在竞争与博弈。3)参与者有自己能够选择的策略(Strategy)。所谓策略,就是“计利以听,乃为之势,以佐其外。势者,因利而制权也。”,这指的是直接实用的针对某一个具体问题所采取的应对方式。通俗的说策略就是计策,是博弈参与者所能够选择的手段方法。比如秦国就采用了“连横”的策略将六国“合纵”瓦解。一般日常生活中,策略选择仅是解决问题的方法,并不牵涉到分析关键因素、确定局势特征这些理论化的内容。而博弈论种的策略选择,是先对局势和整体状况进行分析,确定局势特征,找出其中关键因素,然后在最重要的目标上进行策略选择。由此可见,博弈论种的策略是可以牵一发而动全身的,这直接对整个局势造成重大影响。4)参与者拥有一定量的信息(Information)。比如在“合纵连横”的故事中,秦国与六国之间所拥有的信息就是完全的。但有些时候,信息并不是完全的,俗话说“天有不测风云”,比如今天是阴云密布、狂风大作,气象台预报明天是“阴转小雨”,明天出门上班到底要不要带伞呢?这种情况的信息是不完全的,人们决策的信息条件是不确定。当然从情理上说,在实际生活中一般是要带伞以防不测。通俗的说,博弈就是个人或组织在一定的环境条件与既定的规则下,同时或先后,仅仅一次或是进行多次地选择策略并实施,从而得到某种结果的过程。我们生活在这个世界上,就不可避免地要与他人打交道,这是一个利益交换的过程,也就无可避免地要面对各种矛盾和冲突。所谓博弈论听似拗牙聱齿,看似深不可测,但其思想极易理解。简单说来博弈论就是研究,人们如何进行决策、以及这种决策的如何达到均衡问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。2博弈是一种竞合游戏“博弈论”的英文是“Game Theory”,实际上Gme的本意是游戏,博弈论直接翻译成中文最贴切的直译是“游戏理论”。更准确点说,是一种竞合的智力游戏。所谓竞合,就是竞争合作的简写,一个博弈,并不仅仅是竞争,实际上竞争种包含着潜在合作的种子,合作中包含着潜在竞争的种子。合作博弈并不是指合作各方具有合作的意向或态度,而是指在博弈中有一些对博弈各方有约束力的协议或契约,或者说是博弈各方不能公然“串通”或“共谋”。合作博弈最典型的例子就是石油输出国组织欧佩克(Organization of Petroleum Exporting Countries,简称Opec),其1960年9月,由伊朗、伊拉克、科威特、沙特阿拉伯和委内瑞拉的代表在巴格达开会,决定联合起来共同对付西方石油公司,维护石油收入。随着成员的增加,欧佩克发展成为亚洲、非洲和拉丁美洲一些主要石油生产国的国际性石油组织。欧佩克协调和统一各成员国的石油政策,并以石油生产配额制的手段来维护它们各自和共同的利益,把国际石油价格稳定在公平合理的水平上。比如有些时候为防止石油价格飚升,欧佩克可依据市场形势增加其石油产量;为阻止石油价格下滑,欧佩克则可依据市场形势减少其石油产量。智力游戏与博弈相近似的本质是,在确定游戏规则的约束下,游戏参与者决策、行动的过程。各种智力游戏实际上就是一个实际社会、经济、管理、军事、政治等现象抽象出来的缩微模拟的模型。在这个意义上不妨说,博弈论就是研究怎么玩好游戏的理论。游戏是一种抽象。面对复杂现象时,人们经常会“见树木不见森林”,无法抓住某种现象的关键所在。而在游戏中,可以通过抽象出现实生活中的要点,并将干扰因素减至最低,从而轻松地分析问题并找到合理可行的解决方法。中国最古老的围棋最初的功能形态就是模拟战争。围棋包含最多的是军事内涵,如围而歼之,生死存亡为先,争地夺利为上。围棋以获得最大的利益为胜,抽象出战争的本质和目的,非常符合战争规律。围棋游戏的规则极其简单,不过是两气生,一气死,附加帖目、打劫等辅助规则,最终以所占地盘大小定胜负。但其作为一项智力游戏,与战争在很多方面都相通。围棋棋手在小小棋盘上较量,就是战争、战场、战斗在棋盘上的演绎。战争理念和战争指导思想是“基于毁伤”,以破坏、消耗、摧毁敌方为上。现代西方国家提出“基于效果”的作战思想,美国人将这一战争理念上的革命称为新的战争哲学。基于效果就是,着眼于敌方整个作战系统的控制,使之丧失作战能力。美军在伊拉克发动“斩首行动”的前一天,还专门召开了推出基于效果作战理念的新闻发布会,接着就发动了进攻。围棋模拟出“基于效果”的战争理念,强调从全局上控制,而不是基于蝇头小利。即所有的作战方法都必须是有效的,着子要看在全局中是否有用、有效,而不再是基于棋理、棋道、棋风等虚幻的在形式。基于效果的思想就是赢棋第一,实事求是。比如韩国棋手李昌镐就是基于效果的典范。现在很多世界级公司都已经明白智力游戏的作用。比如著名的微软公司在招聘员工时出过非常“儿童化”的招聘考题,题目是这样的:“某合唱团的4名成员A、B、C、D往演出现场,他们途中要经过一座小桥。当他们赶到桥头时,天已经黑了,周围没有灯。他们只有一只手电筒。现在规定:一次最多只许两人一起过桥,过桥人手里必须有手电筒,而且手电筒不能用扔的方式传递。4个人的步行速度都不同,若两人同行,则以较慢者的速度为准。A需花1分钟过桥,B过桥需花2分钟,C需花5分钟过桥,D需花10分钟过桥。请问:他们能在17分钟内过桥吗?” 这可不是微软公司的别出心裁,据说世界上许多跻身世界500强的公司在招收新员工时,都要出类似的智力题。 智力游戏可以锻炼人的思维能力,培养人的思维方法。良好的思维方法能使我们从错综复杂的现象中找到事物的本质,从纷繁的因素中找到事物变化的主要原因,使事物呈现出条理性。思维方法是抽象的,它不像112那么简单,只有通过自己的想像,亲自动手操作,经历失败,才能逐步形成。思维科学化程度越高的人,工作中发现问题、解决问题的能力就越强。这一点已成为人们的共识。在许多智力游戏中,都存在这么一个共同的特点,就是参与者所选择的策略对于胜负有着举足轻重的影响。一个游戏一点规则制订好之后,策略选择的好坏就成了游戏参加者所能自由运用的左右游戏结果的最关键因素。特别是在围棋、象棋之类参与者的初始条件完全相同的游戏中,策略选择就成了游戏结果的唯一决定因素。至于从围棋初段段到九段之间的差别,从博弈论的角度去看,就是他们之间策略选择的技巧高低不同而已。博弈论的策略思维是一种技巧。策略思维从一些基本技巧出发,考虑的是怎样将这些基本技巧最大限度地发挥出来。任何游戏都有自己的规则(Rule of the game)。实际现实自然也是如此,这就是法律、道德和各种成文或不成文的规章制度和惯例等。当然,这些规则也不是一成不变的,它会随着情况的改变和人们的要求不断修正,但是只要规则存在,这个规则就是确定了人们行为的前提条件。因此博弈与游戏都有一个重要的共同特征,那就是这些规则规定游戏参加者可以做什么,不可以作什么,按照什么次序去做,什么时候结束游戏,一旦参与者犯规将受到怎样的处罚等。游戏者的策略有相互依存的关系。每一个游戏者从游戏所得结果的好坏不仅取决于自身的策略选择,同时也取决于其它参加者的策略选择。有时甚至一个坏的策略会给选它的一方带来并不坏的结果,原因是其它方选择了更坏的利他而不利己的策略。这一点也是游戏与博弈重要的相似之处。3博弈论不是“万金油”博弈论并不是“万金油”,正如诺贝尔经济学奖得主莱因哈德·泽尔滕教授所说,“博弈论并不是疗法,也不是处方,它不能帮我们在赌博中获胜,不能帮我们通过投机来致富,也不能帮我们在下棋或打牌中赢对手。它不告诉你该付多少钱买东西,这是计算机或者字典的任务。” 要求博弈论能够完全刻画真实的世界,那么这命中注定会徒劳无功。根据著名的哥德尔不完备定理,任何一个理论体系必定是不完全的,任何理论包含了既不能证明为真也不能证明为假的命题。对这个世界的最好描述可能只有其本身,但是正如罗宾逊夫人的妙语“比例尺是一比一的地图是没用的”。博弈论也是这样,博弈论力图用最简单的假设下得到最大范围的推理应用。博弈论的这种方法与很多应用广泛学科都是相似的。如欧几里德几何的基本假设是两点之间直线,推演出庞大而严密的几何体系,可以说,在生活中或工程应用中,欧几里德几何学的思想方法是无处不在、无时不有。其基本公设之一就是,人是理性的(rational)。所谓理性的人是指行动者具有推理能力,在具体策略选择时的目的是使自己的利益最大化。而现实生活中,人们再做决策时往往是有限理性。所谓有限理性,也就是说人不是机器,人的理性是有限度的。比方说,某人要签署一份合同,有三种方法可供选择:一种是计划好,安排好一切,然后不动脑筋按部就班地照计划进行;另一种是做进度安排的时候都留一点余地,可供签订合同双方私下协商解决:最后一种是完全没有安排,凭着当时的感情与直觉任意为之,这种方法当然不可能是理性的。后两种一眼就可看出完全不满足博弈论意义上的理性,即使是第一种方法也不是真正意义上的经济理性。这是因为人们很难对每个措施将要产生的结果具有完全的了解和正确的预测,常常要在缺乏完全了解的情况下,一定程度地根据主观意识进行决策,个人或企业的决策都是在有限理性的条件下进行的。完全理性,意味着对每个抉择的确切后果都有完完全全的了解。事实上,一个人对自己的行动条件的了解,从来都只能是零碎的;至于使他得以从对当前状况的了解去推想未来后果的那些规律和法则,他也是所知甚微的。人类的精力和时间永远是有限的,人不可能具备完全理性,不可能掌握所有知识和信息。人类也不可能搜寻到所需的全部的信息。另一方面也要意识到信息的搜寻需要成本,而不是毫不费成本的,因为人类必须为此付出大量的时间、精力和财力等等。意图搜寻到所有信息,企图做出收益最优的决策行为有时反而是最不理性的行为。但当我们退而求其次时,博弈论可以得到对现实的客观世界描述的近似。所以博弈论仍然是我们目前所能得到的最好但非唯一的工具。就像并不完美的力学是自然科学的哲学和数学一样,博弈论是社会科学的力学和数学。没有牛顿力学我们连最简单的物理现象都无法理解,马用了多大的力拉动一车货物?上帝说“让牛顿来做吧”,于是我们知道了马用的力相当于克服摩擦力。同样的道理,没有博弈论我们也无法解释分析很多现实的社会现象。著名的博弈论大师鲁宾斯坦(Rubinstein)说过,“一个博弈模型是我们关于现实的观念的近似,而不是现实的客观描述的近似”。看来“理论之树是灰色的,生命之树常青!”这句话,我们应该谨记于心。第二章 纳什均衡、纯策略与混和策略1从围棋定式谈纳什均衡我们已经知道,博弈论的基本前提是,某人或某物的行为效果如何,有赖于他人或他物的行为。由于世上人间的事物很少不依赖于其他事物而存在。非合作博弈强调利益的冲突,即非合作甚至对抗状态。比如,“零和博弈”就是典型的非合作博弈,它是指博弈各方的所得之和为零,在特殊情况下如两人博弈时,一方所得与另一方所失相等。从严格的数学角度来看,围棋19´19的361个交叉点就是围棋对弈者所得的总和,因此围棋棋手非输即赢,可见围棋明显是数学意义上的严格的零和博弈。世事如棋局,而棋局是可以用博弈思维加以概括的。比如过分的“骗着”,“本手”与“缓着”之间,一般都会选择本手,着法过分如不遇反击,可能占到便宜,如遇反击则可能亏损,因此如果棋力相当,则应考虑到对手的反击手段。对手也同样考虑到在追求利益中不可能占尽便宜。这就导致双方都能接受的方案。围棋定式从策略层面看,如一方的策略是抢占实地,另一方是获得外势,而结果相当,互有所得,双方就愿意那样下。抢占实地考虑现实利益,获得外势考虑将来发展,这便形成一个双方的“均衡”;另一方面,可以从具体行棋效果来看,如果一步棋能考虑到对手各种应手而依然成立,对手也运用同样法则找到应对,则可以说双方达成了“均衡”。在经济学中,均衡(equilibrium)意即相关量处于稳定值。比如在经典的供需分析中,若某一商品的市场价格使得欲购买该商品的人均能买到,同时想卖的人均能将商品卖出去,此时该商品的供求达到了均衡。这个市场价格可称之为均衡价格,产量可称之为均衡产量。均衡分析是经典经济学中的重要方法。在讲解纳什均衡之前,我们再来看这样一个例子。一般对博弈论稍微有些了解的人,都会知道“囚徒困境”这个名词。这个例子就是在“囚徒困境”的基础上所作的修改。A和B是两个因盗窃而被抓的惯犯。警察局局长C正在调查该局管辖区域内的一宗悬而未决的银行抢劫案,并且他根据一系列的线索判定A和B是这桩案子的凶犯。因为该局管辖地区治安一向混乱不堪,C的上级对C非常恼火,直接威胁C如果银行案破不了,就要撤销C局长的职位,给予降级惩罚。C在上级的压力下不得不耗费大量时间、精力提审A和B。为了能够让两个囚犯认罪,C想让A和B明白,假如只有他们其中的一人坦白认罪则这个人可能受到的最严厉的惩罚是什么,但向他们遵守承诺,若两个人都坦白,则会从轻发落。于是,这个警察局长C分别与A、B立下许诺:如果只有一个人坦白认罪,则认罪的一方会收到所有指控,会因银行抢劫而判无期徒刑,另一个人则不会再加刑罚。如果无人认罪,两个人都会因盗窃罪而判刑2年。如果两个人都坦白,则两个人都被判处有期徒刑5年。这样,警察局长C给A和B构造了一个博弈。不妨假设,A和B都是极其精明的会打小算盘的自私自利不讲“江湖义气”的人,同时A和B被分别审查不能够进行沟通。在这种情况下,A会在脑子里打小算盘,他会想:如果选择坦白,那么B选择坦白时将判刑5年,B选择不坦白时将判刑20年,因此选择坦白时最坏的打算就把牢底坐穿;若是选择不坦白,那么B选择坦白时将无罪释放获得自由,B选择不坦白时将判有期徒刑5年,因此选择不坦白时最坏的可能就是被囚禁5年。两害相权,取其轻。因此在这种情况下,A必然会选择不坦白,同样的道理,B也会选择不坦白。这个时候,博弈达到了这样一种局面,这种局面就是纳什均衡(Nash Equilibrium)。纳什均衡的思想其实并不复杂,在博弈达到纳什均衡时,局中的每一个博弈者都不可能因为单方面改变自己的策略而增加获益,于是各方为了自己利益的最大化而选择了某中最优策略,并与其他对手达成了某种暂时的平衡。这种平衡在外界环境没有变化的情况下,倘若有关各方坚持原有的利益最大化原则并理性面对现实,那么这种平衡状况就能够长期保持稳定。再简单一点说,一策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略,他的收益将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。由此可见,纳什均衡是一稳定的博弈结果。打一个比方,如果把一个乒乓球,放到一个光滑的铁锅里,不论其初始位置在何处,最终乒乓球都会稳定地停留在锅底,这时的锅底就可称为是一个纳什均衡点。相反,如果锅是扣在地上的,那么锅底部位是很难放稳一个乒乓球的,因为往任何方向的一点点移动,都会使球彻底离开锅底。这时的锅底部位就不是一个纳什均衡点了。博弈的结果并不都能成为均衡。博弈的均衡是稳定的,则必然可以预测。纳什均衡的另一层含义是:在对方策略确定的情况下,每个参与者的策略是最好的,此时没有人愿意先改变或主动改变自己的策略。在上面的“囚徒困境”变形的博弈中,A和B都不坦白就是一个纳什均衡,这对双方来说都是最优选择。同时在这个博弈中,其均衡对双方来说是全局最优的。当然博弈达到纳什均衡,并不一定是对参与者最有利的结果,更不意味着是对整个社会作为一个整体而言最有利的结果,比如“囚徒困境”的例子导致了整体的不利。围棋与这个博弈的例子是有所不同的。上面的这个例子是A和B双方没有信息交换下的博弈,这就是博弈论中的静态博弈概念。围棋则是对弈双方相继按照一先一后次序行动的博弈。对于一人一步的相继行动的博弈,每个参与者都必须向前展望或预期,估计对手的意图,从而倒后推理,决定自己这一步应该怎么走。这是一条线性的推理链:“假如我这么做,他就会那么做若是那样,我会这么反击”,后面的步骤依此类推。也就是说,你怎么走棋,完全取决于对手的上一招。这在博弈论上叫做“倒推法”。在动态博弈中,存在明显的马太效应,也就是说凡是少的,连他仅有的也夺过来;凡是多的,就加给他,让他更多。比如在围棋上,就有“一招不慎,满盘皆输”的谚语,当然我们也要应用动态博弈的马太效应原理,在获得优势的情况能够保持优势扩大优势,直至最后成功。而在同时行动的静态博弈里,没有一个博弈者可以在自己行动之前得知另一个博弈者的整个计划。在这种情况下,互动推理不是通过观察对方的策略进行,而是必须通过看穿对手的策略才能展开。要想做到这一点,单单假设自己处于对手的位置会怎么做还不够。即便你那样做了,你只会发现,你的对手也在做同样的事情,即他也在假设自己处于你的位置会怎么做。因此,每一个人不得不同时担任两个角色,一个是自己,一个是对手,从而找出双方的最佳行动方式。与一条线性的推理链不同,这是一个循环,即“假如我认为对方认为我认为”。这样来看,定式是一系列纳什均衡的累计直至局部达到稳定的一种变化,直到一方认为可以根据形势选择任何变化或脱先而无局部受损之虞。由于定式是在大量实战基础上不断被验证并长期积累而成。因此在动态博弈中,纳什均衡的要义在于:即使在对抗条件下,双方可以通过向对方提出威胁和要求,找到双方能够接受的解决方案而不至于因为各自追求自我利益而无法达到妥协,甚至两败俱伤。稳定的均衡点建立在找到各自的“占优策略”(dominant strategy),即无论对方作何选择,这一策略优于其他策略。2从爱情故事谈起:优势策略与房地产开发博弈 “原地高天,堪叹古今情难尽;痴男怨女,可怜风月债难偿。”我们来先看欧·亨利的小说麦吉的礼物描述的这样一个爱情故事。新婚不久的MM和GG,很是穷困潦倒。除了MM那一头美丽的金色长发,GG那一只祖传的金怀表,便再也没有什么东西可以让他们引以为傲了。虽然生活很累很苦,他们却彼此相爱至深。每个人关心对方都胜过关心自己。为了促进对方的利益,他们愿意奉献和牺牲自己的一切。话说明天就是圣诞节了,小两口都是身无余钱。为了让爱人过得好一点,每个人还是想悄悄儿准备一份礼物给对方。GG卖掉了心爱的怀表,买了一套漂亮发卡,去配MM那一头金色长发。MM剪掉心爱的长发,拿去卖钱,为GG的怀表买了表链和表袋。最后,到了交换礼物的时刻,他们无可奈何地发现,自己如此珍视的东西,对方已作为礼物的代价而出卖了。花了惨痛代价换回的东西,竟成了无用之物。出于无私爱心的利他主义行为,结果却使得双方的利益同时受损。欧·亨利在小说中写道:“聪明的人,送礼自然也很聪明。大约都是用自己有余的物事,来交换送礼的好处。然而,我讲的这个平平淡淡的故事里,两个住公寓的傻孩子,却是笨到极点,彼此为了对方,白白牺牲了他们屋檐下最珍贵的财富。”从这段文字看,欧亨利似乎并不认为这小两口是理性的。且让我们暂时抛开爱情的温馨,单从利益的角度来解读。我们假定,他们每个人,有一个“毫不利己专门利人”的偏好系统,毫不考虑自身利益,专门谋求别人的幸福。这样,个人选择付出还是不付出,只看对方能不能得益,与自己是否受损无关。以这样的偏好来衡量,最好的结果自然是自己付出而对方不付出,对方收益增大;次好的结果是大家都不付出,对方不得益也不牺牲;再次的结果是大家都付出;最坏的结果是别人付出而自己不付出,靠牺牲别人来使自己得益。我们不妨可用数字来代表个人对这四种结果的评价:第一种结果给3分,第二种结果给1分,第三种结果给1分,最后那种给0分。不难看出,无论对方选择付出,还是选择不付出,个人自己的最佳选择都是付出。然而这并不是对大家都有利的选择。事实上,大家都选择不付出,明显优于大家都选择付出的境况,这就达到了上文提到的纳什均衡。实际上,这里的例子是一个博弈论中所说的占优策略均衡。通俗地说,在占优策略均衡中,不论所有其他参与人选择什么策略,一个参与人的占优策略都是他的最优策略。显然,这一策略一定是所有其他参与人选择某一特定策略时该参与人的占优策略。因此,占优策略均衡一定是纳什均衡。在这个例子中,MM选择不付出,也就是不剪掉金发对于MM来说是一个优势策略,也就是说MM不付出,GG不管选择什么策略,MM所得的结果都好于GG。同理,GG不卖掉怀表对于GG来说也是一个优势策略。再举个简单的例子:一名篮球前锋和队友在蓝下面对着对方的一个后卫时,形成了二打一的局面,该前锋可以选择直接投篮,也可以选择传球给队友,根据经验,传球过人的成功率更大,那么传球就是该前锋的优势策略。即某些时候它胜于其他策略,且任何时候都不会比其他策略差。如果一个球员具有这样一种策略,无论其他球员怎么做,这个策略都会高出一筹,那么这个球员就有一个优势策略。当然如果一个球员有这么一个优势策略,他的决策就会变得非常简单,只要直接采用该策略而完全不必考虑对手的应对策略。还有一个要注意的问题是,采用优势策略得到的最坏结果并不一定比采用另外一个策略得到的最佳结果要好,这是很多博弈论普及书中容易出错的一个问题。应该说,对局者采用优势策略在对方采取任何策略时,总能够显示出优势。比如就这个例子来说,就MM来说,她采用不付出的策略,无论GG付出或不付出,MM的不付出策略总是占有优势。GG的优势策略也是一样。但是,MM选择不付出的最坏结果是1,二选择付出的最好结果是3,很明显,MM的优势策略得到的最坏结果并不比采用另外一个策略得到的最佳结果要高出一筹。反之,劣势策略则是指在博弈中,不论其他参与人采取什么策略,某一参与人可能采取的策略中,对自己严格不利的策略,劣势策略是我们在日常生活中不可以选择的行动。劣势策略是与优势策略相对应的概念,笔者这里就不多做介绍。3房地产博弈、警察捉小偷博弈与纳什均衡实际上,在上一小节,每个参与人都有优势策略的情况下,优势策略均衡是非常合乎逻辑的。一个优势策略优于其他任何策略,同样,一个劣势策略则劣于其他任何策略。假如你有一个优势策略,你可以选择采用,并且知道你的对手若是有一个优势策略他也会照办;同样,假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。但遗憾的是不是所有博弈都有优势策略,哪怕这个博弈只有两个个参与者。实际上,优势策略只是博弈论的一种特例。虽然出现一个优势策略可以大大简化行动的规则,但这些规则却并不适用于大多数现实生活中的博弈。来看这样一个房地产开发博弈的例子。假定北京市的房地产市场需求有限,、两个开发商都想开发一定规模的房地产,但是市场对房地产的需求只能满足一个房地产的开发量,而且,每个房地产商必须一次性开发这一定规模的房地产才能获利。在这种情况下,无论是对开发商还是开发商,都不存在一种策略完全优于另一种策略,也不存在一个策略完全劣于另一个策略。因为,如果选择开发,则的最优策略是不开发;如果选择不开发,则的最优策略是开发;类似地,如果选择开发,则的最优策略是不开发;如果选择不开发,则的最优策略是开发。这样就形成了一个循环选择。根据纳什均衡含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。即双方在对方给定的策略下不愿意调整自己的策略。这个博弈的纳什均衡点不止一个,而是两个:要么A选择开发,B不开发;要么A选择不开发,B选择开发。在这种情况下,A与B都不存在优势策略,也就是A和B不可能只要选择某一个策略而不考虑对方的所选择的策略。实际上,在有两个或两个以上纳什均衡点的博弈中,其最后结果难以预测。在房地产博弈中,我们无法知道,最后结果是A开发,B不开发还是A不开发,B开发。再来看这样一个警察捉小偷博弈的例子。某个村庄上只有一名警察,他要负责整个村的治安。小村的两头住着两个全村最富有的村民A和B,A、B分别需要保护的财产为2万元、1万元。整个小村某一天来了个小偷,要在村中偷盗A和B的财产,这个消息被警察得知。因为分身乏术,警察一次只能在一个地方巡逻;而小偷也只能偷盗其中一家。若警察在某家看守财产,而小偷也选择了去该富户家,就会被警察抓住;若警察没有看守财产的富户家而小偷去了,则小偷偷盗成功。一般人会凭着感觉认为,警察当然应该看守富户A家财产,因为A2万元的财产而B只有1万元的财产。实际上,对于警察的一个最好的做法是,警察抽签决定去A还是B家。因为A家的财产是B家的2倍,所以用两个签代表A家,比如如果抽到1、2号签去A家,抽到3号签去B家。这样警察有23的机会去A家进行做看守,13的机会去B家做看守。而小偷的最优选择是:以同样抽签的办法决定去A家还是去