博弈论与竞争策略(优秀)【博弈论经典】 .ppt
,博弈论与竞争策略,企业、政府与商业环境,博弈论与竞争策略,企业、政府与商业环境,博弈论与竞争策略,课堂游戏(一),三个火枪手,甲(80%),乙:60%,丙(40%),企业、政府与商业环境,博弈论与竞争策略,课堂游戏(二),纸币拍卖,企业、政府与商业环境,博弈论与竞争策略,“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”保罗萨缪尔森,企业、政府与商业环境,博弈论与竞争策略,“博弈论”的英语原文是Game Theory,直译过来就是游戏论、运动论或竞赛论。什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。,企业、政府与商业环境,博弈论与竞争策略,博弈论导论博弈与我们的生活,美丽心灵学习与工作,失火了,你往哪个门跑,企业、政府与商业环境,博弈论与竞争策略,博弈论导论现代博弈论简单发展史,起源可以追溯到1944年数学家冯诺伊曼与经济学家摩根斯坦合著的博弈论与经济行为,企业、政府与商业环境,博弈论与竞争策略,博弈论导论博弈论和诺贝尔经济学奖,1994:纳什(Nash)、海萨尼(J.Harsanyi)、泽尔腾(R.Selten),1996莫里斯(James A.Mirrlees)和维克瑞(William Vickrey),纳什的基本贡献是证明了非合作博弈均衡解及其存在性,建立了作为博弈论基础的“纳什均衡”概念;海萨尼则把不完全信息纳入到博弈论方法体系中;泽尔腾的贡献在于将博弈论由静态向动态的扩展,建立了“子博弈精练纳什均衡”的概念。,这两位经济学家的贡献集中于运用博弈论对现实经济问题的解释。,企业、政府与商业环境,博弈论与竞争策略,2001:阿克洛夫(Akerlof)、斯宾塞(Spence)、斯蒂格利茨(Stiglitz),博弈论导论博弈论和诺贝尔经济学奖,这三位作为不对称信息市场理论的奠基人被授予诺贝尔经济学奖,以表彰他们分别在柠檬品市场等不对称信息理论研究领域做出的基础性贡献。这些贡献发展了博弈论的方法体系,拓宽了其经济解释范围。,2002:弗农史密斯(Smith),2005:奥曼(Aumann)、谢林(Schelling),贡献主要在于通过实验室实验来测试根据经济学理论而做出预测的未知或不确定性。是对以博弈论为基础构建的理论模型进行实证证伪工作的一大创举。,他们通过博弈理论分析增加了世人对合作与冲突的理解。其理论模型应用在解释社会中不同性质的冲突、贸易纠纷、价格之争以及寻求长期合作的模式等经济学和其他社会科学领域。,企业、政府与商业环境,博弈论与竞争策略,博弈论导论博弈论的五大要素,策略空间效用 次序 博弈均衡,决策主体,企业、政府与商业环境,博弈论与竞争策略,博弈论导论博弈的分类,合作博弈与非合作博弈:如果各博弈方能达成某种有约束力的契约或默契,以选择共同的策略,此种博弈就是合作博弈。反之,就属于非合作博弈。寡头协议一根鱼竿和一篓鲜鱼超级女生比赛军备竞赛,企业、政府与商业环境,博弈论与竞争策略,博弈论导论博弈的分类,同步博弈与序列博弈:每个参与方不知对方决策情况下作出决策;参与方先观察对方行动,自己再行动静态博弈与动态博弈:参与人同时选择行动或虽非同时但后行动者并不知道前行动者采取什么行动;参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动下棋体育竞赛价格战,企业、政府与商业环境,博弈论与竞争策略,博弈论导论博弈的分类,一次博弈与重复博弈:基本博弈只进行一次;基本博弈重复进行,包括有限重复和无限重复小村庄里的人际交往同一个办公室的同事间交往固定摊点的售卖,企业、政府与商业环境,博弈论与竞争策略,博弈论导论博弈的分类,零和博弈与非零和博弈:一方的情况只有当另一方情况变得更差时才能变得更好;另外一方情况不必变得更差,一方的情况就能变得更好零和博弈:赌博、讨价还价负和博弈:美国发动的伊拉克战争、阿富汗战争正和博弈:鳄鱼和鳄鱼鸟,企业、政府与商业环境,博弈论与竞争策略,博弈论导论博弈的分类,完全信息博弈与不完全信息博弈 完全信息博弈:在每个参与人对所有其他参与人的特征和战略都有精确了解的情况下,所进行的博弈。如果了解得不够精确,或者不是对所有的参与人都有精确的了解,在这种情况下进行的博弈就是不完全信息博弈。在前一种博弈中,每一个参与者都拥有全部的相关信息,只拥有部分相关信息的便属于后一种博弈。,企业、政府与商业环境,博弈论与竞争策略,博弈论导论,每一个博弈都是一个你中有我,我中有你的情形,不同的博弈参与者可以选择不同的行动,但由于相互作用,一个博弈参与者的得益不仅取决于自己采取的行动,也取决于其他博弈参与者所采取的行动。博弈论的精髓在于基于系统思维基础上的理性换位思考,即在选择你的行动时还是考虑你的得益,但是你应当用他人的得益去推测他人的行动,从而选择最有利于自己的行动。,企业、政府与商业环境,博弈论与竞争策略,企业、政府与商业环境,博弈论与竞争策略,斯特恩巴赫是费城的一个家庭保健医生,她很奇怪为什么辉瑞公司(Pfizer)的五位不同推销员重复上门到她的诊所推销同样的止痛药Betra及Celebrex。她在贮藏室里一个像冰箱大的柜子里已装满了Bextra和Celebrex,她说,“众多的推销员重复同样的产品,没有任何新意,实在是离奇。”长达十年的招聘狂潮使制药业的推销员人数增加到90000,为原来人数的三倍。制药业人士笃信:只要推销员与医生推销一种药越频繁,医生越有可能多开此药。据统计,2003年制药业在推销员工上花费为120多亿美元,在药物广告上花费为27.6亿美元。根据联邦政府的报告,美国国内在处方药上的支出激增14%,达到1,610亿美元。,专栏制药公司的销售大战(摘自华尔街日报),Betra,辉瑞,推销员,止痛药,医生,2003年美国制药业推销员工与药物广告花费(单位:亿美元),企业、政府与商业环境,博弈论与竞争策略,专栏制药公司的销售大战(摘自华尔街日报)(续),尽管如此,没有任何一家制药商愿意第一个单方面裁军。葛兰素史克公司(GlaxoSmithKline)的推销员队伍是如此壮大:它只需要七天就可以联系到美国80%以上的医生。“这有必要吗?”葛兰素史克的CEO加涅尔说:“应该说是没有必要,但是如果我的竞争对手能而我做不到,我们就处于劣势。这的确是以最坏可能的方式进行的军备竞赛。”“拥有众多的推销员不是竞争优势的源泉”,默克公司的主席和CEO吉尔马丁补充说。他说制药商通过发现新药来获得优势。然而,默克公司2001年起在美国已增加了1500名推销员,使得总数达到约7000人。既然谁都知道拥有众多的推销员并不是竞争优势的源泉,那为什么各家制药公司的推销员仍然在不断膨胀呢?引自周林,商业战略决策:博弈论的应用,企业、政府与商业环境,博弈论与竞争策略,同步,一次博弈-标准式博弈,构成标准式博弈的要素有:参与者:参加博弈并做出决策的个体策略:参与者可能采取的行动得益:参与者采取不同策略带来的利益或损失,参与者 2,参与者 1,企业、政府与商业环境,博弈论与竞争策略,标准式博弈:均衡分析,假设参与者1认为参与者2选择“A”,参与者 2,参与者 1,企业、政府与商业环境,博弈论与竞争策略,标准式博弈:均衡分析,则参与者1应该选择“a”参与者1对“A”的最优反应是“a”.,参与者 2,参与者 1,企业、政府与商业环境,博弈论与竞争策略,标准式博弈:均衡分析,假设参与者1认为参与者2选择“B”.,参与者 2,参与者 1,企业、政府与商业环境,博弈论与竞争策略,标准式博弈:均衡分析,则参与者1应该选择“a”.参与者1对“B”的最优反应是“a”.,参与者 2,参与者 1,企业、政府与商业环境,博弈论与竞争策略,标准式博弈:均衡分析,如果参与者1认为参与者2选择 C参与者1对“C”的最优反应是“a”.,参与者 2,参与者 1,企业、政府与商业环境,博弈论与竞争策略,占优策略,不管参与者2是选择A、B还是C,参与者1都会选择“a”!“a”是参与者1的占优策略!占优策略(上策)不管对手做什么,对一个参与者都能获得最高得益的策略,参与者 2,参与者 1,企业、政府与商业环境,博弈论与竞争策略,站到对手的立场上,想,参与者2会怎么做呢?,参与者2 没有占优策略!,但是参与者2应该能够推断出1会选择“a”,因此参与者2会选择“C”,参与者 2,参与者 1,企业、政府与商业环境,博弈论与竞争策略,结果,“a”是参与者1对“C”的最优反应.“C”是参与者2对“a”的最优反应.,此结果被称为纳什均衡:在给定其他参与者策略情况下,没有一个参与者能通过单方面改变自己的策略而使自己的得益提高,从而没有人有积极性打破这种均衡,参与者 2,参与者 1,企业、政府与商业环境,博弈论与竞争策略,关键点:,寻找占优策略 检查一下你是否存在占优策略,如果有,就选择占优策略站在对手的位置上思考问题 如果你没有占优策略,那么从你对手角度考虑博弈。如果对手有占优策略,预期他将按占优策略行动纳什均衡 我所做的是:给定你所做的,我所做的是最好的;你所做的是:给定我所做的,你所做的是最好的,企业、政府与商业环境,博弈论与竞争策略,同步,一次博弈的应用,专栏的博弈分析(制药公司销售大战),默克,辉瑞,纳什均衡,企业、政府与商业环境,博弈论与竞争策略,性别之战,女,男,纳什均衡,一对恋人准备在周末晚上一起出去玩,男的喜欢听音乐会,但女的比较喜欢看电影。当然,两个人都不愿意分开活动,不同的选择给他们带来的满足由下图表示。,纳什均衡,企业、政府与商业环境,博弈论与竞争策略,囚徒困境,案情描述 两个犯罪嫌疑人囚徒A与囚徒B因犯非法持有枪械罪和被怀疑可能犯有一级谋杀罪被逮捕,检察官将他们分别关在两间牢房里进行审讯。检察官对囚徒A说,“我们实行的是坦白从宽,抗拒从严的政策;如果你坦白了而他不坦白,那么你将会被无罪释放,他将会因一级谋杀罪被判死刑;如果他坦白了而你不坦白,他将会被无罪释放,而你将会因一级谋杀罪被判死刑;如果你们都坦白,你们都将会被轻判。”当然检察官对B说的话也是完全一样的。但实际上,如果两个人都坦白,却会因涉及更多的罪案而都被判无期。而两人都不坦白,只能按非法持有枪械罪被分别判一年。囚徒A与B的博弈矩阵又是怎样的呢?囚徒A与B将面临怎样的选择呢?,个体理性与集体理性的冲突,囚徒B,囚徒A,坦白拒不交待,坦白 拒不交待,无期,无期,死刑,释放,释放,死刑,一年,一年,囚徒1:坦白囚徒2:坦白,企业、政府与商业环境,博弈论与竞争策略,彩电价格大战,伯特兰德寡头垄断(同质产品,价格竞争),海信,长虹,纳什均衡,企业、政府与商业环境,博弈论与竞争策略,公共地悲剧,英国人哈定:十八世纪以前,苏格兰地区大量草地,由于属公共资源导致过度放牧,致使草地消失,生态破坏,企业、政府与商业环境,博弈论与竞争策略,公共产品的供给 如果大家都出钱兴办公用事业,所有人的福利都会增加。问题是,如果我出钱你不出钱,我得不偿失,而如果你出钱我不出钱,我就可以占你的便宜。所以每个人的最优选择都是“不出钱”,结果使所有人的福利都得不到提高。军备竞赛 两国都不搞军备竞赛,都把资源用于民用,两国福利都变好。但由于都怕受威胁而大搞军备竞赛,结果两国福利都变得更糟。经济改革 经济改革要付出成本(包括风险),而改革的成果大家享受,结果是,尽管人人都认为改革好,却很难有人真正去改革,大家只好在都不满意的体制下继续生活下去。,企业、政府与商业环境,博弈论与竞争策略,两只公鸡面对面争斗,继续斗下去,两败俱伤,一方退却便意味着认输。在这样的博弈中,要想取胜,就要在气势上压倒对方,至少要显示出破釜沉舟、背水一战的决心来,以迫使对方退却。但到最后的关键时刻,必有一方要退下来,除非真正抱定鱼死网破的决心。这类博弈也不胜枚举。如两人反向过同一独木桥,一般来说,必有一人选择后退。在该种博弈中,非理性、非理智的形象塑造往往是一种可选择的策略运用。如那种看上去不把自己的生命当回事的人,或者看上去有点醉醺醺、傻乎乎的人,往往能逼退独木桥上的另一人。还有夫妻争吵也常常是一个“斗鸡博弈”,吵到最后,一般地,总有一方对于对方的唠叨、责骂装聋作哑,或者干脆妻子回娘家去冷却怒火。冷战期间,美苏两大军事集团的争斗也是一种“斗鸡博弈”。在企业经营方面,在市场容量有限的条件下,一家企业投资了某一项目,另一家企业便会放弃对该项目的觊觎。,斗鸡博弈,企业、政府与商业环境,博弈论与竞争策略,位置博弈,商业布点、飞机航班、电视节目、政治选举,0,1/4,1/2,3/4,1,A,B,A B,企业、政府与商业环境,博弈论与竞争策略,智猪博弈,猪圈中有一头大猪一头小猪,猪圈一端有个按钮,每按一下猪圈另一端食槽中会有10个单位猪食进槽,但按一下会耗去相当于2单位猪食的成本。如果大猪先到食槽,大猪吃到9单位食物,小猪只能吃到1单位;如小猪先到,小猪吃4单位而大猪吃6单位;如果同时按并同时到食槽,则大猪吃7单位而小猪吃3单位食物。,小猪,大猪,纳什均衡,企业、政府与商业环境,博弈论与竞争策略,关键点,处于强势的参与者为维护自己利益采取某种决策时,为其他弱势参与者提供了搭便车的机会股市中的机构大户与散户新产品研发与中小企业可口可乐、百事可乐与非品牌软饮料产品(Scott)美国弗雷化妆品与约翰逊粉质膏股市分析员与经济预测员,企业、政府与商业环境,博弈论与竞争策略,如果想让两只猪拼命争抢着去踩踏板才能得到食物,应该采取什么策略?,改变方案一:减量方案。改变方案二:增量方案。改变方案三:减量加移位方案。,企业、政府与商业环境,博弈论与竞争策略,如果想让两只猪拼命争抢着去踩踏板才能得到食物,应该采取什么策略?,“减量加移位”的方案,会使小猪和大猪都拼命地争踩踏板,因为等待者不得食,而多劳者多得,每次的收获刚好供一头猪消费完。这个方案成本不高,收获最大。反观,如果投食量增加一倍,虽然想吃的人会去踩踏板,但是反正不论是谁踩了踏板,都不会把食物一次吃完,两只猪相当于生活在物质丰富的“共产主义社会”。但是这个方案的缺点是成本高,且竞争双方竞争意识不强烈。,企业、政府与商业环境,博弈论与竞争策略,应用,我们用智猪博弈来分析一下公司的激励制度设计。如果奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的“大猪”也不会有动力了就像减量方案所描述的情形。最好的激励机制设计就得像改变方案三减量加移位的办法奖励并非人人有份,而是直接针对个人(如业务接比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。这个办法的总体思路就是提高“小猪”的投机成本。,企业、政府与商业环境,博弈论与竞争策略,协调博弈,情侣博弈,女,男,企业B,企业A,此协调博弈有两个纳什均衡,产业标准(软盘、CD的大小等)国家标准(电压、交通法等),企业、政府与商业环境,博弈论与竞争策略,关键点,不是所有的博弈都涉及到利益冲突.沟通能够帮助解决协调问题.顺序行动能够帮助解决协调问题.先动优势的作用,企业、政府与商业环境,博弈论与竞争策略,美国第九届总统威廉哈里逊小时候家里贫穷,他沉默寡言家乡的人们甚至认为他是个傻孩子。有一次,一个人跟他开玩笑,拿一枚五美分的硬币和一枚一美元的硬币放在他的面前让他挑,说挑哪个就送他哪个。哈里逊看了看挑了五美分的硬币。这一举动逗得人们哈哈大笑,都以为哈里逊是个傻小孩。这事很快在当地传开了,很多人都饶有兴致地来看这个“傻小孩”,并拿来五美分和一美元的硬币让他挑。每次,哈里逊都是拿那枚五美分的。而不拿一美元的。一位妇女看他这样可怜,就同他:“你难道真的不知道哪个更值钱吗?”哈里逊回答说:“当然知道,夫人,可是我拿了一美元的硬币他们就再也不会把硬币摆在我面前,那么,我就连五美分也拿不到了。”如果从某一次合作的局部看可能是吃亏的,但是这些合作对全局发展却起到极大的作用,那么这种亏是值得吃的。这正是俗语所谓“吃小亏占大便宜”。,合作博弈,收益增加,企业、政府与商业环境,博弈论与竞争策略,基本框架,同步一次博弈,重复博弈:有限重复博弈与无限重复博弈,多阶段博弈,博弈论导论,企业、政府与商业环境,博弈论与竞争策略,生活中的重复博弈,如果你去菜场买菜,当你对某种菜的质量、口味等有疑虑时,卖菜的阿姨常会讲:“你放心,我一直在这儿卖呢!”在车站和旅游点这些人群流动性大的地方,不但商品和服务质量差,而且假货横行,因为在商家和顾客之间“没有下一次”。,企业、政府与商业环境,博弈论与竞争策略,生活中的重复博弈,在公共汽车上,两个陌生人会为一个座位争吵,可如果他们相互认识,就会相互谦让。在社会联系紧密的人际关系中,人们普遍比较注意礼节和道德,因为他们需要长期交往,并且对未来的交往存在预期。,企业、政府与商业环境,博弈论与竞争策略,以牙还牙,以眼还眼,一天半夜,某教授正在熟睡之际,电话铃突然响了起来。他睡跟惺忪拿起电话,听筒里传来女邻居怒气冲冲的声音:“麻烦你管一下你的狗,不要再让它叫了。”说完,电话就挂了。这位教授十分生气。第二天他定好闹钟,半夜两点钟准时起床拿起电话拨通了这位女邻居家。过了半天,对方才拿起听筒,带着睡意恼怒地同:“哪一位?”这位教授彬彬有礼地告诉她:“夫人,昨天我忘记告诉你了。我们家没有养狗。”,企业、政府与商业环境,博弈论与竞争策略,重复博弈以牙还牙,在现实中,企业之间的竞争一般都将持续一个较长的时期。在对局可以多次重复的情况下,竞争的结局是否会有所改变呢?对博弈的参与者来说,此时是否存在一种最好的策略呢?重复博弈是动态博弈中的一类。,企业、政府与商业环境,博弈论与竞争策略,重复博弈以牙还牙,在价格竞争中,这一策略意味着什么呢?假定企业A和企业B都可以采用两种价格策略:高价或低价。在第一次对局中,企业应选择高价策略。如果对方在第一次选择低价竞争,你就在第二次也削价竞争;如果对方在第一次选择高价,你也就维持高价策略。只要对方在某一次降价竞争,你就马上选择降价作为报复;反之,如果对方保持“合作”的态度,你也就一直合作下去。真所谓“善有善报,恶有恶报”,而且“无论善恶,立即得报”。,企业、政府与商业环境,博弈论与竞争策略,重复博弈-广告博弈,两个企业(Kelloggs&General Mills)的经理想最大化利润策略是广告活动同步博弈一次博弈无限重复博弈有限重复博弈,企业、政府与商业环境,博弈论与竞争策略,一次广告博弈,通用面粉,凯洛格,企业、政府与商业环境,博弈论与竞争策略,一次广告博弈的均衡,纳什均衡,通用面粉,凯洛格,劣策略:不管其他参与人采取什么策略,都能导致最低收益的策略理性参与人永远不会选择劣策略许多博弈中参与者都没有占优策略,但仍可能通过劣策略的重复剔除进行分析,这种方法称劣策略重复剔除法,企业、政府与商业环境,博弈论与竞争策略,如果企业每年都进行这种一次博弈,并且永远进行下去,这时参与人可以对对手的“欺骗”行为进行惩罚或报复。在这种情况下,共谋起作用吗?,密歇根大学爱克斯罗德教授的计算机模拟 他首先邀请全世界的学者递交自认为最优的策略程序,然后将这些策略相互之间交替进行不特定次数的“重复囚徒博弈”,根据最终排名来判定优劣。第一轮14个程序之间的竞赛结果显示,“一报还一报”的简单策略获得第一。之后,又有63位科学家递交了改进的程序,进行第二轮竞赛,其中包括多个以“一报还一报”策略为基础的改良品种。令人惊异的是,第二轮比赛的优胜者仍然是“一报还一报”。触发策略“如果对手在过去没有做过广告,我就不做;一旦对手作广告,自此以后,我就用高强度的广告活动来惩罚他”事实上,只要对手在过去没有过“欺骗”行为,各个企业都会同意“合作”。因为欺骗行为会引发以后所有时期的惩罚,无限重复博弈,企业、政府与商业环境,博弈论与竞争策略,假设General Mills采用了这种触发策略,Kelloggs的利润是多少呢?,合作=12+12/(1+i)+12/(1+i)2+12/(1+i)3+=12+12/i,相当于每年年底得到¥12的永久年金,欺骗=20+2/(1+i)+2/(1+i)2+2/(1+i)3+=20+2/i,通用面粉,凯洛格,企业、政府与商业环境,博弈论与竞争策略,Kellogg从欺骗行为中获得的好处:,欺骗-合作=20+2/i-(12+12/i)=8-10/i假设i=.05欺骗-合作=8-10/.05=8-200=-192欺骗没有好处.在无限次重复博弈中共谋是纳什均衡!,通用面粉,凯洛格,企业、政府与商业环境,博弈论与竞争策略,欺骗行为的收益和成本,如果 当前收益 未来成本的现值 欺骗行为是有利的如果 当前收益 未来成本的现值欺骗行为没有好处,通用面粉,凯洛格,企业、政府与商业环境,博弈论与竞争策略,关键点,当博弈无限重复没有确定的“终结之日”时,共谋作为纳什均衡就能够维持下去这需要:有能力监督对手的行动有惩罚叛徒的能力和名声低利率在未来进行博弈的机会多,企业、政府与商业环境,博弈论与竞争策略,说明,根据谢尔曼反托拉斯法案第二节,共谋是违法的.后果可能是罚款和坐牢OPEC是国际间组织,美国法律不适用于它,企业、政府与商业环境,博弈论与竞争策略,如果博弈有限重复进行,共谋起作用吗?,有限重复博弈,假设广告博弈被重复两次,通用面粉,凯洛格,纳什均衡,企业、政府与商业环境,博弈论与竞争策略,用逆向归纳法,结论是:不.,在第二阶段,博弈是一次博弈,因此在这最后阶段,均衡是高强度的广告活动.由于每个人都知道第二阶段的结果,因此,第一阶段就变成了最后阶段.两个企业在两个时期的均衡策略都是高强度的广告活动.如果博弈重复已知的有限次数,同样的结果依然成立,企业、政府与商业环境,博弈论与竞争策略,期末问题的应用,当参与方确切地知道一个重复博弈什么时候结束时,期末问题就出现了。由于无法在最后一次对对手违背协议行为进行惩罚,因此参与方就会采取如同一次博弈的策略59岁现象辞职问题虚假广告火车站和旅游点的商贩,企业、政府与商业环境,博弈论与竞争策略,基本框架,同步一次博弈,重复博弈:有限重复博弈与无限重复博弈,多阶段博弈,博弈论导论,企业、政府与商业环境,博弈论与竞争策略,序列博弈,序列博弈 参与者选择策略有时间先后的顺序,通常采用博弈的扩展形式来进行分析在博弈中,人们掌握的信息经常是不完全的,这就需要在博弈进行过程(即动态博弈)中不断地收集信息、积累知识、修正判断。达到“精炼贝叶斯均衡”。人们常提到的“上有政策、下有对策”,其实是对管理者与被管理者之间的动态博弈的一种描述,面对上边的政策,下边寻求对策是正常的、必然的。从“博弈论”的角度讲,上边的政策制定必须在考虑到下边可能会有的对策的基础上进行,否则,政策就不会是科学、合理的。,企业、政府与商业环境,博弈论与竞争策略,序列博弈黔驴技穷,成语故事“黔驴技穷”实际上就包含了一个不完全信息动态博弈。毛驴刚到贵州时,老虎摸不准这个大动物究竟有多大本领,因而躲在树林里偷偷观察,这在老虎当时拥有的信息条件下是一种最优策略选择。过了一阵子,老虎走出树林,逐渐接近毛驴,就是想获得有关毛驴的进一步信息。一天,毛驴大叫一声,老虎吓了一跳,急忙逃走,这也是最优策略选择。又过了一些天,老虎又来观察,并对毛驴挨得很近,往毛驴身上挤碰,故意挑衅它。毛驴在忍无可忍的情况下,就用蹄子踢老虎,除此之外,别无它法。老虎最终了解到毛驴的真实本领后,就扑过去将它吃了。在这个故事里,老虎通过观察毛驴的行为逐渐修正对毛驴的看法,直到看清它的真面目。事实上,毛驴的策略也是正确的,它知道自己的技能有限,总想掩藏自己的真实技能。老虎吃掉毛驴的策略,在“博弈论”中就是所谓的“精炼贝叶斯均衡”。,企业、政府与商业环境,博弈论与竞争策略,序列博弈连锁店经营,到20世纪70年代中期,当其他连锁店的经营者认识到这一点时,沃尔马已经大量占领了这样的市场。特别是,对这样的小镇来说,开出一家连锁折扣店可以盈利,因为这家折扣店可以成为小城镇市场上的垄断者。但如果开出两家来,市场容量就不够大,这两家折扣店就必然要亏损。因此,对小镇市场来说,连锁折扣店的竞争就面临一种市场进入的博弈。下图是进一博弈的得益矩阵。,企业、政府与商业环境,博弈论与竞争策略,序列博弈连锁店经营,企业、政府与商业环境,博弈论与竞争策略,多阶段博弈竞争壁垒,序列博弈 参与者选择策略有时间先后的顺序,通常采用博弈的扩展形式来进行分析例子:进入博弈 两个企业:一个在位企业(B)和一个潜在的进入者(A)扩展形博弈,企业、政府与商业环境,博弈论与竞争策略,找出纳什均衡,企业、政府与商业环境,博弈论与竞争策略,两个纳什均衡,纳什均衡之一是如果A进入市场,B就威胁选择商战,所以A不进入市场,另一个纳什均衡是A选择进入,B随之选择容纳,企业、政府与商业环境,博弈论与竞争策略,一个子博弈纳什精炼均衡,子博弈精练均衡:A选择进入,B选择容纳,是纳什均衡,在博弈每个阶段没有一个博弈方可通过改变策略提高其得益,企业、政府与商业环境,博弈论与竞争策略,威胁与承诺,空头威胁:对对手采取的行动是不需要任何成本的,因此这种威胁是不可置信的,承诺:预先花费成本来严格限制自己行为,从而使威胁成为可置信的,例子:进入博弈,阻止市场进入与剩余生产能力,企业、政府与商业环境,博弈论与竞争策略,在进入发生前在位企业通过不可逆转的投资(800万)来形成一部分剩余生产能力,这部分生产能力在无进入者进入市场时是多余的,但在进入发生时则降低了与进入者进行商战的成本,使在位者的最优选择从容纳改变成商战形成额外的剩余生产能力可以阻止进入,潜在进入者知道他一旦进入,价格战就必然发生,因而构成可置信的威胁形成剩余生产能力的行动在序列博弈中常带有先发制人的意图,因此这种行动被称为事先承诺博弈,企业、政府与商业环境,博弈论与竞争策略,结论,作为博弈方你不应该仅仅是个被动的参与人,满足于接受别人制定的博弈规则,而应该设法改变博弈使其对自己尽量有利可置信的承诺能够促进长期利润,但承诺方也确实因此而对自己的行动施加了严格的限制。这种通过限制自己行动来获取竞争优势的做法被称为策略性行为“一种策略性行为就是某人通过影响其他人对自己行为的预期,来促使其他人选择对自己有利的策略,是某人通过限制自己的行为来限制其对局者的选择”(2005年诺贝尔经济学奖得主托马斯谢林),企业、政府与商业环境,博弈论与竞争策略,举例:协和谬误初始决策与追踪决策,20世纪60年代,英国和法国政府联合投资开发大型超音速客机,即协和飞机。该种飞机机身大、设计豪华并且速度快。但是,英法政府发现:继续投资开发这样的机型,花费会急剧增加,但是这样的设计定位能否适应市场还不知道;而停止研制将使以前的投资付诸东流。随着研制工作的深入,他们更是无法作出停止研制工作的决定。协和飞机最终研制成功,但因飞机的缺陷(如耗油大、噪音大、污染严重等等),它不适合市场,最终被市场淘汰,英法政府为此蒙受很大的损失。在这个研制过程中,如果英法政府能及早放弃飞机的开发工作,会使损失减少,但他们没能做到。,企业、政府与商业环境,博弈论与竞争策略,海盗分赃,有五个海盗,劫掠了100两金子,需要分赃。办法是抓阄,盗亦有道。抓到第一个阄的人,可以先提出一个分配方案,如果他的方案被一半以上的人同意,就照他的方案分金子,否则,第一个人就要被杀掉。余下的人也照此办理。我们的问题是:如果你是第一个人,你会提出怎样的分配方案?,企业、政府与商业环境,博弈论与竞争策略,海盗分赃,答案一定大出乎你的意料!为了分析问题更确定,我们假定每个人都是追求自己利益极大化的人。可能你会提出平均分配,每人20两,或者自己不要,等等。可是正确的答案却并非如此。第一个人会说:100两金子全归我!而且这个方案一定会被一半以上的人同意,这个人不会被杀掉。,企业、政府与商业环境,博弈论与竞争策略,海盗分赃,我们从最后的环节开始考虑。那我们就从抓到最后一个阄的人开始考虑。对于这个人来说,他知道,当轮到他提方案的时候,其他人都已经死掉了,金子将全是他一个人的。所以,他利益最大化行为便是,不管前边谁,包括第一个人,提了任何方案,他都一概摇头,不同意。再看第四个人,他知道,不管自己提出什么方案,第五个人都不会同意,都会被杀掉,所以,他的利益最大化行为是,尽量不要轮到自己提方案。所以,不管第一个人提了怎样的方案,他都会表示同意。,企业、政府与商业环境,博弈论与竞争策略,海盗分赃,第三个人,知道第四和第五个人的选择策略,所以,他的利益最大化的方案是100两金子全归自己。这个方案,因为自己和第四个人同意,超过了此时的一半以上的人的同意,可以行得通,所以,不管第一个人提出什么样的方案,第三个人都会反对。第二个人,知道自己提什么方案,第三个人、第五个人都将反对,一旦轮到自己提,自己就死定了,所以,他会同意第一个人提出的任何方案,这是他的利益最大化行为。,企业、政府与商业环境,博弈论与竞争策略,海盗分赃,所以,不管第一个人提出怎样的方案,第二个人与第四个人都会同意,加上第一个人自己的票,就是三票,一半以上,可以通过。既然任何方案都可以通过,而第一个人又要追求自己利益的极大化,所以,他的方案是:100两金子全归自己。,企业、政府与商业环境,博弈论与竞争策略,脏脸博弈恍然大悟的博弈,三个人在屋子里,不许说话。美女进来说:你们当中至少一个人脸是脏的。三人环看,没有反应。美女又说:你们知道吗?三人再看,顿悟,脸都红了。为什么?因为美女后一句废话点破天机,三个人都知道脏脸的存在,而且推测知道对方也知道了脏脸的存在(因为另两人脸没红,说明他们看到脏脸了),而且知道对方知道自己已经想到上一步循环开始,知识开始共同化,真相大白:三个人都是脏脸,所有人都脸红了。,企业、政府与商业环境,博弈论与竞争策略,脏脸博弈恍然大悟的博弈路遥知马力,日久见人心,当只有一张脸是脏的时候,一旦美女宣布至少有一张脏脸,那么脸脏的那个参与人看到两张干净的脸,他马上就会脸红。而且所有的参与人都知道,如果仅有一张脏脸,脸脏的那个人一定会脸红。在美女第一次宣布时,三个人中没人脸红,那么每个人就知道至少有两张脏脸。如果只有两张脏脸,两个脏脸的人各自看到一张干净的脸,这两个脏脸的人就会脸红。而此时如果没有人脸红,那么所有人都知道三张脸就是脏的,因此在打量第二眼的时候所有人都会脸红。,企业、政府与商业环境,博弈论与竞争策略,脏脸博弈恍然大悟的博弈:共同知识,即便没有美女的宣布,参与者也知道至少有一个人的脸是脏的。为什么美女的一句看似无用的废话,三个人就都知道自己的脸是脏的呢?这就是共同知识的作用。共同知识的概念最初是由逻辑学家李维斯提出的。对一个事件来说,如果所有博弈当事人对该事件都有了解,并且所有当事人都知道其他当事人也知道这一事件,并且所有当事人都知道所有当事人都知道这一事件,那么该事件就是共同知识。,企业、政府与商业环境,博弈论与竞争策略,1天与100天的博弈:共同知识,故事发生在一个村庄,村里有100对夫妻,他们都是地道理性的逻辑学家。村里有一些奇特的风俗:每天晚上,村里的男人们都围坐在篝火旁举行会议,议题是谈论自己的妻子。在会议开始时,如果一个男人有理由相信他的妻子对他总是忠贞的,那么他就在会议上当众赞扬她的美德。另一方面,如果在会议之前的任何时间只要他发现他妻子不贞的证据,那他就会在会议上悲号,并祈神灵严厉地惩罚她。再则,如果一个妻子曾有不贞,那她的情人会立即告知村里除她丈夫之外所有的已婚男人。这真是一种奇异的风俗,但是却为村民承认并遵守。,企业、政府与商业环境,博弈论与竞争策略,1天与100天的博弈:共同知识,事实上,每个妻子都巳对丈夫不忠。于是每个丈夫都知道除自己妻子之外其他人的妻子都是不贞的女子因而每个晚上的会议上每个男人都赞美自己的妻子。这种状况持续了很多年,直到有一天来了一位传教士。传教士参加了篝火会议,并听到每个男人都在赞美自己的妻子,他站起来宣布说:“这个村子里至少有一个妻子已经不贞了。”在此后的99个晚上,丈夫们继续赞美各自的妻子但在第100个晚上,他们全都悲号起来,并向上苍祈求神灵严惩自己的妻子。,企业、政府与商业环境,博弈论与竞争策略,1天与100天的博弈:共同知识,这是一个推理和行动的过程。在传教士做了宣布之后的第一天,如果村里只有一个女人是不忠的话,这个女人的丈夫在传教士宣布之后就能知道。因为,他们做了这样一个推理:如果这个女人是其他女人的话,他应当知道,既然不知道。那么这个不忠的女人肯定就是他的妻子。因此,如果村里只有一个女人不忠的话,在传教士宣布的当天晚上,这个女人的丈夫就会在会议上悲哀哭泣。,企业、政府与商业环境,博弈论与竞争策略,1天与100天的博弈:共同知识,可是这样的情况在第一天晚上并没有发生于是所有丈夫都知道了村子里至少有两个女人不忠。如果只有两个女人不忠,那么这两个女人的丈夫第一天都不会怀疑到自己的妻子,因为他知道另外有一个女人不忠。可是第一天并没有一个丈夫哭泣,这两个不忠的女人的丈夫想,他只知道一个,那么另一个不忠的女人肯定是他的妻子!那么第二天晚上,就会有两个丈夫因为知道妻子不忠而哭泣。,企业、政府与商业环境,博弈论与竞争策略,1天与100天的博弈:共同知识,可是第二天仍然平安无事,于是丈夫们就都知道,至少有三个女人不忠。这样的推理会继续99天就是说,前99天每个丈夫都没怀疑到自己的妻子,而当第100天的时候,每个男人都确定地推理出自己的妻子红杏出墙,于是都开始哭泣。,企业、政府与商业环境,博弈论与竞争策略,1天与100天的博弈:共同知识,传教士对“至少一个女人是不忠的”这个事实的宣布,似乎并没有增加这些男人对村里女人不忠行为的知识,他们其实都知道这个事实。但为什么传教士的宣布使得他们都伤心欲绝呢?根源还在于共同知识的作用。传教士的宣布使得这个村子里的男人的知识结构发生了变化,本来“至少一个女人是不忠的”对每个男人都是知识但却不是共同知识,而传教士的宣布使得这个事实成为“共同知识”。,企业、政府与商业环境,博弈论与竞争策略,共同知识的作用,有两个上匪抢劫路人,抢了一大笔钱,然后就跑到荒郊野外的城隍庙里。土匪甲对土匪乙说道:“这笔买卖让我们做成,是城隍老爷给我们发财的机会我们应该买些酒菜在他面前拜一拜,感激他的恩典。”乙马上同意:“这样很好你去买菜我在城隍庙前等你。”甲走了以后,乙心里就打起了算盘。他想:“这笔钱两个人分,一人只有一半这一半能用多久,”想到这里他就准备了一把斧头。甲买酒菜回来,远远地就喊:“大哥,酒菜买回来了。”不料刚一进门,锋利的斧头一下子从脑后砍来。,企业、政府与商业环境,博弈论与竞争策略,共同知识的作用,甲死后。乙欢喜非凡。打开甲买回来的酒肉自斟自酌。吃饱喝足以后,他刚要站起来拿着那笔钱逃之天夭,忽然觉得天旋地转,腹痛如绞。他挣扎了一会儿,就口鼻流血一命呜呼了。原来,甲也想独得那笔钱,提前在酒菜里放了毒药。让这两个歹徒同时毙命的关键因素就是共同知识的假设。从这个故事中,我们可以看出共同知识的一种作用机制。,企业、政府与商业环境,博弈论与竞争策略,信息不对称与不确定性,客观不确定性是指事物状态的客观属性本身具有不确定性。当存在不确定性时,决策者的决策就具有风险。不确定性和风险有密切的联系,但又是两个不同的概念。直观上很容易理解。一件事情可能出现的结果越多这件事情就越具有不确定性;结果越不明确,不确定性的存在就越显著。最扣人心弦的不确定性,可以称为悬念。,企业、政府与商业环境,博弈论与竞争策略,信息不对称与不确定性,如果你要表现一群人围着一张桌子玩牌,然后突然一声爆炸那么你便只能拍到一个十分呆板的炸后一惊的场面。另一方面虽然你是表现这同一场面,但是在打牌开始之前,先表现桌子下面的定时炸弹,那么你就造成了悬念。风险就是从事后的角度来看由于不确定性因素而造成的决策损失。与此相反把各种不确定性变成相对