南京航空航天大学经济管理学院精品课程群建设组.ppt
,南京航空航天大学经济管理学院精品课程群建设组,灰色博弈理论及其经济应用研究,非合作博弈的产生:博弈论始于1944年,它是以冯诺伊曼(Von Neumann)和摩根斯坦恩(Oskar Morgenstern)合作的博弈论与经济行为一书的出版为标志。到20世纪50年代,合作博弈发展到鼎盛期,非合作博弈也开始产生。纳什(Nash.J.F.)的N人博弈的均衡点(1950),非合作博弈(1951)明确提出了纳什均衡(Nash Equilibrium),图克(Tucker)则定义了囚徒困境(Prisoners Dilemma,1950)。两人的著作奠定现代非合作博弈论的基石。,博弈理论及其经济应用研究的历史,纳什均衡:纳什均衡指的是这样一种战略组合,这种战略组合由所有参与人的最优战略组成,也就是说给定别人战略的情况下,没有任何单个参与人有积极性选择其它战略,从而有积极性打破这种均衡。有句不太褒义的说来说,纳什均衡是一种“僵局”:给定别人不动的情况下,没有人有兴趣动。,纳什均衡的经济意义:假设博弈中的所有参与人事先达成一种协议,规定出每个人的行为规则。那么,我们要问的一个问题是:在没有外在的强制力约束时,当事人是否会自觉遵守这个协议?或者说,这个协议是否会自动实施(Self-enforcing):如果一个协议不构成纳什均衡,它就不会自动实施,因为至少有一个参与人会违背这个协议,不满足纳什均衡要求的协议是没有意义的。,囚徒困境(Prisoner dilemma):,坦白,坦白,抵赖,抵赖,囚徒A,囚徒B,本例中,纳什均衡就是(坦白,坦白):给定B坦白的情况下,A的最优战略就是坦白;同样,给定A坦白的情况下,B的最优战略就是坦白。事实上,(坦白,坦白)还是一个占优战略(Dominant strategy)均衡:就是说,不论对方如何选择,个人的最优选择就是坦白。,囚困境反映了一个很深刻的社会问题:个人理性与集体理性的矛盾。虽然若两囚犯都抵赖,各判刑1年,显然比各判刑8年好。但是,这个帕累托改进办不到,因为它不满足个人理性要求,(抵赖,抵赖)不是纳什均衡。换个角度看,即使两囚犯在被抓住之前建立一个攻守同盟(死不坦白),这个盟约也没有效力,因为它不构成纳什均衡,没有人有积极性遵守这个协议。,逆向归纳法(Backward Induction):泽尔腾(R.Seleten,1965)首次将动态分析引入博弈论,提出了纳什均衡的第一个重要改进子博弈精炼纳什均衡(Sub-game Perfect Nash Equilibrium)和其求解方法逆向归纳法(Backward Induction)。博弈论专家常常使用“序惯理性”(Sequential rationality):指不论过去发生了什么,参与人应该在博弈的每个时点上最优化自己的策略。子博弈精练纳什均衡所要求的正是参与人应该是序惯理性的。对于有限完美信息博弈,逆向归纳法是求解子博弈精炼纳什均衡的最简便的方法。因为有限完美信息博弈的每一个决策结都开始一个子博弈。求解方法:最后一个结点上的子博弈(纳什均衡)倒数第二个(纳什均衡)初始结点上的子博弈(纳什均衡)。,豪尔绍尼(Harsany,1967)首次把信息不完全因素引入博弈分析,定义了不完全信息静态博弈的基本均衡概念贝叶斯纳什均衡(Bayesian-Nash Equibrium),构建了不完全信息博弈的基本理论。之后,不完全信息动态博弈(Dynamic game of incomplete information)得到迅速发展,弗得伯格和泰勒尔(Furdenberg and Tirole,1991)定义了它的基本概念精炼贝叶斯纳什均衡(Perfect Bayesian-Nash Equilibrium)。,博弈论的体系结构,博弈论的划分可以从两个角度进行。第一个角,度参与人行动的先后顺序。从这个角度,博弈可以划分为静态博弈(Static game)和动态博弈(Dynamic game)。静态是指参与人同时选择行动,或虽非同时但行动者并不知道前行动者采取了什么具体行动;动态是指参与人的先后行动顺序,且后行动者能够观察到先行动者物选择的行动。第二个角度,参与人对对手的特征、战略空间及及支付函数的认识。从这个角度,博弈可以划分为完全信息博弈和不完全信息博弈。,博弈论的体系结构,博弈论的分类,经典博弈论的总结20世纪70年代之后,博弈论形成了一个完整的体系。大体从20世纪80年代开始,博弈论逐渐成为主流经济学的一部分,尤其是在现代寡占理论和信息经济学方面的应用成绩裴然,在一定程度上,甚至可以说它已成为微观经济学的基础。1994年诺贝尔经济学奖被授予纳什、豪尔绍尼和泽尔腾三人,以表彰他们在博弈论的发展及应用中所作出的开创性的工作。,博弈论的展望,回顾博弈理论的研究与应用的发展历史,今天,我们可以这样说,博弈理论不仅在经济学而且在许多其它领域都得到了成功的应用并产生了深远的影响,如:“囚徒困境”问题的定义与解决对经济学、社会学、政治学和犯罪心理学等多个学科和领域都产生了重要的影响。“双层次博弈”理论(TwoLevel Games,Robert D.Putnam,1988)是有关国际谈判中国内与国际因素互动的一种理论,它对国际上的局部冲突、经济与政治等关系中许多问题的解决所发挥的作用是不可低估的。博弈理论在管理领域里也产生了深刻的影响并有可能形成一门新兴的交叉学科(或称改写管理学)(管理博弈论:一门新兴的交叉学科,侯光明,李存金,北京理工大学学报(社科版),2001)。非合作博弈理论极有可能为社会科学之间的统一整合提供一种理论上的支持(Roger B.Myerson,1999)。博弈论不仅已经改造了整个经济学,而且还将改造社会学(理性、均衡与演进博弈论:一个关于博弈理论发展的评述,南开经济研究,李军林,2000.4)。,2、理性的困惑与博弈理论的新生,2.1经典博弈与主流经济学的理性假设完全一致我们知道,主流经济学的理性主义假设已经成为主流经济学家极为便利的分析前提,作为经济学的一个分支博弈论,它是以行为主体行为作为自己的主要研究对象的一种理论,而其对行为主体的逻辑出发点与主流学并无二致,也认为行为主体的行为是符合理性原则的(事实上,博弈论对行为主体的理性要求比主流经济学的理性行为人的假设更高、更严格,上海财经大学学报有限理性条件下的进化博弈理论,谢识予,2001.10)。也正因为如此,以理性假设为基础发展起来的非合作博弈理论不仅有着优美、严密的数学推理与数学模型,而且经济学家们发现几乎所有的经济问题都可以被理解为行为人之间的互动问题(理性、均衡与演进博弈论一个关于博弈理论发展的评述,南开经济研究,李军林,2000.4)。,2.2人们真的能达到这样的理性吗?,现实中,人的行为是否是完全理性的却引起了人们普遍的怀疑。在博弈论的发展过程中,为了验证理论同现实的一致性,有的学者设计了一些由许多人参加的博弈实验,对他们的实际策略选择加以观察,看其是否符合博弈论的理论预测,即实验博弈论(Experimental Game Theory)。但实验结果往往并不和理论预测完全一致。就其原因而言,问题主要出在博弈论对行为主体的理性行为的假设上。,2.2人们真的能达到这样的理性吗?,博弈论中的一个重要的假设就是博弈双方行为人的共同知识的假设,例如,假设所有行为人的理性是共同知识,即“所有参与人都是理性的,所有参与人知道所有参与人都是理性的,所有参与人知道所有参与人知道所有参与人都是理性的”如此类推,以致无限。这是一个令人难以想象的无限过程,就行为人对现实世界的认识能力而言,这是一条非常严格的假设。很显然,现实世界这种假设通常是得不到保证的,这正是经典博弈论所遇到的最大的困惑之一。事实上,人们在大多数比较复杂的决策问题中表现出来的理性,都无法满足博弈论的完全理性的要求。不仅人们的个人选择会经常犯错误,集体决策同样也经常会犯错误。人类社会频繁发生的各种战争冲突,企业选择领导人的盲目性和低效率等,都是人类集体选择决策理性不完全的证据。,2.3理性一定能得到更满意的结果吗?,这是A、B两个博弈方,进行下列形状像蜈蚣似的扩展性表示的多阶段动态博弈。如果两个博弈方都是理性的和追求自己最大利益的,运用逆推归纳法进行分析,应该是博弈方A在第一个选择节点就选择D,结束博弈,双方得益都为1。,2.3理性一定能得到更满意的结果吗?,因为如果A放弃选择,博弈方B一旦选择d结束博弈,则B的得益为3,而A的得益为0。作为理性经济人A是不愿看到这样的结局的。但很遗憾,A一旦在第一个选择点就选择D,这个逆推归纳法预言的结果是令人悲伤的,因为与该博弈的其它可能的结果相比,这个结果几乎是最差的一个。因此,从追求经济利益最大化的理性经济人为出发点的最优选择,最终会导致几乎是极差的结果。这个事实表明:或者是推理有问题,或者是逻辑起点有问题。由于逆推归纳法在逻辑上是经得起检验的,那么,这就不得不使人们会对纳什均衡的逻辑前提“我相信我的竞争者同我一样是理性的和追求它们的最大利益”(即理性经济人)表示怀疑(吴德勤,纳什均衡的内涵、问题和前景读纳什均衡论,上海大学学报(社会科学版),2001.2)。,3、进化博弈理论的诞生,正是由于经典博弈理论中的这一无法圆满解决的理性困惑问题,却摧生了进化博弈理论(它放弃了经典博弈论的充分理性假说,将生物视为有限理性的当局者,它们在相互竞争的同时完成自身的进化,合理解释了某些生物习性的形成。Maynard Smith,J.1982)。20世纪60年代生物学家们就已经用进化博弈理论来解释生态现象了,特别是Maynard和Price(1973)及Maynard(1974)提出进化稳定策略(Evolutionarily Stable Strategy,ESS)这一进化博弈的基本概念之后,该理论逐渐被广泛地运用生态学、社会学和经济学等领域。,3、进化博弈理论的诞生,近年来,在国外有关进化博弈的理论研究与应用方面的文章已经占据了博弈论文献中的一个较大的份额,而且越来越大(On economy applications of evolutionary game theory,Evolutionary Economics,J Evol Econ(1998)8:15-34,Daniel Friedman,1998)。目前,国外主要用于刊载进化博弈及其相关内容文章的英文版杂志主要:Evolutionary Economics,Journal of Mathematical Biology,International Journal of Game Theory,Review of Economic Design 等等。如果说经典博弈理论的发展对经济、社会和其它各相关领域所产生的影响是人们始料不及的。那么,今天,人们对进化博弈理论寄予了更高的期望。,4、灰系统的理论和思想在博弈领域中的可能的应用及其前景展望,4.1经典博弈理论所涉及的研究与应用的主要领域从整个博弈论的发展过程来看,博弈理论是在回答了一个个的现实向其提出的问题同时,而使其自身不断地走向完善。今天,应该可以说,博弈理论获得了惊人的发展。前不久,我们在相关网站对近几年来有关博弈理论研究与应用方面的文章进行了检索,共检索到有关中文文章近2000多篇。这些文献涉及到博弈理论与应用研究的各个方面。从对这些文献的初步研究中,我们发现:无论是经典博弈理论还是进化博弈理论都是建立在经典数学基础之上的,所解决的博弈问题主要涉及到,完全信息静态、完全信息动态、不完全信息静态、不完全信息动态和基于有限理性的进化博弈问题等。,4.2经典博弈理论存在的主要缺陷,现实世界除了不完全信息(博弈论中的不完全信息有着特定的含义,即:满足支付函数是所有参与人的共同知识这一假定的博弈,称为完全信息博弈;否则,则称之为不完全信息博弈)和有限理性(完全理性是指:博弈过程中的行为主体始终以自身最大利益为目标,具有在确定和不确定环境中追求自身利益最大化的判断和决策能力,还要求他们具有在存在交互作用的博弈环境中完美的判断和预测能力;不仅要求人们自身有完美理性,还要求人们相互信任对方的理性,有理性的共同知识(有限理性条件下的进化博弈理论,上海财经大学学报,谢识予,2001.10);我们把不满足这一假设条件的理性,称之为有限理性)等之外,还有未来的不确定性、有限知识(或称有限信息、贫信息,灰色系统理论及其应用,刘思峰等著,科学出版社,1999)等等许多问题。然而遗憾的是,对于这些问题,在目前的博弈理论中涉及的极少,尤其是有限知识等问题,就更是如此。,4.3博弈过程中灰信息产生的原因,我们知道,由于人的认识能力、知识水平和时间等等多种因素的限制,有限知识(灰信息)是普遍存在的,这就导致了人们对系统的认识不可能部是十分完全的,也就是说,展现在人们面前的系统往往不是“白”的,而是“灰”的。一般认为在以下四种情况下,系统信息表现为不完全,或称为灰的(灰色系统理论及其应用,刘思峰等著,科学出版社,1999):(1)元素(参数)信息不完全;(2)结构信息的不完全;(3)边界信息的不完全;(4)运行行为信息的不完全。由此可以推断,博弈理论中所涉及到的许多问题几乎都是灰的,然而,目前的博弈理论对这些现实中的灰系统几乎都采用了过份简化的方法(将这些灰系统简单的看作白系统)进行处理,而这样做的必然结果是导致了博弈论的预测对现实的指导作用大打折扣。,4.4经典博弈论中的灰思想,事实上,在经典博弈理论的某些不确定信息问题的处理上,就已经表现出了灰系统思想的应用。例如,在一个不完全信息的抓钱博弈(博弈论与信息经济学张维迎者,上海人民出版社,1996.6)中,就引入了参与人的类型,且假定 在 的区间上均匀分布,其损益值矩阵如表1所示。然而,到目前为止,系统地运用灰系统理论解决博弈问题的文献却极为少见。表1 不完全信息抓钱博弈,4.5灰系统理论博弈论中的应用,我们知道,灰系统理论与其它一些不确定性数学(概率统计,模糊数学等)相比,它有着自己的独特的研究对象、研究领域和研究方法。在一定的程度上,我们可以这样说,灰系统理论可以为处理博弈论中的有限理性和有限知识等问题提供丰富的思想营养和一定的方法手段。如果我们能够将灰系统理论与博弈(经典博弈与进化博弈)问题相结合,那么它将能够使博弈模型更加符合人们的社会和经济生活的实际、更加符合人们的直观感觉、从而使其模型具有更强的适用性。,4.5我的研究方向,我的博士论文选题灰色博弈理论及其经济应用研究,就是相借用灰系统理论的丰富的思想营养与相关的方法手段来研究和解决博弈论中的有限理性和有限知识等问题。创建与现实经济问题结合更加紧密的灰矩阵、灰双矩阵和灰进化博弈模型,并设计出简洁、高效的解的概念及其结构体系,完成其一些基础性的研究工作,创建与设计灰矩阵、灰双矩阵和灰进化博弈理论的框架(体系),从而为解决现实经济问题提供一种有力的工具灰矩阵、灰双矩阵和灰进化博弈理论。,5、基于区间数大小可以直接判定的灰矩阵博弈的纯策略解研究,事实上,在二人有限零和博弈过程中,博弈双方所依据的损益值矩阵大部分都是局中人的事先判断的。然而,由于人的认知水平的限制、信息的不完全因素、系统的结构性和随机性波动等因素的影响,使得人们在事先无法对其博弈结果值做出十分精确的判断。而且,从二人有限零和博弈的事后博弈结果来看,尽管其实际的博弈结果是,各局中人的所得之和为零,也就是说,其事后值是清楚的。然而,现实中,由于各种随机因素和非随机因素的影响,使得这种博弈,既使在纯策略意义下,在下一次被完全重复,其实际博弈结果所表现的各局中人的损益值未必与上一次完全一致。,灰博弈问题的一个现实的例子例如,在一个相对封闭的彩电市场上,有1、2两家寡头垄断厂商瓜分了市场,他们为了抢占更多的市场份额而采取各种策略(降价、高质量的服务、增加产品功能、提高产品质量等)相互博弈竞争;但是由于各种原因,局中人对其各种可能的局势所产生的损益值事先无法做出精确的估计;事实上,既使在较严格的限制条件下,由于各种随机因素和非随机因素的影响,使得这种博弈的任意两次的博弈损益值也不可能完全一致。也就是说,在现实中,有些二人有限零和博弈的损益值矩阵不可能是完全清楚和准确的,从而可以用一个准确的白数来表示的。,该问题的纯策略问题的求解是简单的,可以模仿经典矩阵博弈问题进行,只是其解(鞍点)不再是一个点,而是一个可能的灰数区间,我们称其为灰鞍点。,6、基于区间数大小不能直接判定的灰矩阵博弈的纯策略解研究,对于区间灰数大小不能直接判定的灰矩阵博弈 问题,它的纯策略解的求解问题的关键在于 中区间灰数大小判定准则的设定与判定方法的设计。本文运用灰色系统思想和系统工程的理论,揭示了人们在灰信息条件下的博弈心理与博弈决策规则,提出了区间灰数的优势、均势和劣势的概念,证明了某一区间相对于另一区间灰数而言,它们的各种势之和为1,且区间灰数的势之间具有良好的传递性;在此基础上,定义了灰数势意义下的纯策略解,且证明了这一纯策略解(或称灰势鞍点)存在的充要条件。最后,以某单位在煤价在一定范围内波动情况下冬季取暖用煤的贮量决策问题为例,对其灰势意义下的纯策略解问题进行了研究。,7、基于灰区间数表征的矩阵博弈的混合策略解研究,运用灰系统的思想和系统工程理论,本文建立了灰矩阵博弈的混合策略解、策略的“直接大(小)化”、“间接大(小)化”、局中人的最乐观与最悲观损益值矩阵和最优灰博弈值等概念;证明了局中人策略的直接大(小)、间接大(小)化的引理和局中人某策略的最大、最小概率解的定理。在此基础上,本文进一步的定义了的最优博弈值解的概念,并给出了相应的求解方法及其证明。最后,本文以某单位采购员在秋天要决定冬季取暖用煤的贮量这一实际问题为背景,运用灰矩阵博弈理论对该问题进行了研究,取得了良好的效果。,8、基于灰区间数矩阵博弈的势最优纯策略解风险问题研究,本文运用灰数的均势度、劣势度和优势度判定规则和方法,揭示了人们在有限理性和有限知识背景下进行灰博弈决策的规律,设计了人们在灰博弈过程中的决策规则,即:局中人均从各自可能出现的灰博弈值的势最小(最不利)的情形中选择一种灰博弈值的势最大(最有利)的情形进行决策(这也是灰博弈双方都能接受的一种稳妥的办法)。在此基础上,本文对灰矩阵博弈问题的势最优纯策略解的高估、低估风险进行了识别与定义,设计了灰矩阵博弈中势最优纯策略意义下的局中人1和2的最大高估与低估风险的测定算法,能对其势最优纯策略解的风险大小进行测定。,8、基于灰区间数矩阵博弈的势最优纯策略解风险问题研究,问题?,8、基于灰区间数矩阵博弈的势最优纯策略解风险问题研究,9、基于灰区间数矩阵博弈其它相关问题的研究,(1)灰矩阵博弈的最优混合策略解及其风险分析,(2)灰矩阵博弈的满意策略及其局势控制问题研究,(3)灰矩阵博弈的策略优超问题研究,(4)一种基于多种群的链结构矩阵进化博弈互动学习模型算法研究,10、基于有限理性的一级密封价格拍卖灰博弈模型研究-1,-基于准确的价值和经验理想报价估价的最优灰报价模型,运用灰系统理论的思想,对目前的一级密封价格拍卖博弈模型进行检验和验证,并对其存在的一些缺陷进行了剖析,认为这些经典模型对条件的限制过于严格,与现实的吻合性较差。基于有限理性假设,设计了经验理想报价灰修正系数,建立了基于准确的价值和经验理想报价估价的有限理性最优灰报价模型。对该模型灰系数进行第一标准灰数变换,找到了投标人的威胁反应灰系数;发现了投标人的最优灰报价不仅取决于其自身的价值,而且还取决于他人的价值及其威胁反应灰系数;投标人的最优灰报价不仅仅刚好为其对被拍物品所认可价值的一半,而要视情而定,一般情况下均高于其所认可价值的一半。对该模型进行了数据仿真,得到一些与经典模型有较大差异的有价值的结论,并建议了投标人的最佳投标模式。,10、基于有限理性的一级密封价格拍卖灰博弈模型研究,-基于准确的价值和经验理想报价估价的最优灰报价模型,10、基于有限理性的一级密封价格拍卖灰博弈模型研究,-基于准确的价值和经验理想报价估价的最优灰报价模型,10、基于有限理性的一级密封价格拍卖灰博弈模型研究,-基于准确的价值和经验理想报价估价的最优灰报价模型,11、基于有限理性的一级密封价格拍卖灰博弈模型研究研究-2,-基于非精确价值和经验理想报价估价的最优灰报价模型,运用灰系统理论的思想,并考虑到信息的不确定性,从投标者对被拍物品的价值估计和其经验理想报价均为区间灰数这一角度出发,对论文基于有限理性的一级密封价格拍卖灰博弈模型研究(1)-基于准确的价值和经验理想报价估价的最优灰报价模型中的模型进行了修正,提出了最优灰报价与灰期望效用的概念,构建了更加符合拍卖实际情况的基于灰价值和灰经验理想报价估价的最优灰报价模型.此外,本文运用Matlab语言编制了仿真程序,对该模型进行了数据仿真.仿真效果良好,并在此基础上得到了一些更加符合实际的结论.,12、基于对称情形的进化博弈的博弈链模型研究,本文针对目前的进行博弈模型不能对一次性博弈结果或短期经济均衡等进行预测的缺陷,构建了基于对称情形的进化博弈的博弈链模型。深刻地揭示了,博弈各方在进化博弈过程中的相互依存与相互转换的关系,建立了博弈各方在每一步博弈过程中的个体数量及其期望平均收益的递推关系。在此基础之上,我们以某鹰鸽博弈为例,对其复制动态与进化稳定策略进行了仿真分析。仿真实验表明:鹰鸽博弈存在唯一的进化稳定策略的均衡点,在该点的左边区域是鹰的复制进化区域(鹰的数量增长,鸽的数量减少),而在该点的右边区域是鸽的复制进化区域(鸽的数量增长,鹰的数量减少)。,12、基于对称情形的进化博弈的博弈链模型研究,12、基于对称情形的进化博弈的博弈链模型研究,13、基于非对称收益进化博弈的博弈链模型研究,本文首次揭示了生物的试错进化博弈现象。,14、进化博弈的博弈链模型研究的小结,进化博弈链模型的建立,能够对进化博弈过程进行更加形象生动表达,便于对现实生活中的许多博弈问题进行构模和分析。它既能对进化博弈的长期稳定趋势进行分析,也能够对其近期和可能进化轨迹进行预测。本文仅就非对称收益情形的进化博弈问题的博弈链模型进行了初步地研究。事实上,基于非对称收益情形的进化博弈问题的博弈链模型的构模方法灵活、形式生动、便于对所研究的博弈问题的理解和更深入地研究,其理论研究与实际应用的内容也十分丰富,有关进化博弈问题的博弈链模型的其它方面内容的研究,作者将另文阐述。,鸣谢:本人对关心、支持灰系统创新集体和我的研究工作的各位领导、专家、老师和同学表示:衷心感谢!,