博弈论概述2完全信息静态博弈3完全信息动态博弈课件.ppt
1.博弈论概述2.完全信息静态博弈3.完全信息动态博弈4.不完全信息静态博弈5.不完全信息动态博弈,第十章 博弈论,第一节 博弈论概述,博弈论(the Game Theory)也就是运筹学中的对策论,“是关于策略相互作用的理论”,研究两个或两个以上参加者在对抗性或竞争性局势下如何采取行动,如何作出有利于己方的决策及其均衡问题。对策思想最早产生于我国古代。对策思想明确地应用于经济领域,始于Cournot(1838),Bertrand(1883),Edgeworth(1925)等人关于寡头竞争、产量与价格垄断、产品交易行为的研究。,John F.Nash Jr,博弈论提供了一种研究人类理性行为的通用方法,运用这些方法可以更为清晰完整地分析各种社会力量冲突和合作的形势,具体分析人与人之间在利益相互制约下理性主体的策略选择行为及相应结局。博弈论强调在既定约束条件下追求效用最大化(服从微观经济学的一般分析方法)。同时,信息和时序问题成为博弈论的两个重要的分析工具。,一、博弈论的基本概念,博弈论研究人与人之间相互“斗智”的形式和结果。当经济主体间的利益存在冲突时,一方所获得的利益不仅取决于自己所采取的行动,而且也取决于其他主体采取的行动或对自己行动的反应。博弈论就是描述在这种形势下各方理性地选择自己的行动所实现的结果,分析各决策主体的行为发生相互作用时的决策以及这种决策的均衡问题。博弈论的基本概念包括:局中人、策略、支付。局中人(Player):局中人是指在博弈中选择行动以最大化自身效用的决策主体。可能是个人或团体(如国家、企业等)。,策略或策略空间(Strategy):策略是局中人选择行动的规则,它规定局中人如何对其他人的行动作出反应,即在每种可能的情况下应该如何行动。它与行动不同,行动是局中人的决策变量。如“人不犯我,我不犯人;人若犯我,我必犯人”是一种策略,而“犯”与“不犯”是两种不同的行动,策略规定了什么时候选择“犯”什么时候选择“不犯”。局中人可选择的策略的全体构成了策略空间(或策略集)。支付(Payoff)(支付函数与支付矩阵):博弈论中,可用数值表示各局中人从博弈中所获得的收益或效用水平,该数值称为支付。支付依赖于各个局中人所作出的策略,这种收益与策略的依赖关系构成了支付函数。参与博弈的多个局中人的收益可用一个矩阵或框图表示,这种矩阵或框图叫做收益矩阵。,除此之外,博弈论中的基本概念还包括:行动、信息、结果和均衡。它们关系是:行动是局中人的决策变量;信息是局中人在进行博弈时有关其他局中人的特征和行动的知识;结果是博弈分析者感兴趣的要素的集合;均衡是所有局中人的最优策略或行动的集合。,根据博弈者选择的策略,博弈论可划分为合作博弈与非合作博弈。纳什(Nash)、泽尔腾(Selten)和海萨尼(Harsanyi)(1994诺贝尔经济学奖获得者)的主要贡献在于非合作博弈方面,而且现在大多数经济学家论及博弈时,也主要是指非合作博弈。,一、博弈论的基本概念,合作博弈和非合作博弈的区别在于人们的行动为相互作用时,当事人能否达成一个具有约束力(binding agreement)的协议。若有,就是合作博弈;否则就是非合作博弈。例如,两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,且各自按该协议生产,即是合作博弈。其面临的问题是如何分享合作带来的剩余。但若两个企业间的协议不具有约束力,即没有哪一方能强制另一方遵守该协议,每个企业都只选择自己的最优产量(或价格),则是非合作博弈。另外,合作博弈强调的是团体理性、效率、公正和公平。非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的。,从局中人行动的先后顺序可划分为静态博弈(Static game)和动态博弈(dynamic game)。静态博弈是指在博弈中,局中人同时选择行动或虽非同时行动但后行动者并不知道先行动者采取了什么具体行动。动态博弈是指局中人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。从局中人是否具有有关其他参与人(对手)的特征、策略空间及支付函数方面的知识的角度,可划分为完全信息博弈(game of complete information)和不完全信息博弈(game of incomplete information)。,“完全信息”指的是每个局中人对所有其他参与人的特征(策略空间、支付函数等)有完全的了解,“静态”指的是所有局中人同时选择行动且只选择一次。纳什均衡是完全信息静态博弈解的一般概念,也是所有其他类型博弈解的基本要求。本节先讨论纳什均衡的特殊情况,然后讨论纳什均衡的一般概念。在博弈论里,一个博弈可以有两种表述方式:一种是策略式(strategic form representation)表述,另一种是扩展式(extensive form representation)表述。前者适合于讨论静态博弈,后者适合于讨论动态博弈。在策略式表述中,所有参与人同时选择各自的策略,所有参与人选择的策略一起决定每个参与人的支付。,第二节 完全信息静态博弈,通常情况下,每个局中人的支付是博弈中所有参与人策略的函数,故每个局中人的最优策略选择依赖于所有其他参与人的策略选择。但在一些特殊博弈中,一个参与人的最优策略选择可能并不依赖于其他参与人的策略选择,即无论其他参与人选择什么策略,他的最优策略是唯一的,这种最优策略被称为“占优策略”(dominant strategy)。例:“囚徒困境”囚徒困境是博弈论中的经典案例。该故事讲的是,两个嫌疑犯作案后被警察抓住,分别被关在不同的房间里进行审讯。警察知道两人有罪,但缺乏有力的证据,除非两人之中有一个坦白。警察告诉每个人,他们的可选择的策略与支付如下表:,一、占优策略均衡,在该博弈中,每个囚徒有两种可能选择的策略:坦白和抵赖。显然,无论同伙选择什么策略,每个囚徒的最优策略都是“坦白”。如,B选择坦白,若A选择坦白时支付为-8,选择抵赖时支付为-10,因而坦白比抵赖好;若B选择抵赖,A坦白时的支付为0,抵赖时为-1,因而坦白比抵赖好。即是说,“坦白”是A的占优策略。同样,“坦白”也是B的占优策略。,三、纳什均衡,纳什均衡(Nash equilibrium)是指这样一种均衡,博弈中的每个局中人都确信,在其他局中人策略给定的情况下,他选择了最优策略。其核心思想是:博弈的理想结局是,每个局中人选择的策略是对其他局中人所选策略的最佳反应,其中每一个局中人都不能因单方面改变自己的策略而获益。,当参与人的策略空间很大时,按上述方法检查每一个策略组合是不是纳什均衡很繁琐。在两人博弈中,有一简单的方法。首先,考虑A的策略,对于每一个B的给定策略,找出A的最优策略,在其对应的支付下划一横线,然后,用类似的方法找出B的最优策略,若某个支付格的两个数字下都有横线,则该格对应的策略组合就是一个纳什均衡。,表,纳什均衡的弱点:(1)多重性。同一博弈里有时会出现多个纳什均衡,即一般怀况下不能保证其唯一性.(2)有些纳什均衡并不合理。,