第1章 战略式博弈ppt课件.ppt
第一部分: 完全信息静态博弈,第一章 战略式博弈,主要内容:一、基本概念;二、战略式博弈。,主要内容:一、基本概念;二、战略式博弈。,第一章 战略式博弈,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例子:新产品开发博弈,两企业(不妨称为企业1和企业2)准备各自开发同一新产品,并投放市场。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,新产品开发的投入产出图,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,新产品开发博弈(续),每个企业在新产品开发中的收益(产出),不仅与自己的决策和市场的需求大小有关,而且还与另一企业的决策有关。一般都假设每个企业都知道投入产出图,或者说每个企业跟读者一样,都同时在一起看到了投入产出图。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,新产品开发博弈(续),企业决策时仍可能面临如下不确定性:每个企业决策时是否知道市场的需求,即能否确定市场的需求是大还是小;每个企业决策时是否知道另一企业的 决策,即能否确定另一企业是开发还 是不开发。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,新产品开发博弈(续),根据企业对上述不确定性的了解程度,我们可以将上述“新产品开发博弈”问题定义为本书将要探讨的四类博弈问题:完全信息静态博弈;完全信息动态博弈;不完全信息静态博弈;不完全信息动态博弈。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,完全信息博弈问题,假设市场需求确定: 企业1和2决策时都已知道市场需求,那么在博弈开始之前,由于每个企业都看到了投入产出图,使得每个企业该知道的信息都已知道,不存在任何事前(即博弈开始之前)的不确定性。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,对完全信息博弈问题进一步划分,根据企业的决策是否存在时序上的差异,企业是否同时决策将所探讨的完全信息博弈问题分为:完全信息静态博弈:两个企业同时决策,即不存在决策时序上的差异;完全信息动态博弈:两个企业先后决策,即存在决策时序上的差异。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,不完全信息博弈问题,假设市场需求不确定: 至少有一个企业决策时不知道市场需求,那么在博弈开始之前,对于不知道市场需求的企业,虽然知道(看到)投入产出图,但仍然存在一些与他的决策有关的信息,他无法确定。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,对不完全信息博弈问题进一步划分,根据企业的决策是否存在时序上的差异可将不完全信息博弈问题分为:不完全信息静态博弈:两个企业同时决策,即不存在决策时序上的差异;不完全信息动态博弈:两个企业先后决策,即存在决策时序上的差异,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,一、基本概念,参与人;行动;战略;支付;信息;,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,1. 参与人,参与人(player,亦称局中人),是指博弈中选择行动以最大化自己效用的决策主体。可能是个人,也可能是团体,如国家、企业或组织等。例如,“新产品开发博弈”中的企业1和2。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,有关参与人的标记,除特别指出外,一般都假设参与人为满足完全理性的决策主体,并且用 表示n人博弈中的参与人; 表示所有参与人的集合。在“新产品开发博弈”中, 。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,一、基本概念,参与人;行动;战略;支付;信息;,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,2. 行动,行动(action),是参与人在博弈的某个时点的决策变量。例如,“新产品开发博弈”中的企业的选择“开发”和“不开发”。在博弈分析中,一般假设参与人都必须有多个(两个或两个以上)可供选择的行动。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,有关行动的标记,用 表示参与人 的行动, 表示参与人所有行动的集合。例如,“新产品开发博弈”中,行动不仅可以为离散型变量,也可以是连续型变量。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,有关行动的标记,在n人博弈中,n个参与人行动的有序集 是n个参与人的行动组合(action profile,亦称为“行动断面”)。它表示博弈中每个参与人 采取一个行动的一种博弈情形(situation),其中 表示参与人i所采取的行动。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,有关行动的标记的例子,在“新产品开发博弈”中:行动组合(开发,开发) (即 )表示博弈中企业1和2都采取行动“开发”;行动组合(不开发,开发) ( 即 )表示博弈中企业1采取行动“不开发”,而企业2采取行动“开发”。用A表示所有行动组合的集合。在“新产品开发博弈”中,存在四个行动组合,即,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,一、基本概念,参与人;行动;战略;支付;信息;,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,3. 战略,战略(strategy),是参与人的行动规则,它规定了参与人在每一种轮到自己行动的情形下,应该采取的行动。它是与博弈的行动顺序相关的行动的有序集,也是构成博弈问题的基本要素之一。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,3. 战略,例如,在“新产品开发博弈”中,假设博弈中参与人的行动顺序(决策时序)是:企业1先采取行动,企业2观测到企业1的行动后再采取行动。在这样的博弈行动顺序下,轮到企业2行动时,可能面临的决策情形就会有两种:企业1已采取行动“开发”和企业1已采取行动“不开发”。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,3. 战略,企业2的战略就必须告诉(规定)企业2: 当企业1采取行动“开发”时,自己应该怎样行动(“开发”还是“不开发”);当企业1采取行动“不开发”时,自己应该怎样行动(“开发”还是“不开发”)。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,关于战略的标记,在n人博弈中,用 表示参与人 的战略; 表示参与人 在博弈中可能面临的所有决策情形的集合,称为观测集。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,关于战略的标记,参与人 在博弈中的战略可以定义为从观测集 到行动集 的映射关系,即用 表示参与人所有战略的集合。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,新产品开发中参与人战略的标记,例如,在“新产品开发博弈”中,假设博弈中参与人的行动顺序(决策时序)是:企业1先采取行动,企业2观测到企业1的行动后再采取行动。那么企业2行动时面临的决策情形就有以下两种:情形 :企业1已采取行动“开发”;情形 :企业1已采取行动“不开发”。所以,,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,新产品开发中参与人战略的标记,企业2的战略集 就包含以下四个战略:战略 : ,战略 : ,战略 : ,战略 : ,企业1的战略集 就包含以下两个战略:战略 :战略 :,企业1的战略集和行动集相同。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,完全信息静态博弈的战略,在完全信息静态博弈中,由于不存在决策时序上的差异,所有参与人在同一决策时点即博弈开始的那一时刻决策,因此,所有参与人面临的决策情形都只有一种,所以,参与人的战略集与行动集相同。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,关于战略组合的标记,在n人博弈中,用 表示 n个参与人的战略组合(strategy profile),它表示博弈中每个参与人 采取战略组合中相应战略 的一种博弈情形。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,关于战略组合的标记,例如,在“新产品开发博弈”中,战略组合 表示博弈中企业1采用战略 (即博弈开始采取行动“开发”),企业2采用战略 (即观测到企业1采取行动“开发”,则采取行动“不开发”;企业1采取行动“不开发”,则采取行动“开发”)。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,关于战略组合的标记,用 表示博弈中所有战略组合的集合。在“新产品开发博弈”中,对于上述博弈行动顺序,显然存在8种战略组合,即,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,一、基本概念,参与人;行动;战略;支付;信息;,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,4. 支付,支付(payoff),是指参与人在博弈中的所得。 在博弈分析中,除特别说明外,一般情况下也是用效用函数来表示参与人在博弈中的所得(即支付)。因此,参与人的支付就可表示为一种特定博弈情形(如行动组合或战略组合)下参与人得到的确定效用水平或期望效用水平。对于追求效用最大化的完全理性参与人而言,支付是博弈中每个参与人真正关心的东西。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,关于支付的标记,用 表示参与人i的支付(效用水平),支付组合 表示参与人在特定博弈情形下所得到的支付,其中为参与人i的支付。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,关于支付的标记,博弈中每种特定博弈情形的出现都是参与人相互作用的结果,因此,参与人在每种博弈情形下的支付(效用水平),不仅与自己的选择(行动或战略)有关,而且还与其他参与人的选择(行动或战略)有关。参与人 的支付可表示为:,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,关于支付的标记,用 表示除参与人i以外其他参与人的战略组合,则 因此,参与人 的支付就可表示为:,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,新产品开发中参与人支付的标记,在“新产品开发博弈”中,参与人的利润就是其支付;在市场需求大的情况下: 如果参与人都选择“开发”,则其支付都为 300万元,即 , ; 如果参与人1选择“开发”,而参与人2选择“不开发”,则参与人1的支付为800万元,而参与人2的支付为0,即 , 。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,新产品开发中参与人支付的标记,在市场需求小的情况下: 如果参与人都选择“开发”,则 ; 如果参与人1选择“开发”,而参与人2选择“不开发”,则 , 。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,根据参与人的战略组合得到参与人支付,例如,对于前面所设定的博弈行动顺序(企业1先采取行动,企业2观测到企业1的行动后再采取行动),战略组合 下参与人的支付为:市场需求大的情况下:市场需求小的情况下:,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,一、基本概念,参与人;行动;战略;支付;信息;,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,5. 信息,信息(information),是参与人所具有的有关博弈的所有的知识,如有关其它参与人行动或战略的知识、有关参与人支付的知识等等。信息是对博弈问题进行系统科学分析的基础,在不同的博弈问题中,根据具体情况博弈问题具有不同的关于博弈信息的假设。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,5. 信息,在“新产品开发博弈”中,企业都知道(或看到)投入产出图就是博弈分析中有关信息的一个基本假设。如果两个企业都知道市场需求,那么这样的博弈情形就是我们前面所提到的完全信息假设;如果两个企业中至少有一个不知道市场需求,那么这样的博弈情形就是我们前面所提到的不完全信息假设。此外,还有完美信息假设、完全但不完美信息假设等。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,共同知识,共同知识(common knowledge),是关于参与人对某种知识(如参与人的理性、参与人的支付等)了解程度的一种描述,如果某种知识成为共同知识就意味着:每个参与人都知道它,并且每个参与人都知道每个参与人都知道它,每个参与人都知道每个参与人都知道每个参与人都知道它,如此等等。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,共同知识,在现有的博弈分析框架下,一般都假设博弈问题的结构(或者对博弈问题的描述)为共同知识。 例如,在“新产品开发博弈”中,投入产出图对两个企业来讲为共同知识。也就是说,企业的行动或战略、支付等为共同知识。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,共同知识,共同知识假设是博弈分析所特有的、很强的重要假设,它比人们所熟悉的“相互知识”假设需要更多的信息,因为“相互知识”只需每个人都知道这一事件,而共同知识是无穷尽的“相互知识”。完全理性的参与人同时在一起(即参与人面对面)知道(如看到、听到)的信息,可以当作共同知识来处理。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,共同知识,例如,在“新产品开发博弈”中,“投入产出图”对两个企业来讲为共同知识,不仅意味着两个企业都看到了“投入产出图”,而且两个企业同时在一起看到了“投入产出图”。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,帽子颜色之谜(the puzzle of the hats color),个“完全理性”的人围绕一张桌子而坐,他们每人戴一顶颜色或白或黑的帽子。每个人能够看到其他个人的帽子,但看不到自己的帽子。一个旁观者当着所有参与人的面宣布:“你们中每位都戴着顶颜色或白或黑的帽子,这些帽子中至少有一顶是白的,我将开始慢慢数数。每次数数后你们都有机会举一次手。不过你只能在你知道你帽子颜色的情况下才能这样做。”试问:第一次在什么时候有人会举手?,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,帽子颜色之谜(the puzzle of the hats color),显然,旁观者的陈述传递了这样的信息:每个参与人都知道“至少有一顶是白的”,不仅如此,由于所有的参与人是在一起同时听到“至少有一顶是白的”,因此,每个参与人都知道每个参与人都知道“至少有一顶是白的”,每个参与人都知道每个参与人都知道每个参与人都知道“至少有一顶是白的”,等等。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,帽子颜色之谜(the puzzle of the hats color),也就是说,“至少有一顶是白的”在所有的参与人中成为共同知识。因此,在“帽子颜色之谜”问题中,“至少有一顶是白的”为共同知识。这是参与人分析推断自己帽子颜色的基础。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,帽子颜色之谜(the puzzle of the hats color),为了避免所讨论的问题过于复杂,不妨假设 n3。根据帽子颜色可能的分布,分以下三种情况讨论:3个人中有一个人戴白色帽子;3个人中有两个人戴白色帽子 ;3个人都戴白色帽子 。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,1) 3个人中有一个人戴白色帽子,由于戴白色帽子的参与人知道“至少有一顶是白的”,并且他也没看到其他人戴白色的帽子,因此,当旁观者数“1”时,他就会知道自己帽子的颜色为白色,于是他会举手。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,2) 3个人中有两个人戴白色帽子,虽然所有的参与人都知道“至少有一顶是白的”,但由于每个参与人都至少看到了一顶白色帽子,因此,当旁观者数“1”时,没有人能够判断出自己帽子的颜色,也意味着没有人会举手。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,2) 3个人中有两个人戴白色帽子,对每个参与人而言,他知道其他参与人知道“至少有一顶是白的”,如果有其他的某个参与人没有看到白色的帽子,那么他应该在旁观者数“1”时,判断出自己帽子的颜色为白色,所以,“当旁观者数1时,没有人能够判断出自己帽子的颜色”就意味着:每个参与人都至少看到了一顶白色的帽子。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,2) 3个人中有两个人戴白色帽子,由于所有的参与人同时一起看到:“当旁观者数1时,没有人能够判断出自己帽子的颜色”这一事件,因此,所有的参与人同时一起知道:每个参与人都至少看到了一顶白色的帽子。这就意味着:“每个参与人都至少看到了一顶白色的帽子”成为共同知识。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,2) 3个人中有两个人戴白色帽子,“每个参与人都至少看到了一顶白色的帽子”,同时,戴白色帽子的参与人又都只看到了一顶白色的帽子,因此,当旁观者数“2”时,戴白色帽子的参与人就会推断出自己帽子的颜色为白色,于是两个戴白色帽子的参与人就会举手。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,3) 3个人都戴白色帽子,从前面的分析可知:当旁观者数“1”时,没有人能够判断出自己帽子的颜色。同时,“每个参与人都至少看到了一顶白色的帽子”成为共同知识。但由于每个参与人都看到了两顶白色帽子,因此,当旁观者数“2”时,也没有人能够判断出自己帽子的颜色。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,3) 3个人都戴白色帽子,从“当旁观者数2时,也没有人能够判断出自己帽子的颜色”为共同知识,我们又可以推断出:“每个参与人都至少看到了两顶白色的帽子”为共同知识。因此,当旁观者数“3”时,所有的参与人(都戴白色帽子)就会推断出自己帽子的颜色为白色,于是所有的参与人都会举手。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,主要内容:一、基本概念;二、战略式博弈。,第一章 战略式博弈,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,二、战略式博弈,战略式博弈(strategic form game)是博弈问题的一种规范性描述,有时亦称标准式博弈。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,战略式博弈,战略式博弈是一种相互作用的决策模型,这种模型假设每个参与人仅选择一次行动或行动计划(战略),并且这些选择是同时进行的。因此,对于那些不需要考虑博弈进程的完全信息博弈问题,如完全信息静态博弈最适于用战略式博弈来描述。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,定义1:战略式博弈,战略式博弈包含以下三个要素:1 参与人集合 ;2 每位参与人非空的战略集 ,即 3 每位参与人定义在所有战略组合 上的偏好关系 。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,战略式博弈,如果我们要用战略式博弈对一个博弈问题进行建模(或者描述),那么我们只需要说清楚博弈问题的三个构成要素即可,即博弈问题所涉及到的参与人、每位参与人有哪些战略可供选择使用以及每位参与人对战略组合的偏好。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,定义2:战略式博弈,战略式博弈包含以下三个要素:1 参与人集合 ;2 每位参与人非空的战略集 ,即;3 每位参与人定义在战略组合 上的效用函数 。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,战略式博弈的标记,如果 且 ,也就是,如果博弈中参与人的人数以及每个参与人的战略数有限,则称这个博弈问题为有限博弈(finite game)。对于有限博弈,我们一般用三元组 来表示战略式博弈。,或,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例1 完全信息静态博弈的战略式描述,考察“新产品开发博弈”。试用战略式博弈对两个企业都知道市场需求,且企业同时决策的博弈情形即完全信息静态的“新产品开发博弈”进行建模。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,“新产品开发博弈”的战略式博弈(需求大时),Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,“新产品开发博弈”的战略式博弈(需求小时),Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例2 完全信息动态博弈的战略式描述,考察“新产品开发博弈”。试用战略式博弈对两个企业都知道市场需求,且企业1先决策,企业2观测到企业1的选择后再进行选择的博弈情形即完全信息动态的“新产品开发博弈”进行建模。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,“新产品开发博弈”的战略式博弈(需求大时),Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,“新产品开发博弈”的战略式博弈(需求小时),Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,需要指出的是,由于战略式博弈是一种假设每个参与人仅选择一次行动或行动计划(战略),并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。对于完全信息动态博弈问题,虽然可以给出博弈问题的战略式描述,但无法看到原问题所具有的动态特性 。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,课间休息,本章结束,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,