第三章不完全信息静态博弈ppt课件.ppt
第三章 不完全信息静态博弈,不完全信息博弈和贝叶斯纳什均衡 贝叶斯均衡的应用 贝叶斯均衡与混合战略均衡 *机制设计问题和显示原理,第三章 不完全信息静态博弈,3.1不完全信息博弈和贝叶斯纳什均衡,一、不完全信息博弈1、定义不满足完全信息假设的博弈称为不完全信息博弈。完全信息假设:支付函数是共同知识。即是说,在不完全信息博弈中,至少有一个参与人不知道其他参与人的支付函数。,假定在位者有两种可能的成本函数:高成本或低成本;进入者有关在位者的成本信息是不完全的。当信息完全时,若在位者是高成本,进入者的最优选择是进入;若在位者是低成本,进入者的最优选择是不进入。,由于进入者不知道在位者是高成本还是低成本,其最优选择依赖于它在多大程度上认为在位者是高成本或低成本。,支付矩阵,2、市场进入博弈的例子,假定进入者认为在位者是高成本的概率是p,低成本的概率是1-p。那么,进入者选择进入的期望利润是p (40)+(1-p) (-10),选择不进入的期望利润是0。进入者的最优选择:当p (40)+(1-p)(-10)0,即当p 0.2时,进入者选择进入;当p 0.2时,进入者选择不进入。,引入虚拟参与人“自然”; 自然首先行动决定参与人的特征,参与人知道自己的特征,其他参与人不知道; 特征的分布函数是共同知识; “不完全信息”转换为“完全但不完美信息”,可使用标准的分析技术来分析。,二、海萨尼(Harsanyi)转换,1、例子:市场进入博弈,注意:一般地,自然在博弈的开始选择包括参与人的战略空间、信息集、支付函数等;一个参与人所拥有的所有个人信息(即所有不是共同知识的信息)称为他的类型;参与人的类型是其个人特征的一个完备描述;一般地,将参与人的支付函数等同于他的类型。不完全信息意味着,至少有一个参与人有多个类型。,2、完整描述,根据海萨尼公理,假定分布函数P(1,n)是所有参与人的共同知识,用-i =(1, i-1 ,i+1,n)表示除i之外的所有参与人的类型组合。这样, =(1, n)= (i,- i)。称pi(-i | i)为参与人i的条件概率,即给定参与人i属于类型i的条件下,他有关其他参与人属于- i的概率。根据条件概率规则,,这里, p (i)是边缘概率。如果类型的分布是独立的,pi(-i | i) p (-i)。,三、不完全信息静态博弈的战略式表述和贝叶斯纳什均衡,贝叶斯纳什均衡是完全信息静态博弈纳什均衡概念在不完全信息静态博弈上的扩展。不完全信息静态博弈又称为静态贝叶斯博弈。,1、贝叶斯博弈的战略式表述n人静态贝叶斯博弈的战略式表述包括:参与人的类型空间 ;条件概率 ;类型依存战略空间 ;类型依存支付函数 。,参与人i知道自己的类型 ,条件概率 pi(-i | i)描述给定自己属于i的情况下,参与人i有关其他人类型 的不确定性。我们 用代表该博弈。,2、静态贝叶斯博弈的时间顺序(1)自然选择类型向量=(1, n),参与人i观测到i,但其他参与人j只知道pj (-j | j),观测不到i;(2)n个参与人同时选择行动a=(a1, an),其中 ;(3)参与人i得到 。,讨论:1)若所有参与人的类型空间只包含一个元素,不完全信息静态博弈就退化为完全信息静态博弈;2)若参与人的类型是完全相关的,当参与人i观测到自己的类型时也就知道了其他参与人的类型,博弈是完全信息的。,3、贝叶斯纳什均衡,n人不完全信息静态博弈的纯战略贝叶斯纳什均衡是一个类型依存战略组合 ,其中每个参与人i在给定自己的类型i和其他参与人类型依存战略 的情况下最大化自己的期望效用函数vi。换言之,战略组合 是一个贝叶斯纳什均衡,如果对于所有的i, ,,注意:与纯战略纳什均衡不同的是,在贝叶斯均衡中,参与人i只知道具有类型j参与人j将选择aj (j)但并不知道j,因此,即使纯战略选择也必须取支付函数的期望值。贝叶斯均衡在本质上也是一个一致性预测,即每个参与人i都能正确预测到具有类型j的参与人j将选择aj *(j)。,3.2贝叶斯均衡的应用举例,一、不完全信息的古诺模型:假定参与人的类型是成本函数,逆需求函数是P=a-q1-q2。令ci是企业i的单位成本,企业i的利润函数为:,假定企业1的单位成本c1是共同知识,企业2的单位成本可能是c2L也可能是c2H, c2L c2H;企业2知道自己的成本是c2H还是c2L,但企业1只知道c2 c2L的可能性为, c2 c2H的可能性为1- ; 为共同知识。,进一步假定:a2, c11, c2L0.75,c2H1.25 0.5。给定企业2知道企业1的成本,企业2将选择q2最大化利润函数: , ta-c2,依赖于企业2的实际成本。,根据最优化的一阶条件得到企业2的反应函数:,企业2的最优产量不仅依赖于企业1的产量,而且依赖于自己的成本。,令q2L为t= 1.25时企业2的最优产量, q2H 为t0.75时企业2的最优产量。有:,企业1不知道企业2的真实成本,从而不知道企业2的最优反应是q2L 还是q2H,因此企业1将选择q1最大化其期望利润函数:,解最优化的一阶条件得企业1的反应函数为:,均衡意味着两个反应函数同时成立。解两个反应函数得贝叶斯均衡为:,比较不完全信息下的贝叶斯均衡与完全信息下的纳什均衡:如果企业2的成本是 c2L0.75,企业1知道企业2的成本,那么,反应函数为:,纳什均衡产量为q1* =0.25, q2* =0.5。同样地,若企业2的成本是c2H1.25,企业1知道企业2的成本,纳什均衡产量为 。,即:,就是说,与完全信息情况相比,在不完全信息情况下,低成本企业的产量相对较低,高成本企业的产量相对较高。,二、不完全信息情况下公共产品的提供三、一级密封价格拍卖四、双方叫价拍卖,3.3贝叶斯均衡与混合战略均衡,完全信息情况下的混合战略均衡可以解释为不完全信息情况下纯战略均衡的极限。-海萨尼,3.3贝叶斯均衡与混合战略均衡,一、混合战略纳什均衡的本质特征不在于参与人j随机地选择行动,而在于参与人i不能确定参与人j将选择什么纯战略,这种不确定性可能来自参与人i不知道参与人j的类型。贝叶斯博弈中,因为参与人的战略是类型依存的,每个参与人在选择自己的行动时他面对的似乎是选择混合战略的对手。自然便是通过选择参与人的类型制造了不确定性。,二、例子,1、抓钱博弈,这个博弈有两个非对称纯战略均衡:一个参与人抓,另一个参与人不抓;一个对称混合战略均衡:每个参与人以0.5的概率选择抓。,(1)完全信息,(2)不完全信息,每个参与人有相同的支付结构,但若他赢了,其利润是(1+i)。 i是参与人的类型,参与人i自己知道i,但另一参与人不知道。,假定i在-,+区间上均匀分布。,考虑下列纯战略:1)参与人1:如果1 1*,抓;如果1 1*,不抓;2)参与人2:如果2 2*,抓;如果2 2*,不抓。所以,给定参与人j的战略,参与人i选择抓的期望利润为:,即,因为j在-,+区间上均匀分布,有 在0,1上均匀分布。所以,上式整理得:,参与人i不抓的利润是ui(0)=0。给定j的战略,i在抓与不抓之间无差异,所以, i*满足下列条件:,整理为:,因为博弈是对称的,在均衡情况下, i*= j*,上述条件意味着i*= j*0。即是说,每一个参与人,在均衡情况下的最优选择是:如果i0,选择抓;如果i0,选择不抓。,因为i0和i0的概率各为0.5,每一个参与人在选择自己的行动时都认为对方选择抓和不抓的概率各为0.5,似乎他面对的是一个选择混合战略的对手,尽管每个参与人实际上选择的是纯战略。当趋于0时,上述纯战略贝叶斯均衡就收敛为一个完全信息博弈的混合战略纳什均衡。所以,海萨尼认为:完全信息博弈的混合战略均衡是不完全信息博弈贝叶斯均衡的极限。,2、性别战,假定: m只有男的知道, f只有女的知道,二者都是在0,x上均匀分布,分布函数是共同知识。构造一个贝叶斯均衡:存在一个m*0,x和一个f*0,x,如果m m*,男的将选择足球赛;如果f f*,女的将选择芭蕾。,所以,男的选择足球的概率是 ,女的选择芭蕾的概率是 。,求解过程:给定男的战略,女的选择足球和芭蕾的期望效用分别为:,所以, f*满足的条件为:,即,因为博弈是对称的,在均衡情况下, i*= j*,解上述条件得:,因此,贝叶斯均衡是:1)男参与人:如果m *,选择足球,否则,选择芭蕾;2)女参与人:如果f *,选择芭蕾,否则,选择足球。给定不完全信息,男的认为女的选择芭蕾,女的认为男的选择足球的概率都为:,当x趋于0时,上述概率收敛于 ,即完全信息下混合战略的概率。,三、混合战略均衡的纯化定理,给定战略式表述博弈 ,对于所有定义在-1,1上的独立的二阶可微分布函数Pi(.),以ui为支付函数的博弈的任何均衡都是当趋于0时以ui为不确定化支付函数的博弈的纯战略均衡序列的一个极限。更为准确地说,不确定化博弈纯战略均衡的均衡战略的概率分布收敛于确定性博弈均衡战略的概率分布。,3.4机制设计理论与显示原理,一、贝叶斯博弈和机制设计二、拍卖机制设计三、机制设计和显示原理四、不完全信息与资源配置效率,