不完全信息博弈专题教学讲座PPT.ppt
《不完全信息博弈专题教学讲座PPT.ppt》由会员分享,可在线阅读,更多相关《不完全信息博弈专题教学讲座PPT.ppt(89页珍藏版)》请在三一办公上搜索。
1、不完全信息静态博弈不完全信息动态博弈拍卖问题,不完全信息博弈,一、不完全信息博弈,(一)不完全信息的含义完全信息意味着参与人的纯策略空间和支付函数是所有参与人的共同知识。不完全信息指一种博弈局势中,局中人对其他局中人(或他自己)与该种博弈有关的事前信息(如局中人所处的地位或状态等信息,它们会影响博弈局势)了解不充分。从技术上看,博弈的不完全信息表现为对博弈的基本数学结构了解不充分。在策略型博弈中,则表现为对博弈的三种组成部分,即局中人、策略和支付有着不完全的了解。在理论上,各类不完全信息情形都可归结为对支付函数的不完全信息。,不完全信息博弈情形,由于不完全信息情形可归结为对支付函数的不完全信息
2、:(1)参与人的支付函数依赖于自然的选择 在房地产商开发博弈中,自然确定的市场需求是不确定的:高需求还是低需求(2)某一参与人的支付函数是其他参与人私人信息(类型)的函数市场进入博弈模型:在位者是高成本还是低成本,(1)房地产开发不完全信息静态博弈模型,不完全信息静态博弈需求不确定,(2)市场进入的不完全信息博弈模型,垄断者(在位者)和潜在进入者:在位者决定是否建立一个新厂,同时潜在进入者决定是否进入该行业。在位者有两种可能的建厂成本函数:高成本和低成本,潜在进入者不知道在位者的成本函数。假定对应的支付矩阵如下:,在完全信息条件下,在位者知道进入者的成本函数。若在位者是高成本,惟一的纯策略纳什
3、均衡是(进入,不建厂);若在位者是低成本,有两个纯策略纳什均衡。如果低成本在位者主动选择建厂,潜在进入者将不进入。,完全信息静态下市场进入的博弈树,不完全信息静态下市场进入的博弈树,不完全信息动态下市场进入的博弈树,不完全信息情形的处理,在不完全信息静态博弈中,潜在进入者将根据在位者成本类型的概率分布计算进入的期望收益(海萨尼转换),以此决定是否进入。在不完全信息动态博弈中,在位者将根据自己的成本类型,首先选择是否建设新厂;潜在进入者在看到在位者的选择后,对其成本类型做出推断(贝叶斯推断)得到修正后的后验概率,再根据期望收入决定是否进入。,不完全信息博弈的例子,在讨价还价中,通常买主并不知道卖
4、主的最低要价(底价),卖主也不知道买主的最高出价(限价)静态博弈:招标投标动态博弈:讨价还价在信贷市场中,银行未必掌握企业的真实情况;在证券市场中,投资者未必清楚上市公司的真实质量;在保险市场中,保险公司未必清楚投保人的真实信息;在市场进入模型中,想进入市场的企业未必知道现有企业的真实成本。在2008年的全球金融危机中,各类市场参与者未必知道市场的真实情况。,(二)海萨尼转换,房地产开发博弈:开发商面临市场两种需求状态,高需求和低需求,通过自然决定(以概率表示)市场进入博弈模型的换位思考:进入者与两个不同成本的在位者博弈:高成本和低成本类型一般地,若在位者有N种可能的成本函数,则进入者似乎是在
5、与N个不同的在位者博弈海萨尼引入了虚拟参与人自然,自然首先行动,以此将不完全信息博弈转化为完全但不完美信息博弈。参与人类型的不确定:自然决定参与人的特征(类型),参与人知道自己的特征,其他参与人不知道,一般地,将一个参与人所拥有的所有私人信息(private information)称为他的类型。由于大多数博弈中,参与人的特征由支付函数完全确定,因而一般将参与人的支付函数等同于他的类型。将参与人i的一个特定类型记为i(它反应了参与人i的某种特定私人信息),将参与人i的所有类型的集合记为i。通常假定,参与人i只知道自己的类型,并且知道其他局中人的类型分别为若干种可能类型中的一种,但不知道具体是哪
6、一种,但他知道其他参与人类型的概率分布。,1、类型,假定P(1,n)为所有参与人类型集=12n上的联合概率分布函数,它是所有参与人的共同知识。记-i(1,i-1,i+1,n)表示除参与人i之外所有参与人的类型组合,记pi(-i|i)表示参与人i的类型为 i时参与人i关于其他参与人类型-i的条件概率,它满足:,2、概率模型,例:联合概率分布,两企业在产品市场上的竞争模型:双方均有两种类型,即强类型和弱类型,其联合概率分布如下表:,联合概率分布的条件概率推断,3、海萨尼转换,通过引入“自然”这一虚拟局中人,将不完全信息博弈转换为不完美信息博弈。所有局中人的实际类型均来自于由“自然”根据类型上的联合
7、概率分布进行的一种初始抽彩,局中人根据这种抽彩决定自己对其他局中人类型的主观判断,由此进行实际博弈。例如:在市场进入博弈中,自然决定在位者建厂成本类型,不完全信息静态的市场进入模型,垄断者(在位者):决定是否建立一个新厂有两种建厂成本类型:高成本(概率0.4)和低成本潜在进入者:决定是否进入该行业只有一种成本:高成本对应的支付矩阵如下:,不完全信息静态下市场进入的博弈树,不完全信息静态市场进入模型求解思路,在位者有两种成本类型,对应两个信息集:高成本、低成本,相应地有四个纯策略:(建,建)、(建,不建)、(不建,建)和(不建,不建),在每一种纯策略中,前后两种行动分别表示在位者为高成本和低成本
8、下的相应的策略选择结果。潜在进入者只有一个信息集,有两个纯策略:进入、不进入,由于其不清楚在位者的成本类型,因而是以期望收益作为决策依据,使其期望收益最大化。,不完全信息静态市场进入模型海萨尼转换,海萨尼转换在位者策略为(建,建),潜在进入者进入时:在位者的得益为:0.4*0+0.6*1=0.6潜在进入者的得益为:0.4*(-1)+0.6*(-1)=-1,不完全信息静态市场进入模型 期望收益,在位者有两个信息集:高成本类型和低成本类型,因而有4种纯策略;潜在进入者只有进入不进入两种纯策略。海萨尼转换后,支付矩阵变为:,不完全信息静态市场进入模型 贝叶斯均衡求解,该博弈的纯策略贝叶斯均衡有两个:
9、(不建,建),不进入)和(不建,不建),进入)贝叶斯均衡是类型依存的策略组合(最大化期望收益函数)。,4、不完全信息古诺模型,Cournot模型:在不完全信息古诺模型中,参与人的类型是成本函数。设每一企业i分别有不变的单位成本ci。为简单起见,不妨假设:企业1的单位成本c1是共同信息,企业2的单位成本c2是其私人信息,它有高成本c2H和低成本c2L两种情形,设低成本的概率为p,它是双方的共同知识。,给定企业2知道企业1的成本时,企业2将最大化其利润函数:2=q2(a-c2-q1-q2),其中c2=c2H或c2L依赖于企业2的实际成本。由此可得企业2的反应函数为:q2*(q1,c2)=(a-c2
10、-q1)/2它不但依赖于企业1的产量q1,而且依赖于自己的成本c2。分别记q2L、q2H为企业2在低成本和高成本下的最优反应产量,分别为:q2*(q1,c2L)=(a-c2L-q1)/2 q2*(q1,c2H)=(a-c2H-q1)/2,企业1将最大化自己的期望利润函数:E1=q1(a-c1-q1-q2L)p+q1(a-c1-q1-q2H)(1-p)由此可求得企业1的最优反应函数为:q1*=a-c1-pq2L-(1-p)q2H/2=(a-c1-Eq2)/2均衡意味着两个反应函数同时成立,由此得贝叶斯均衡为:q1*=a-2c1+pc2L+(1-p)c2H/3q2L*=(a+c1-2c2L)/3-
11、(1-p)(c2H-c2L)/6q2H*=(a+c1-2c2H)/3+p(c2H-c2L)/6特别地,当a=2,c1=1,c2L=3/4,c2H=5/4,p=1/2时,有q1*=1/3,q2L*=11/24,q2H*=5/24。,图示完全信息情形,在完全信息情形下,满足以上条件时,若企业2为低成本时,纳什均衡产量为q1*=1/4,q2L*=1/2。若企业2为高成本时,则企业1和2的纳什均衡产量分别为5/12和1/6。,不完全信息时的期望反应,企业1对企业2的期望产出做出反应,以最大化自己的期望效用,图示不完全信息情形,思考:在不完全信息情形下,两企业的产量有何变化?,与完全信息情形相比,在不完
12、全信息下,低成本企业的产量相对较低,高成本企业的产量相对较高,这是由于企业1对期望利润做出反应的结果。,q1*=1/3,q2L*=11/24,q2H*=5/24,二、不完全信息动态博弈,1、诸葛亮与司马懿斗智诸葛亮与司马懿决战,司马懿总是避而不出。于是诸葛亮派使者用妇女衣服去羞辱司马懿。司马懿虽心中大怒却仍佯笑询问诸葛亮寝食及事之烦简若何,得知诸葛亮夙兴夜寐、事必躬亲而食之甚少后,对诸将曰:“孔明食少事烦,其能久乎?”诸葛亮知悉使者回复后,叹曰:“彼深知我也!”,不完全信息动态博弈的信息揭示,在诸葛亮与司马懿斗智博弈中,反映了不完全信息动态博弈的信息揭示原理:局中人通过观测对方的行动获取新的信
13、息,从而得到更准确的判断。从博弈来讲:每个局中人拥有其他局中人类型的先验判断(事前概率);通过观察其他局中人的行动后,不断修正其先验概率得到后验概率(贝叶斯法则)。,2、蜈蚣博弈,使用逆向归纳法,参与人1在第一阶段将选择D。每个参与人在其每个决策结上都选择D是唯一的子博弈精炼纳什均衡。显然,基于个人理性的结果远非集体最优。该博弈揭示了逆向归纳法与子博弈完美均衡的不足。然而,通过引入不完全信息,便可改变博弈结局。该博弈中,参与人2每一阶段选择总是偏好于行动L。,偏好合作的蜈蚣博弈,现在假设参与人2有另外一种类型(不同的收益函数),在其策略选择中,每一阶段总是偏好于博弈继续进行下去的R行动。使用逆
14、向归纳法,参与人1在每一个决策结上将选择行动U,参与人2其每个决策结上都选择行动R,上述合作策略是唯一的子博弈精炼纳什均衡。在该博弈中,基于个人理性的结果是集体最优的。,不完全信息蜈蚣博弈,局中人2有两种类型:注重短期利益型和注重合作型。即使在1-p很小的情况下,局中人1将选择U,而对短视型的局中人2在博弈早期也有动机选择R。,声誉模型,在该例中,即使注重短期利益类型的参与者(理性的)也有动机假冒为注重合作类型的参与者,从而获得长期利益最大化,这就是声誉模型。声誉:指重复博弈的局中人可能会尝试建立特定博弈模式的声誉。在上例中,短期利益型局中人2在早期会选择R以表明自己是合作类型的局中人,以博取
15、长期利益的最大化。,不完全信息蜈蚣博弈声誉,即使在1-p很小的情况下,局中人1将选择U,而对短视型的局中人2在博弈早期也有动机选择R,以博取长期利益的最大化。,子博弈完美均衡和贝叶斯均衡,在完全信息动态博弈中,后行动者在观察到先行动者的行动后再选择自己的策略以最大化其期望收益,先行动者在预测到这一反应过程后将首先选择最大化其期望收益的行动,子博弈精炼均衡要求在每一个子博弈上给出纳什均衡,即不但要求在均衡路径上是最优的,而且要求在非均衡路径上是最优的。在不完全信息静态博弈中,自然确定参与人的类型(私人信息),各参与人再选择类型依存的行动来最大化其期望收益,静态贝叶斯均衡是一个类型依存的策略组合。
16、,不完全信息动态博弈中的推断,在不完全信息动态博弈中,由于局中人i的行动选择Ai是类型依存的,因而其行动选择会揭示出与其类型有关的私人信息i,其他局中人j可以利用前面博弈进行的结果来修正其关于该局中人i类型的信念P(i),从而更好地把握博弈局势。当然,局中人i也可能策略性地选择行动,从而误导局中人j的推断(声誉模型)。,3、完美贝叶斯均衡的思路,将每个信息集开始的博弈的剩余部分称为后续博弈。由于后续博弈之前的行动历史使得局中人可以修正自己对其他局中人类型分布的先验信念,所以在进行后续博弈时,局中人是根据修正后的后验信念(依贝叶斯法则修正)进行策略选择的。完美(精炼)贝叶斯均衡要求在所有的后续博
17、弈上也达到贝叶斯均衡。,贝叶斯法则,参与人i:属于类型k,选择行动ah。贝叶斯法则:观察到参与人i选择行动ah后,则i属于类型k的后验概率为:,一个贝叶斯法则的经典例子,将所有人分为好人(GP)和坏人(BP),所有事分为好事(GT)和坏事(BT)。社会准则认为,好人更愿意做好事、坏人更愿意做坏事。设好人做好事的概率为P(GT|GB),坏人做好事的概率为P(GT|BP)。人们对一个人是好人还是坏人具有一个事先评价,不妨设其为好人的先验概率为PGP,通过观察这个人做的事是好事还是坏事,人们将修正事先信念,获得这个人是好人还是坏人的事后评价(后验概率)。若观察到某人做了好事后,对其是好人的后验概率将
18、增加;若观察到某人做了坏事,对其是好人的后验概率将减少。,贝叶斯推断,这是因为:,4、信号传递博弈及其应用举例,信号发送者具有私人信息(类型,由自然确定),先验概率分布p()是公共信息。信号发送者在观察到其类型后,在行动集合A1上选择行动a1(发送信号,即信号发送者选择类型依存的行动。信号接收者在观察到参与人1发出的信号a1后,使用贝叶斯法则修正对参与人1类型的判断,得到后验概率,然后选择行动,最大化其期望支付。,期望效用函数,局中人1选择类型依存的策略,记每种类型对应行动a1上的概率分布为,局中人2为对每种a1对应行动a2 上的概率分布为。则当局中人2使用时局中人1采用策略获得的支付为当局中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 不完全 信息 博弈 专题 教学 讲座 PPT

链接地址:https://www.31ppt.com/p-2933193.html