信号博弈及其应.ppt
《信号博弈及其应.ppt》由会员分享,可在线阅读,更多相关《信号博弈及其应.ppt(167页珍藏版)》请在三一办公上搜索。
1、第四部分:不完全信息动态博弈,第十三章 信号博弈及其应用,主要内容:一、信号博弈二、信号博弈的精炼贝叶斯Nash均衡三、信号博弈的应用四、空谈博弈,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,主要内容:一、信号博弈二、信号博弈的精炼贝叶斯Nash均衡三、信号博弈的应用四、空谈博弈,第十三章 信号博弈及其应用,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,信号博弈(signaling game
2、s)是一类比较简单而应用相当广泛的不完全信息动态博弈,其基本特征是博弈参与人分为信号发送者(Sender,用S表示)和信号接收者(Receiver,用R表示)两类,信号发送者先行动,发送一个关于自己类型的信号,信号接收者根据所接收到的信号选择自己的行动。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,其具体博弈时序如下:,自然根据特定的概率分布p(ti),从可行的类型集T=t1,t2,tn中选择发送者类型ti,这里,对,p(ti)0且p(t1)+p(tn)=1;发送者观测到ti,然后从可行的信
3、号集M=m1,m2,mJ中选择一个发送信号mj;接收者不能观测到ti,但能观测到mj,他从可行的行动集A=a1,a2,aK中选择一个行动ak;双方分别得到收益uS(ti,mj,ak)和uR(ti,mj,ak)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在信号博弈中,发送者发出的信号依赖于自然赋予的类型,因此,先行动的信号发送者的行动,对后行动的信号接收者来说,具有传递信息的作用。同时,这又使得接收者的行动依赖于发送者选择的信号。,Control Science and Engineeri
4、ng,HUST All Rights Reserved,2007,Luo Yunfeng,考察信号博弈的一种简单情况的扩展式描述(不考虑支付),Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,发送者的信息集为Is(x1)和Is(x2),分别对应于观测到自然的选择为t1和t2,行动为m1和m2,因此,发送者的战略s为:其中,HS为发送者的信息集集合,即,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng
5、,发送者有以下4种纯战略:,战略(m1,m1)如果自然赋予t1,则发送者选择m1,即s(t1)=m1;如果自然赋予t2,则发送者选择m1,即s(t2)=m1;战略(m1,m2)如果自然赋予t1,则发送者选择m1,即s(t1)=m1;如果自然赋予t2,则发送者选择m2,即s(t2)=m2;,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,战略(m2,m1)如果自然赋予t1,则发送者选择m2,即s(t1)=m2;如果自然赋予t2,则发送者选择m1,即s(t2)=m1;战略(m2,m2)如果自然赋予t
6、1,则发送者选择m2,即s(t1)=m2;如果自然赋予t2,则发送者选择m2,即s(t2)=m2。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,对于接收者,其信息集为IR(x3,x4)和IR(x5,x6),分别对应于观测到信号m1和m2,行动为a1和a2,因此,接收者的战略s为:其中,HR为接收者的信息集集合,即HR=IR(x3,x4),IR(x5,x6)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Y
7、unfeng,接收者有以下4种纯战略:,战略(a1,a1)如果发送者选择m1,则接收者选择a1,即s(m1)=a1;如果发送者选择m2,则接收者选择a1,即s(m2)=a1;战略(a1,a2)如果发送者选择m1,则接收者选择a1,即s(m1)=a1;如果发送者选择m2,则接收者选择a2,即s(m2)=a2;,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,接收者有以下4种纯战略:,战略(a2,a1)如果发送者选择m1,则接收者选择a2,即s(m1)=a2;如果发送者选择m2,则接收者选择a1,即
8、s(m2)=a1;战略(a2,a2)如果发送者选择m1,则接收者选择a2,即s(m1)=a2;如果发送者选择m2,则接收者选择a2,即s(m2)=a2;,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在发送者的4个战略中,根据发送者的类型与发送信号间的相互关系,可将发送者的战略分为两类混同战略和分离战略。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,1)对于第1和第4个战略,由于在不同类型时
9、发送者都发出相同的信号,因此称其为混同(pooling)战略。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在多于两种类型的模型中,还存在部分混同(partially pooling)战略,其中所有属于给定类型集的类型都发送同样的信号,但不同的类型集发送不同的信号。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,2)对于第2和第3个战略,由于在不同类型时发送者发出不同的信号,因此称其为分离(
10、separating)战略,分离战略意味着不同类型的发送者发出不同的信号。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,与混同战略相似,在多于两种类型的模型中,还存在准分离(semi-separating)战略,其定义与部分混同战略相同。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在信号博弈中还存在与混合战略相类似的战略,称为杂合战略(hybrid strategy)。,Control
11、Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,主要内容:一、信号博弈二、信号博弈的精炼贝叶斯Nash均衡三、信号博弈的应用四、空谈博弈,第十三章 信号博弈及其应用,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,为了求解信号博弈的精炼贝叶斯Nash均衡,需将精炼贝叶斯Nash均衡定义中的条件(1)(4)分别施加到信号博弈之上。,Control Science and Engineering,HUST All R
12、ights Reserved,2007,Luo Yunfeng,1)由于发送者知道自己的类型,其选择发生于单决策结信息集,因此,精炼贝叶斯Nash均衡定义中的条件(1)在应用于发送者时就无需附加任何条件;,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,相反,接收者在不知道发送者类型的条件下观测到发送者的信号,并选择行动,也就是说接收者的选择处于一个非单决策结的信息集上,因此,需将精炼贝叶斯Nash均衡定义中的条件(1)应用于接收者的信息集。,Control Science and Engine
13、ering,HUST All Rights Reserved,2007,Luo Yunfeng,当精炼贝叶斯Nash均衡定义中的条件(1)应用于信号博弈接收者的信息集时,可得信号条件(1)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,信号条件(1),在观测到M中的任何信号mj之后,接收者必须对哪些类型可能会发送mj,持有一个推断。这一推断用概率分布 表示,其中对,且,Control Science and Engineering,HUST All Rights Reserved,2007,
14、Luo Yunfeng,2)给定发送者的信号和接收者的推断,精炼贝叶斯Nash均衡定义中的条件(2)要求接收者选择最优行动,因此,需将精炼贝叶斯Nash均衡定义中的条件(2)施加于接收者的行动。此时,可得到信号条件(2R)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,信号条件(2R):,对M中的每一mj,并在给定对 的推断的条件下,接收者的行动 必须使接收者的期望效用最大化,即,Control Science and Engineering,HUST All Rights Reserved
15、,2007,Luo Yunfeng,精炼贝叶斯Nash均衡定义中的条件(2)同样需施加于发送者的选择,但由于发送者的选择发生于单决策结信息集上,发送者拥有完全信息,并且发送者只在博弈的开始时行动,因此,精炼贝叶斯Nash均衡定义中的条件(2)施加于发送者的选择时,必须满足信号条件(2S)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,信号条件(2S):,对T中的每一ti,在给定接收者战略 的条件下,发送者选择的信号 必须使发送者的效用最大化,即,Control Science and Eng
16、ineering,HUST All Rights Reserved,2007,Luo Yunfeng,3)给定发送者的战略,用Tj表示选择发送信号mj的类型ti的集合,即如果Tj不是空集,则对应于信号mj的信息集就处于均衡路径之上;否则,若任何类型都不选择mj,则其对应的信息集处于均衡路径之外。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,对处于均衡路径上的信号,将精炼贝叶斯Nash均衡定义中的条件(3)运用于接收者的推断,可以得到信号条件(3)。,Control Science and E
17、ngineering,HUST All Rights Reserved,2007,Luo Yunfeng,信号条件(3):,对中每一mj,如果在T中存在ti使得 则接收者在对应于mj的信息集中所持有的推断必须决定于贝叶斯法则和发送者的战略:,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,由于对,因此上式可表示为,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,4)对处于均衡路径之外的信号,将精炼
18、贝叶斯Nash均衡定义中的条件(4)运用于接收者的推断,可以得到信号条件(4)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,对M中某一mj,如果在T中不存在ti使得 即,则接收者在对应于mj的信息集中所持有的推断必须决定于贝叶斯法则和可能情况下发送者的均衡战略。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,信号博弈中一个纯战略精炼贝叶斯 Nash均衡是满足信号条件(1)、(2R)、(2S
19、)、(3)及(4)的战略组合 以及推断,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,如果发送者的战略是混同的或分离的,我们就称均衡分别为混同的或分离的精炼贝叶斯Nash均衡。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,例子:,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,在该博弈中,发送
20、者有4个纯战略,因此可能存在的纯战略精炼贝叶斯Nash均衡有:发送者的均衡战略为(L,L);发送者的均衡战略为(R,R);发送者的均衡战略为(L,R);发送者的均衡战略为(R,L)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,下面依次分析以上四种均衡存在的可能性。,假设存在一个混同于行动L的精炼贝叶斯Nash均衡,发送者的战略为(L,L),则接收者对应于L的信息集IR(x1,x3)处于均衡路径之上,于是接收者在这一信息集上的推断p,1-p决定于贝叶斯法则和发送者的战略,即 由于。因此,p=
21、1-p=0.5与先验分布相同。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,给定这样的推断,接收者在观测到信号L之后,根据行动u和d的期望收益,决定自己的选择。接收者选择u的期望收益为:而接收者选择的期望收益为:,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,因此,接收者在观测到信号L之后的最优反应为选择u。此时,类型为t1和t2的发送者分别可得到的收益为1和2。,Control Scien
22、ce and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,为了使两种类型的发送者都愿意选择L,即发送者的最优战略为(L,L),需要确保:如果发送者选择信号R,接收者的反应(选择)给两种类型的发送者所带来的收益,小于它们选择信号L时的收益。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,如果接收者对R的反应为u,则类型为t1的发送者选择R的收益为2,高于自己选择L的收益1。此时,类型为t1的发送者不会选择L;如果接收者对R的反应为d
23、,则通过选择R,类型为t1和t2的发送者的收益将分别为0和1,而他们选择L却可分别获得1和2。此时,类型为t1和t2的发送者都会选择L。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,因此,如果存在一个前面所假设的混同均衡,其中发送者的战略为(L,L),则接收者对R的反应必须为d,于是接收者的战略必须为(u,d)。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,此外,还需要考虑接收者在对应于R
24、的信息集IR(x2,x4)中的推断p,1-p,以及给定这一推断时选择d时是否最优的。在信息集IS(x2,x4)上,接收者选择u的期望收益为:而接收者选择d的期望收益为:,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,由于接收者在信息集IS(x2,x4)上的最优反应为d,因此,所以此时,得到上述博弈的混同精炼贝叶斯Nash均衡为,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,假设存在一个混同于行
25、动R的精炼贝叶斯Nash均衡,发送者的战略为(R,R),则q=0.5。此时,接收者选择行动u和d的期望收益分别为0.5和1,所以接收者对R的最优反应为d。,Control Science and Engineering,HUST All Rights Reserved,2007,Luo Yunfeng,但是,如果类型为t1的发送者选择L,则无论接收者在信息集IR(x1,x3)上的推断如何,接收者对L的最优反应都是u,这意味着类型为t1的发送者只要选择L,就确保可得到收益1,大于选择R的收益0。,Control Science and Engineering,HUST All Rights Re
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信号 博弈 及其
链接地址:https://www.31ppt.com/p-5229522.html