北京大学博弈论课件第3章-完全信息动态博弈.ppt
《北京大学博弈论课件第3章-完全信息动态博弈.ppt》由会员分享,可在线阅读,更多相关《北京大学博弈论课件第3章-完全信息动态博弈.ppt(61页珍藏版)》请在三一办公上搜索。
1、第三章完全信息动态博弈,在完全信息动态博弈中,博弈参与者的行动存在先后顺序。可以用博弈树表示完全信息动态博弈。可以通过逆向归纳法求解完全信息动态博弈的子博弈精炼纳什均衡,剔除不可置信的威胁。,第一节 完全信息动态博弈概述,一、完全信息动态博弈的定义 在完全信息静态博弈中,博弈参与者同时采取行动。但在完全信息动态博弈中,博弈参与者的行动存在先后顺序。从信息角度上,完全信息动态博弈与完全信息静态博弈类似,博弈参与者对博弈结构、博弈顺序、双方收益等信息都具备完全了解。,二、博弈树,在动态博弈中,由于博弈参与者的行动存在先后顺序,因此可以用更形象的方法来表示动态博弈:博弈树(Game Tree)。通过
2、支付矩阵的形式表示的博弈通常被称为策略型或正则型博弈(Normal Form Game)。通过博弈树表示的博弈通常被称为扩展型博弈(Extensive Form Game)。,动态市场争夺战博弈的扩展型表达方式如图所示,“市场争夺战”博弈的扩展型表达形式,1博弈树的构成要素,(1)博弈参与者(2)行动顺序:在动态博弈中,博弈参与者的行动存在先后次序。(3)行动策略空间(Action Set):指博弈参与者可以采取的所有可能策略。(4)信息集(Information Set):指博弈参与者在博弈过程中所知道的信息。(5)支付函数指博弈参与者采用特定策略与所能得到的收益之间的关系。,2博弈树的结构
3、,(1)博弈树的构造方法首先行动的一方位于博弈树的最上端,根据动态博弈过程中各方的行动顺序,博弈数自上至下延展。也有学者习惯自左至右构造博弈树。,横向博弈树,博弈树中包含若干“节点”,节点用小圆圈表示。位于博弈树最上端的节点称为“初始节点”。初始节点用空心小圆圈表示,其他节点均用实心小圆圈表示。在每个节点处均对应某个博弈参与者,将节点对应的博弈参与者标识在节点旁边。例如:在“市场争夺战”博弈中,因为潜在进入者先行动,因此初始节点处对应的博弈参与者为潜在进入者。将潜在进入者标识在博弈树初始节点旁边。当潜在进入者决策之后,轮到在位者进行决策。在位者所在的节点称为“后续节点”。在位者位于两个后续节点
4、上。在位者都有两种策略选择:“斗争”和“默许”。,如果初始节点处的博弈参与者存在 N 种策略,那么就从初始节点处分出 N 条路径。路径用线段表示。在线段旁注明相应的策略。在“市场争夺战”博弈中,首先行动的潜在进入者可以采取两种策略:“不进入”和“进入”。因此,从初始节点处引出两条线段,在两条线段旁分别标识“不进入”和“进入”。当潜在进入者选择结束后,达到在位者的节点。在位者有两个选择:“斗争”和“默许”。因此,从在位者的节点处引出两条线段,在两条线段旁分别标识“斗争”和“默许”。,当博弈不再有后续节点时,需要将博弈的收益标识在博弈树末端。将博弈参与者的收益放在括号里。需要注意的是:各博弈参与者
5、的收益需要按照各参与者行动顺序进行排列。先行动的博弈参与者的收益写在左边,依次类推,从左到右,最后行动的博弈参与者的收益写在最右边。各个博弈参与者的收益之间用逗号分割。,(2)博弈树与博弈顺序博弈树各节点之间存在顺序关系,博弈树由上至下的节点顺序表示各博弈参与者进行决策的顺序。,从博弈树的节点可以引出多条线段,但不能从博弈树多个节点共同到达博弈树下方同一个后续节点。,错误的博弈树构造方法,正确的博弈树构造方法,正确的博弈树构造方法,构造博弈树时只能按照由上至下的路径,而不能存在由下向上的路径,也不能形成循环路径。回溯路径唯一性在求解完全信息动态博弈时非常重要。因为在求解动态博弈均衡时,一个很重
6、要的方法是“逆向归纳法(Backward Induction)”。只有首先确保从博弈树任何最终节点向上回溯时路径唯一,才能确保逆向归纳法的可操作性。,正确的博弈树构造方法,正确的博弈树构造方法,错误的博弈树构造方法,错误的博弈树构造方法,三、信息集与三人罢工博弈,在完全信息动态博弈中,如果将博弈树的多个节点用虚线连接起来,表明这多个节点位于同一个博弈信息集中。也就是说:博弈参与者不知道自己位于同一个信息中的哪个博弈节点上。可以通过“三人罢工博弈”来说明信息集的含义以及信息集在动态博弈中的重要性。,1三人罢工博弈的定义,三人罢工博弈的博弈树,2三人罢工博弈的策略选择与信息,员工 2 只有一个信息
7、集的博弈树,员工 3 不能观察到员工 2 的决策策略,员工 3 不知道员工 1 的决策策略,员工 3 不知道员工 1 和员工 2 的决策策略,三名员工都只有一个信息集的博弈,四、博弈树与静态博弈,博弈树的方法不仅能表示动态博弈,还能表示静态博弈。所谓的“博弈先后顺序”,它主要是一个信息的概念,而不是一个纯时间先后的概念。,用博弈树表示囚徒困境,下面三种博弈表达方式所表达的博弈内涵相同,第二节 完全且完美信息动态博弈概述,在完全且完美信息动态博弈(Dynamic Game with Perfect and Complete Information)中,每个博弈参与者均知道在自己之前进行决策的参与
8、者选择的策略和博弈结构。博弈树中每个节点都独立构成一个信息集,没有虚线连接两个或多个博弈树节点。求解完全且完美信息动态博弈的重要方法之一是:逆向归纳法。可以通过“海盗分宝博弈”这个生动有趣的故事对“逆向归纳法”进行一个直观介绍。,一、海盗分宝博弈,1海盗分宝博弈的规则五个海盗首先进行抽签,确定决策顺序。五个海盗按照决策顺序依次提出对 100 个金币的分配方案。第一个海盗提出一个分配方案,如超过半数的海盗(包括提出分配方案的海盗)同意第一个海盗的分配方案,即大于等于 3 名海盗同意第一个海盗的分配方案时,那么该方案被通过,博弈结束。如果第一个海盗提出的分配方案没有得到超过半数海盗的同意,那么第一
9、个海盗将被扔到海里喂鲨鱼。接下来由第二个海盗提出分配方案,如果超过半数的海盗同意第二个海盗的分配方案时,那么该方案被通过,博弈结束。,如果第二个海盗提出的分配方案没有得到超过半数海盗的同意,那么第二个海盗也将被扔到海里喂鲨鱼。接下来由第三个海盗提出分配方案,如果超过半数的海盗,即大于等于 2 名海盗,同意第三个海盗的分配方案时,那么该方案被通过,博弈结束。如果第三个海盗提出的分配方案没有得到超过半数海盗的同意,那么第三个海盗也将被扔到海里喂鲨鱼。接下来由第四个海盗提出分配方案。如果超过半数的海盗同意第四个海盗的分配方案时,那么该方案被通过,博弈结束。,如果第四个海盗提出的分配方案没有得到超过半
10、数海盗的同意,那么第四个海盗也将被扔到海里喂鲨鱼。这时就只剩下第五个海盗了,第五个海盗将独吞抢劫来的100个金币,博弈结束。在这种分配规则下,第一个海盗将提出怎样的分配方案?第一个海盗提出的分配方案需要满足两个条件。第一,保证超过半数的海盗同意第一个海盗的分配方案。第二:第一个海盗最大化自己能分到的金币。如果直接从第一个海盗的决策策略入手,此问题相对复杂。不妨从第五个海盗入手,然后按照从后向前的顺序依次逆向考察海盗的策略选择。,2求解海盗分宝博弈的均衡,第一个海盗将提出怎样的分配方案?此分配方案在保证能得到超过半数海盗同意的前提下应最大化第一个海盗的利益。,通过逆向归纳法推导出的财宝分配方案,
11、3海盗分宝博弈的均衡,第一个海盗的分配方案可以有两种。分配方案 1:分配给自己 97 个金币,给第二个海盗 0 个金币,给第三个海盗 1 个金币,给第四个海盗 2 个金币,给第五个海盗 0 个金币。分配方案 2:分配给自己 97 个金币,给第二个海盗 0 个金币,给第三个海盗 1 个金币,给第四个海盗 0 个金币,给第五个海盗 2 个金币。如果第一个海盗提出分配方案 1,那么第二个海盗和第五个海盗将反对,而第一个、第三个和第四个海盗将同意,因此第一个海盗的提议将获得通过。如果第一个海盗提出分配方案 2,那么第二个海盗和第四个海盗将反对,而第一个、第三个和第五个海盗将同意,因此第一个海盗的提议将
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 北京大学 博弈论 课件 完全 信息 动态 博弈
链接地址:https://www.31ppt.com/p-3142251.html