《扩展式博弈》PPT课件.ppt
《《扩展式博弈》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《扩展式博弈》PPT课件.ppt(50页珍藏版)》请在三一办公上搜索。
1、第二章 扩展式博弈,本章的主要内容,博弈论的启示实际模型与虚拟模型扩展式博弈:完美信息扩展式博弈:不完美信息策略是什么,第一节 博弈论的启示,博弈论主要在两个方面给我们帮助:1、模型它提供了一个研究复杂社会现象的框架,可将其简化为可供分析的模型2、方法它提供了从这些与人们如何采取行动及人们该如何采取行动相关的模型中,总结命题的方法。,参与人是理性的,存在行为的交互作用。,帮助我们理解人们行为的交互作用,及这种作用对结果的影响。,(1)人们并不总是理性的。(2)人们不总是利己的。也存在理他行为。,(1)有限理性可以被引入博弈模型中。(2)支付函数并不只是以金钱衡量,包含了人们心理的主观因素。,适
2、用范围,主要作用,反对者声音,支持者反驳,博弈论提供了对于人们行为背后逻辑的洞察,还处于发展中。,博弈论的四个问题,第二节 实际模型与虚拟模型,实际模型实际模型旨在呈现真实世界,是对真实世界的准确描述,实际模型可能很复杂。虚拟模型虚拟模型是对真实模型的简化,并不一定是对真实模型的准确描述。我们使用虚拟模型尽可能从本质上模仿真实世界,并非复制真实世界。构建虚拟模型决定将哪些因素加入到虚拟模型中,就如同打包行李去大学,你没有办法把所有需要的东西都塞进行李箱。从本质上模仿,就是把最关键的因素加入模型,忽略次要因素。有些时候,忽略次要因素更有助于研究关键因素之间的关系。,虚拟模型的优势举例,a有空气管
3、,b牛顿管(真空)现实中五米高扔铁球和纸片,落地时间不一样。忽略空气阻力,才找到速度和重力之间的关系。忽略空气阻力帮助我们揭示出本质。,神九与天宫一号进行交会对接:研究设计的轨道时要考虑长度、宽度(否),要研究卡口就不能不考虑。根据研究问题决定选择哪些因素,好的模型根据研究的问题选择一些因素加入模型中问题不同,选择的因素也不同。博弈分析中都是虚拟模型,不是真实模型,第三节 扩展式博弈:完美信息,因为博弈论的目的在于推导人们行为的后果,所以一个模型就应该重点关注能够做出决策的个体。在一个关于绑架的例子中,我们重点关注绑架者盖伊和被绑架者奥兰多的妻子薇薇卡,薇薇卡被通知交付赎金。思考问题:盖伊与薇
4、薇卡什么时候采取行动?当他们行动时有哪些可供选择的行动方案?当他们采取行动时知道的信息是什么?,释放,绑架案,扩展式博弈:完美信息绑架案,这个博弈有五种结果:每种结果对应博弈树的一个路径,或者说一系列行动方案。如果盖伊没实施绑架,产生一个结果;如果盖伊实施绑架,产生四种结果。这四种结果分别取决于薇薇卡是否交付赎金与盖伊撕票还是释放。五种结果中盖伊和薇薇卡的偏好不同:表,扩展式博弈:完美信息绑架案,假设盖伊仅仅只是想要得到一笔钱,如果拿不到赎金,出于报复,他会杀害奥兰多。分析盖伊的处境。假设盖伊认为如果奥兰多被杀死,他被逮捕的机会很小,所以倾向于杀掉奥兰多。分析盖伊的处境。假设薇薇卡关心丈夫胜过
5、关心金钱。分析她的处境。,扩展式博弈:完美信息博弈树,分析博弈树是自上而下的(也可以是自左而右的),每一个点被称为决策点,代表在博弈中在某个点某人需要做出选择。从决策点延伸出来的线是一系列分枝,每个分枝代表可供决策者选择的一种行动方案。选择一个分枝就等于选择了一种行动方案。每一个节点为首节点,对应博弈结束的节点为终端节点。在终端节点下列出所有参与者的支付(收益)。一个博弈树只能有一个首节点。,扩展式博弈:完美信息棒球赛,在棒球赛中,有一个众所周知的事实,如右表。现在将要进行比赛的第九局,O队与Y队第八局打成平局。Y队的MR 是右投球手,O队的JL是右击球手。O队的教练正在考虑是否将JL(右击)
6、替换为左击球手JG。他当然希望JG(左击)对阵MR(右投)。但是Y队的教练也可以为了对阵JG(左击),将MR(右投)替换为左投球手RJ(左投)。,扩展式博弈:完美信息审讯伽利略,天主教主乌尔班八世决定是否把伽利略带到宗教法庭进行审问,如果决定要审问伽利略,那么伽利略决定是否承认,而审讯者需要决定采取什么行动。,534,伽利略,扩展式博弈:完美信息买车还价,Macrus为售车老板,Donna为顾客。且PHPMPL如果交易失败,双方收益均为0.如果以价格P成交,Donna的收益为PM-P,Macrus的收益为2(P-PL),扩展式博弈:完美信息买车还价,上述扩展式博弈等同于以下所示的扩展式博弈,马
7、库斯,马库斯,扩展式博弈:完美信息小练习,思考一个包含两个参与者的博弈。在博弈中,父亲可以选择是、否与可能;女儿随后做出选择,她的选择方案有:待在家里和去超市。他们各自的收益如下表所示。以扩展式写出这个博弈。,16,否,Daughter,Daughter,家,家,超市,家,超市,15,第四节 扩展式博弈:不完美信息,在左图中,盖伊在决定杀死还是释放奥兰多之前,知道薇薇卡是否交纳了赎金。(左图)如果盖伊在决定杀死还是释放奥兰多之前,不知道薇薇卡是否交纳了赎金。换言之,盖伊与薇薇卡同时决策。(右图),释放,释放,释放,杀害,杀害,不支付赎金,支付赎金,扩展式博弈:不完美信息信息集,在节点3和节点4
8、,盖伊需要作出如何对待奥兰多的决策,但他并不知道薇薇卡是否交纳了赎金,换言之,盖伊并不清楚自己处于节点3还是处于节点4。参与人不能区分的所有节点组成的集合,称为信息集。每个节点属于且只属于一个信息集。一个信息集至少包括一个节点。在任意一个扩展是博弈中,采取行动的参与者总是拥有一个信息集,这个信息集表示参与者所知道的博弈状态。所有的信息集只有一个节点的博弈,称为完美信息博弈。至少有一个信息集包含多个节点的博弈,称为不完美信息博弈。,扩展式博弈:不完美信息信息集,在左图中,盖伊在决定杀死还是释放奥兰多之前,知道薇薇卡是否交纳了赎金。信息集都是单节点,是一个完美信息博弈(左图)如果盖伊在决定杀死还是
9、释放奥兰多之前,不知道薇薇卡是否交纳了赎金。节点3和4共同构成一个信息集,这个信息集中包含了两个节点,是一个不完美信息博弈(右图),杀害,杀害,释放,释放,释放,支付赎金,不支付赎金,扩展式博弈:不完美信息信息集,由于盖伊与薇薇卡同时决策,以下两种形式的扩展式博弈是等价的。本质相同:同一个博弈,有两个阶段,第一阶段盖伊决策,第二阶段盖伊与薇薇卡同时决策。,释放,释放,杀害,杀害,不支付赎金,支付赎金,杀害,释放,支付赎金,支付赎金,不支付赎金,不支付赎金,扩展式博弈:不完美信息抢劫,深夜西蒙走在回家的路上。突然,他意识到背后有人。在他可以采取任何措施之前,他听到:“我有枪,不要喊,把你的手机、
10、电脑和钱包都给我。”西蒙看不到抢,但看到抢匪的手放在口袋里,那里好像有一把手枪。如果没有枪,西蒙认为他可以狠狠地推倒抢匪并成功逃离。但如果抢匪有枪,他的试图逃跑会导致抢匪向他开枪。如果抢匪有枪,西蒙宁愿把东西给他,以免受伤害。之前,抢匪也在考虑,是否带枪。,扩展式博弈:不完美信息陪审团投票,HS与YS分别为案件双方的律师。A、B为HS的法律策略;、为YS的法律策略,X、Y、Z为三名陪审员,他们同时进 行投票。,扩展式博弈:不完美信息伊拉克战争,不检查,检查,扩展式博弈:特征,特征1:每一个节点都是初始节点的后续节点,同时,初始节点是唯一具有这一特征的节点。特征2:除初始节点之外的任何一个节点都
11、只有一个直接前置节点。初始节点没有前置节点。特征3:从一个节点引出的不同分枝具有不同的行动标签。特征4:每一个信息集只包含一个参与人的节点。特征5:每个信息集中所有节点必须具有相同数量的直接后继节点,而且其中的所有节点是通过具有相同集合行动标签的分枝而到达这些后继节点的。,杀害,杀害,释放,释放,释放,支付赎金,不支付赎金,扩展式博弈:错误的信息集举例,扩展式博弈:无限行动的情形,公司1首先决定在广告上投入多少费用,公司2在观察到公司1的行动后,决定退出还是留在这个市场。,若公司1与公司2同时决策采取行动呢?,扩展式博弈:不完美信息小练习,返回到抢劫博弈中,假设劫匪不仅选择是否携带和出示手枪,
12、还选择是否给枪装上子弹。如果西蒙看到劫匪持枪,但不知道枪里是否有子弹。写下这个情境下的扩展式博弈(收益情况可忽略)。,第五节 策略是什么,孙子:是故胜兵先胜而后求战,败兵先战而后求胜。善用兵者,修道而保法,故能为胜败之政。强调策略的重要性。毛泽东:人不犯我,我不犯人;人若犯我,我必犯人,这也是一种策略。现实生活中,经常听到策略这个词,不同学科对策略的概念有不同的定义,这里主要是从博弈论角度谈策略的定义。策略是参与者在博弈中完整详细的决策规则。策略具有完备性。策略考虑到任何一种可能性。不能只考虑部分可能性。策略不是一系列的行动集合,而是一系列的应变计划。一个参与人的策略描述的是,在它的每一个信息
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 扩展式博弈 扩展 博弈 PPT 课件
链接地址:https://www.31ppt.com/p-5514341.html