合作联盟博弈课件.ppt
《合作联盟博弈课件.ppt》由会员分享,可在线阅读,更多相关《合作联盟博弈课件.ppt(48页珍藏版)》请在三一办公上搜索。
1、博弈论,经济与管理学院 刘洋博士,1,合作博弈 ( COOPERATIVE GAMES),2,合作博弈COOPERATIVE GAMES,熊、狼、狐狸一起抓了一只兔子,民主协商如何分配。狐狸对熊说:平均分只能各得1/3,这样吧,我们俩联合起来,平分如何?熊要答应,狼急了,于是狐狸对狼说:怎么样,我和熊联合起来可以让你什么也得不到,我可以和你合作,不过我要3/4。狼感激的点头,熊琢磨过味来,对狼说:别听那个两面三刀的,和我合作,我给你1/3。狐狸见势不妙,对狼说:别,我给你2/3,我只要1/3。狼成了抢手货,正得意,没留神狐狸和熊又开始嘀咕起来,有再次把自己晾在一边的不妙趋势,连忙钻去继续讨价还
2、价。结果呢?,3,如果在实际博弈问题中,具有有力的保障使局中人能够进行协商、谈判,联合选择行动,共同分享利益,我们就面对一个合作博弈问题。本章通过合作博弈模型的介绍,讨论在合作博弈中,局中人如何进行协商谈判、结成联盟及分享利益。1、联盟博弈2、联盟博弈的分配3、核和稳定集4、沙普利值,4,导论,先回忆一下囚徒困境的例子: 在囚徒困境中,还有另外一个策略组合,该组合为参与人带来的支付是。由到,每个参与人的支付都增加了,即得到一个帕累托改进。,5,导论,构不成一个均衡是基于参与人的个人理性。在参与人选择抵抗的情况下,每个参与人都有动机偏离这个组合,通过投机行为谋取超额收益1。如果两个参与人在博弈之
3、前,签署了一个协议:两个人都承诺选择抵抗,为保证承诺的实现,参与人双方向第三方支付价值大于1的保证金;如果谁违背了这个协议,则放弃保证金。有了这样一个协议,就称为一个均衡,每个人的收益都得到改善。 上述分析表明,通过一个有约束力的协议,原来不能实现的合作方案现在可以实现。这就是合作博弈与非合作博弈的区别。二者的主要区别在于人们的行为相互作用时,当事人是否达成一个具有约束力的协议。如果有,就是合作博弈;反之,则是非合作博弈。,6,合作博弈的概念及其表示,合作博弈,非合作博弈的对称,一种博弈类型。参与者能够联合达成一个具有约束力且可强制执行的协议的博弈类型。合作博弈强调的是集体理性,强调效率、公正
4、、公平。 合作博弈最重要的两个概念是联盟和分配。每个参与者从联盟中分配的收益正好是各种联盟形式的最大总收益,每个参与者从联盟中分配到的收益不小于单独经营所得收益。,7,合作博弈的概念及其表示,合作博弈的结果必须是一个帕累托改进,博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害。 合作博弈采取的是一种合作的方式,合作之所以能够增进双方的利益,就是因为合作博弈能够产生一种合作剩余。至于合作剩余在博弈各方之间如何分配,取决于博弈各方的力量对比和制度设计。 合作博弈的核心问题是参与人如何结盟以及如何重新分配结盟的支付。,8,合作博弈的概念及其表示,定义 1 在 人博弈中,参与
5、人集用 表示, 的任意子集 称为一个联盟(coalition)。 空集 和全集 也可以看成是一个联盟,当然单点集 也是一个联盟。 定义2 给定一个 人博弈, 是一个联盟, 是指 和 的两人博弈中 的最大效用, 称为联盟 的特征函数(characteristic function)。 规定 。根据定义, 表示参与人 与全体其他人博弈时的最大效用值,表示为 。 用 表示参与人集为 ,特征函数为 的合作博弈,其中 是定义在 上的实值映射。 在很多情况下,一个联盟能获得的支付依赖于其他参与人所采取的行动。 有时被解释为联盟 独立于联盟 的行动可保证的最大支付 。,9,合作博弈的概念及其表示,合作对策的
6、分类主要是根据特征函数的性质。下面根据特征函数的性质介绍几类特殊的合作对策。如果 仅与 的个数有关,则 称作对称博弈。如果 ,则 称作常和博弈。如果 ,则 称作简单博弈。例如,在投票博弈中,每个参与人的权重 , 如果 ,则 称作凸博弈。,10,合作博弈的概念及其表示,之所以称为特征函数,是因为这个合作博弈的性质基本由 决定。由此可见 对合作博弈的重要性。定理 设 是参与人集合上 的特征函数,则有如下的超可加性:对于联盟 和 ,如果 ,则,上式说明,特征函数只有满足超加性,才有形成新联盟的必要性。否则,如果一个合作博弈的特征函数不满足超可加性,那么,其成员没有动机形成联盟,已经形成的联盟将面临解
7、散的威胁。,11,例: 局中人1(卖主)要把一件物品卖掉,局中人2和3(买主)分别出价9元和10元。如果局中人1将物品卖给局中人2的要价是 x 元,则局中人2赢利 9-x 元。联盟 的总收益为9元。类似,联盟 的总赢利为10元。于是有 。另一方面,单个局中人或者两个买主在一起都不可能赢利,即 , 。当三个局中人在一起交易时,局中人1显然要把物品卖给局中人3,从而 v(1,2,3)=10, 显然满足超可加性,于是我们建立了联盟博弈 。特征函数是研究联盟博弈的基础,确定特征函数过程实际就是一个建立合作博弈模型的过程。有的问题,特征函数可以容易地得到,有的问题需要仔细分析,甚至需要一些专业知识。,1
8、2,由策略型博弈导出特征函数型博弈,V()=0V(1)=0V(2)=5V(1,2)=10,最小最大值法:联盟外局中人将采取行动使该联盟的总和收益最小(极度悲观),联盟选择策略最大化这些最小值。,13,例:垃圾博弈分析博弈局势,在一区域中住着7户居民,每户居民每天产生一袋垃圾,这些垃圾只能扔在这一区域的某一户人家领地(区域中没有空地)。记Vn(n=0,1, ,7)表示任意n个局中人组成的特征函数值,在合作博弈条件下,有:V0=V()=0 V1=-6V2=-5 V3=-4,V4=-3,V5=-2V6=-1, V7=-7,14,合作博弈的概念及其表示,例:设有一个3人合作对策,每个参与人各有两个纯策
9、略。当三人不合作时,其支付见下表。假设采用最稳妥策略,即最坏情况下选择最好,求合作博弈的支付函数,15,合作博弈的概念及其表示,解:用 表示一个联盟, 表示联盟中参与人的个数。 当 0,自然 ,有 。 当 1, 有3个,以 为例。 当 ,则 。 的策略集合 , 策略组合 。 与 进行如下矩阵对策:,16,合作博弈的概念及其表示,上述矩阵对策没有纯策略, 的混合策略是 , 的混合策略是 。 的均衡值是 。故 。 同理,可以求出 。 当 2, 有3个,以 为例。 当 ,则 。 的策略集合 , 策略组合 。 与 进行如下矩阵对策:,17,合作博弈的概念及其表示,上述矩阵对策有纯策略, 的均衡值是3
10、。故 。 同理,可以求出 。 当 3, 有1个, ,最大的联盟。 的策略空间 。 有 。 至此特征函数的值已全部求出。,18,分 配,所谓分配就是博弈的一个 维向量集合,之所以 是维向量,是由于每个参与人都要得到相应的分配。 维的分配向量称为博弈的“解”。定义3 对于合作博弈 ,对每个参与人 ,给予一个实值参数 ,形成 维向量 且其满足: 则称 是联盟 的一个分配方案。,19,分配,分配的定义中, 是基于个人理性,合作中的收益不能小于非合作中的收益,反映了参与人的参与约束。如果 ,那么,参与人 是不可能参加联盟的。 是基于集体理性,每个参与人的分配之和不能超过集体剩余 。另外若 没有全部被分配
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 合作 联盟 博弈 课件
链接地址:https://www.31ppt.com/p-1462733.html