第五章合作博弈ppt课件.ppt
《第五章合作博弈ppt课件.ppt》由会员分享,可在线阅读,更多相关《第五章合作博弈ppt课件.ppt(60页珍藏版)》请在三一办公上搜索。
1、博弈论,任课教师:南京航空航天大学 经管学院 李帮义 教授,博弈论与信息经济学,第五章 合作博弈,导论,先回忆一下囚徒困境的例子: 在囚徒困境中,还有另外一个策略组合,该组合为参与人带来的支付是。由到,每个参与人的支付都增加了,即得到一个帕累托改进。,导论,构不成一个均衡是基于参与人的个人理性。在参与人选择抵抗的情况下,每个参与人都有动机偏离这个组合,通过投机行为谋取超额收益1。如果两个参与人在博弈之前,签署了一个协议:两个人都承诺选择抵抗,为保证承诺的实现,参与人双方向第三方支付价值大于1的保证金;如果谁违背了这个协议,则放弃保证金。有了这样一个协议,就称为一个均衡,每个人的收益都得到改善。
2、 上述分析表明,通过一个有约束力的协议,原来不能实现的合作方案现在可以实现。这就是合作博弈与非合作博弈的区别。二者的主要区别在于人们的行为相互作用时,当事人是否达成一个具有约束力的协议。如果有,就是合作博弈;反之,则是非合作博弈。 因此,博弈可以划分为合作博弈与非合作博弈。,合作博弈的概念及其表示,合作博弈,非合作博弈的对称,一种博弈类型。参与者能够联合达成一个具有约束力且可强制执行的协议的博弈类型。合作博弈强调的是集体理性,强调效率、公正、公平。 合作博弈最重要的两个概念是联盟和分配。每个参与者从联盟中分配的收益正好是各种联盟形式的最大总收益,每个参与者从联盟中分配到的收益不小于单独经营所得
3、收益。 合作博弈的基本形式是联盟博弈,它隐含的假设是存在一个在参与者之间可以自由流动的交换媒介(如货币),每个参与者的效用与它是线性相关的。这些博弈被称为“单边支付”博弈,或可转移效用(Transferable Utility ,TU)博弈。,合作博弈的概念及其表示,合作博弈的结果必须是一个帕累托改进,博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害。合作博弈研究人们达成合作时如何分配合作得到的收益,即收益分配问题。合作博弈采取的是一种合作的方式,合作之所以能够增进双方的利益,就是因为合作博弈能够产生一种合作剩余。至于合作剩余在博弈各方之间如何分配,取决于博弈各方的力
4、量对比和制度设计。因此,合作剩余的分配既是合作的结果,又是达成合作的条件。 合作博弈的核心问题是参与人如何结盟以及如何重新分配结盟的支付。下面首先分析结盟的概念。与结盟相关联的就是特征函数。,合作博弈的概念及其表示,定义8.1.1 在 人博弈中,参与人集用 表示, 的任意子集 称为一个联盟(coalition)。 空集 和全集 也可以看成是一个联盟,当然单点集 也是一个联盟。 定义8.1.2 给定一个 人博弈, 是一个联盟, 是指 和 的两人博弈中 的最大效用, 称为联盟 的特征函数(characteristic function)。 规定 。根据定义, 表示参与人 与全体其他人博弈时的最大效
5、用值,表示为 。 用 表示参与人集为 ,特征函数为 的合作博弈,其中 是定义在 上的实值映射。 在很多情况下,一个联盟能获得的支付依赖于其他参与人所采取的行动。 有时被解释为联盟 独立于联盟 的行动可保证的最大支付 。,合作博弈的概念及其表示,合作对策的分类主要是根据特征函数的性质。下面根据特征函数的性质介绍几类特殊的合作对策。如果 仅与 的个数有关,则 称作对称博弈。如果 ,则 称作常和博弈。如果 ,则 称作简单博弈。例如,在投票博弈中,每个参与人的权重 , 如果 ,则 称作凸博弈。,合作博弈的概念及其表示,例8.1 设有一个3人合作对策,每个参与人各有两个纯策略。当三人不合作时,其支付见下
6、表。假设采用最稳妥策略,即最坏情况下选择最好,求合作博弈的支付函数,合作博弈的概念及其表示,解:用 表示一个联盟, 表示联盟中参与人的个数。 当 0,自然 ,有 。 当 1, 有3个,以 为例。 当 ,则 。 的策略集合 , 策略组合 。 与 进行如下矩阵对策:,合作博弈的概念及其表示,上述矩阵对策没有纯策略, 的混合策略是 , 的混合策略是 。 的均衡值是 。故 。 同理,可以求出 。 当 2, 有3个,以 为例。 当 ,则 。 的策略集合 , 策略组合 。 与 进行如下矩阵对策:,合作博弈的概念及其表示,上述矩阵对策有纯策略, 的均衡值是 。故 。 同理,可以求出 。 当 3, 有1个,
7、,最大的联盟。 的策略空间 。 有 。 至此特征函数的值已全部求出。,合作博弈的概念及其表示,之所以称为特征函数,是因为这个合作博弈的性质基本由 决定。由此可见 对合作博弈的重要性。定理 设 是参与人集合上 的特征函数,则有如下的超可加性:对于联盟 和 ,如果 ,则证明 以最稳妥策略为例给出证明。用 表示联盟 的策略空间。,合作博弈的概念及其表示,上式说明,特征函数只有满足超加性,才有形成新联盟的必要性。否则,如果一个合作博弈的特征函数不满足超可加性,那么,其成员没有动机形成联盟,已经形成的联盟将面临解散的威胁。定理3的逆命题也是正确的,即: 是一个集合, 是定义在 上的一个非负实值函数。 满
8、足: ,如果 则存在一个 上的合作博弈,使 成为该合作博弈的特征函数。,合作博弈的概念及其表示,对于合作博弈 ,特征函数 满足超加性,自然有: 根据上述不等式,特征函数 分成两种类型: 类型1, 满足 。即大连盟的效用是每个参与人的效用之和。这说明通过联盟并没有创造新的合作剩余,联盟没有价值,这种联盟也不可能维持。这种对策称为非实质性对策,没有研究价值,不是本章研究的范畴。 对于非实质性对策,有 ,如果 。,合作博弈的概念及其表示,类型2, 满足 。即大连盟的效用大于每个参与人的效用之和。这说明通过联盟创造了新的合作剩余,联盟有意义,这种联盟能否维持,取决于如何分配合作剩余,使每个参与人的支付
9、都有改善。这种对策称为实质性对策,是本章研究的范畴。,分配,所谓分配就是博弈的一个 维向量集合,之所以 是维向量,是由于每个参与人都要得到相应的分配。 维的分配向量称为博弈的“解”。定义8.1.3 对于合作博弈 ,对每个参与人 ,给予一个实值参数 ,形成 维向量 且其满足: 则称 是联盟 的一个分配方案。,分配,分配的定义中, 是基于个人理性,合作中的收益不能小于非合作中的收益,反映了参与人的参与约束。如果 ,那么,参与人 是不可能参加联盟的。 是基于集体理性,每个参与人的分配之和不能超过集体剩余 。另外若 没有全部被分配,显然 不是一个帕类托最优的分配方案,不会参与人所接受。,分配,在例8.
10、1分配中,分配显然不是一个,而是无限个,无限个分配形成一个分配集合。 对于实质博弈,其分配总是有无限个。例如,对于实质博弈 ,由于存在无限个正向量 ,满足 。显然如下的 都是分配,其中 。用 表示一个博弈 的所有分配方案组成的集合。,分配,定义8.1.4 设 的两个分配 和 , 是一个联盟。如果分配方案 和 满足 (i) , ; (ii) 。 则称分配方案 在 上优超于 ,或称分配方案 在 上劣于 ,记为 。 如果分配方案 在 上优超于 ,则联盟 会拒绝分配方案 , 方案得不到切实执行。因为从 到 ,中的每个参与人的收益都得到改善, 创造的剩余 又足以满足他们在 中的分配。,分配,在优超关系中
11、,联盟 的特征:1.单人联盟不可能有优超关系。2.全联盟 上也不可能有优超关系。 因此,如果在 上有优超关系,则 。 3.优超关系是集合 上的序关系,这种序关系一般情况下不具有传递性和反身性。4.对于相同的联盟 ,优超关系具有传递性,即 , ,则有 。 5.对于不同的联盟 ,优超关系不具有传递性。,核心,尽管可行分配集合 中有无限个分配,但实际上,有许多分配是不会被执行的,或者不可能被参与人所接受的 。很显然,联盟的每一个成员都不偏好于劣分配方案,因此,真实可行的分配方案应该剔除劣分配方案。 定义8.3.1 在一个 人合作博弈 中,全体优分配方案形成的集合称为博弈的核心(core),记为 。显
12、然有 。,核心,说明: 1.核心 是 中的一个闭凸集。 2.若 ,则将 中的向量 作为分配, 既满足个人理性,又满足集体理性。 3.用核心作为博弈的解,其最大缺陷是 可能是空集。,核心,定理8.3.1 分配方案 在核心 中的充要条件是: (i) , , (ii) 。证明 如果 , 满足(i)、(ii),则 不可能被优超,即 。反证法,设存在 ,使 。根据优超的定义,有:则有 ,矛盾。如果 , 不满足 (ii),则 一定被优超,即 。,核心,对于 ,存在联盟 ,有 ,则定义 ,定义 ,使得 在 中平均分配, 在 中平均分配,从而得到一个新的分配 如下:显然如此定义得向量 是个分配,且有 。,核心
13、,例8.2 假想的联合国安全理事会投票,超过两票算通过。该博弈的特征函数为而对所有其他的 , 。应用定理8.3.1,有 ,对各个联盟有 由 , , , 推得 , , ,而用 , , 又得到 和 ,所以,核心是,核心,例8.3 设3人合作博弈 的特征函数如下: , , , , 求其核心 。解 由核心定义,若 ,则它必满足 解此不等式组,得,核心,例8.4 考虑如下的合作博弈, ,特征函数如下: , ; 。解线形不等式组: 。该不等式组无解,即 。上面三个例子说明了求解核心的方法。,核心,在合作博弈中,用核心代替分配具有明显得优点,即 的稳定性。对于 中的每一个分配,每个联盟都没有反对意见,都没有
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 合作 博弈 ppt 课件
链接地址:https://www.31ppt.com/p-1360322.html