第十一章博弈模型课件.ppt
《第十一章博弈模型课件.ppt》由会员分享,可在线阅读,更多相关《第十一章博弈模型课件.ppt(80页珍藏版)》请在三一办公上搜索。
1、第十一章 博弈模型,11.1 进攻与撤退的抉择11.2 让报童订购更多的报纸11.3 “一口价”的战略 11.4 不患寡而患不均 11.5 效益的合理分配 11.6 加权投票中权力的度量,第十一章 博弈模型11.1 进攻与撤退的抉择,单一决策主体,决策变量目标函数约束条件,决策主体的决策行为发生直接相互作用 (相互影响),博弈模型,非合作博弈,合作博弈,三要素,多个决策主体,决策问题(Decision Problem),军事、政治、经济、企业管理和社会科学中应用广泛,单一决策主体决策变量目标函数约束条件决策主体的决策行为发生直,1944年6月初,盟军在诺曼底登陆成功. 到8月初的形势:,背景,
2、11.1 进攻与撤退的抉择,双方应该如何决策 ?,1944年6月初,盟军在诺曼底登陆成功.背景11.1 进,模型假设,博弈参与者为两方(盟军和德军),盟军有3种使用其预备队的行动:强化缺口,原地待命,东进;德军有2种行动:向西进攻或向东撤退.,博弈双方完全理性,目的都是使战斗中己方获得的净胜场次(胜利场次减去失败场次)尽可能多.,完全信息静态博弈,共同知识(以上信息双方共有),双方同时做出决策,模型假设 博弈参与者为两方(盟军和德军) 盟军有3种使用其预,博弈模型,博弈参与者集合N=1,2(1为盟军,2为德军),用u1(a1,a2)表示对盟军产生的结果,即净胜场次,称为盟军的效用函数.,盟军行
3、动a1 A1=1,2,3(强化缺口/原地待命/东进); 德军行动a2 A2=1,2(进攻/撤退)。 (行动:即纯战略),支付矩阵(Payoff Matrix),完全竞争: 零和博弈 (常数和博弈),u2(a1,a2)对应 -M,博弈模型 博弈参与者集合N=1,2(1为盟军,2为德军),博弈的解的概念:纳什均衡 (NE: Nash Equilibrium),不存在(纯)NE,(纯战略)纳什均衡,Nash: 1994年获诺贝尔经济学奖,NE: 单向改变战略不能提高自己效用,即每一方的战略对于他方的战略而言都是最优的,称为最优反应.,(纯)NE: a*=(a1*, a2*) =(2, 2),非常数和
4、博弈(双矩阵表示),博弈的解的概念:纳什均衡 (NE: Nash Equilib,混合战略(策略:Strategy),盟军的混合战略集,期望收益,盟军,德军,S1=p=(p1, p2, p3) |,德军的混合战略集,S2= q=(q1, q2) |,完全信息静态博弈有限博弈矩阵博弈 (2人)零和博弈常数和博弈,混合战略(策略:Strategy) 盟军的混合战略集 期望收,模型求解,理性推理:不管自己怎么做,另一方总是希望尽量使自己得分尽量低.(二人零和博弈,完全竞争),盟军,德军,线性规划,从一个给定的战略中期望得到的赢得,总是采用该策略时他们可能得到的最坏的赢得!,盟军可以用min pM来衡
5、量策略p的好坏,max U1(p) = min pM,min U2(q) = max MqT,德军可以用max MqT来衡量策略q的好坏,(p*, q*): 混合(策略)纳什均衡(Mixed NE),p2*=3/5,p3*=2/5,q1*=1/5,q2*=4/5,最优值均为2/5,模型求解理性推理:不管自己怎么做,另一方总是希望尽量使自己得,占优(dominate):盟军的行动2占优于1 (前面的非常数和博弈M类似),混合策略似乎不太可行! 但概率可作为参考. -现实:盟军让预备队原地待命(行动2),而德军没有选择撤退(行动2),结果德军大败.,模型评述,博弈规则至关重要的,如参与人决策的时间
6、顺序、决策时拥有哪些信息等.,多人(或非常数和)博弈问题,一般不能用上面的线性规划方法求解,而通过纳什均衡的定义求解.,占优(dominate):盟军的行动2占优于1 混合策略似乎,小结:博弈模型的基本要素,参与人,理性假设,行动顺序(静态、动态),信息结构(完全、不完全),行动空间(及战略空间),效用函数,参与者完全理性(最大化效用),其他因素,纳什均衡,单向改变战略不能提高自己效用,小结:博弈模型的基本要素 参与人 理性假设 行动顺序(静态、,11.2 让报童订购更多的报纸,报童模型回顾,订购价w,零售价p,处理价v(pwv0)需求量:密度函数f(x)、分布函数F(x), F(0)=0,订
7、购Q份报纸,期望销售量为,期望存货量,期望利润,最优订购量Qr,Qr(w),11.2 让报童订购更多的报纸 报童模型回顾订购价w,零售,11.2 让报童订购更多的报纸,问题,假设报社报纸成本价为c,wcv, w*,完全信息动态博弈:常称Stackelberg Game (两阶段) 子博弈完美均衡: (w*,Qr(w),一般w*c Qr(w*) Q* 整体利润有损失,能否改善(协调)?,假设报社与报童联合,整体利润最大,11.2 让报童订购更多的报纸 问题假设报社报纸成本价为,价格折扣协议模型,折扣方案wd(Q) 下,报童效用(期望利润),达到协调,假设报社与报童联合,整体期望利润,关于Q的减函
8、数(非线性),,报童利润 ,报社利润利润的任意分配比例都可达到,价格折扣协议模型 折扣方案wd(Q) 下,报童效用(期望利润,模型一 回收价格协议,原订货量,达到协调,整体最优,b,报童利润 ,报社利润利润的任意分配比例都可达到,回收价b (pwbv),回收协议模型,模型一 回收价格协议 原订货量达到协调整体最优b,模型二 回收数量协议,报社回收,达到协调,报童回收,,报童利润, 报社利润; 利润任意分配都可达到,按批发价回收,比例为,报童利润,回收协议模型,模型二 回收数量协议 报社回收 达到协调报童回收,,模型评述,协议参数的确定:不能单方决定双方谈判(合作博弈),还有很多其他类型的协议,
9、也可以达到协调,一种更简单的协议批发价w成本c收取一定加盟费,如何评价比较协议的优缺点?,是否能达到协调,是否能任意分配利润,协议执行成本有多高,模型评述 协议参数的确定:还有很多其他类型的协议,也可以达到,11.3 “一口价”的战略,背景,为了节省“讨价还价”时间,考虑“一口价”模式.,双方同时报价:若买价卖价,则以均价成交; 否则不成交.,问题,双方应如何报价?,双方总能成交吗?(效率估计),“讨价还价”很浪费买卖双方的宝贵时间.,11.3 “一口价”的战略 背景 为了节省“讨价还价”时,模型假设与建立,卖方知道物品对自己的价值,但买方不知道.,买方知道物品对自己的价值,但卖方不知道.,双
10、方都知道(如猜出)对方价值的分布信息.,卖方价值vs, 买方价值vb, 均服从U0,1 (均匀分布),卖方报价ps, 买方报价pb, pb ps时成交价p (pb+ps)/2,成交效用:卖方U1=p- vs, 买方U2= vb p; 不成交: 0,双方完全理性(最大化自己的期望效用 ).,以上为双方的共同知识.,模型假设与建立 卖方知道物品对自己的价值,但买方不知道. 买,卖方报价ps ps(vs)买方报价pb pb(vb),双方战略,战略组合( ps(vs), pb(vb) 何时构成均衡?,定义在0,1区间上、取值也在0,1区间上的非减函数.,不完全信息静态博弈(静态贝叶斯博弈),贝叶斯纳什
11、均衡,单向改变战略不能提高自己效用.,信息非对称(不完全信息),模型假设与建立,卖方报价ps ps(vs)双方战略战略组合( ps(vs),均衡条件,具体战略(函数)形式不同,均衡就可能不同.,单一价格战略,卖方:买方:,双方战略互为最优反应,所以构成贝叶斯纳什均衡!,模型假设与建立,均衡条件具体战略(函数)形式不同,均衡就可能不同.单一价格战,单一价格战略效率为,x(1-x)/0.50.5,x0.5效率最大(1/2),对给定的(vs, vb),当vsvb时称为交易是有利的.,在给定的战略组合下,有利的全部交易中能够实际发生交易的比例称为该战略的交易效率.,单一价格战略,单一价格战略效率为x(
12、1-x)/0.50.5x0.5对给,线性价格战略,卖方报价ps(vs) as+csvs;买方报价pb(vb) ab+cbvb,双方战略互为最优反应,构成贝叶斯纳什均衡!,买方:,买方: (同理),线性价格战略卖方报价ps(vs) as+csvs;双方战,不成立时也适用(不唯一),线性价格战略,vb,vs1pb(vb)ps(vs)3/43/41/4pb,评述,效率(线性价格战略),效率为1/4*3/4 =9/16,可以证明,线性均衡效率最大.,不存在使所有有利的交易都成交的均衡战略组合.,信息的不完全(非对称信息)降低了交易效率.,包含了交易价值(交易给双方带来的效用之和,即vbvs)大于1/4
13、的所有有效交易.,评述效率(线性价格战略)效率为可以证明,线性均衡效率最大.不,11.4 不患寡而患不均,最后通牒博弈(Ultimatum Game),问题,甲乙两人就分配笔钱(如100元)进行博弈.,甲首先提出分配方案 (分给乙的钱: s).,现实中的情况果真如此吗?多数s总额的4050%s越小,越容易被乙拒绝,完全信息动态博弈:均衡结果是(s=0,乙接受); 如果要求严格均衡,则s=分钱.,如果乙接受,则按此分配 ;否则双方什么也得不到.,公平:利他互惠?,自私:理性非理性?,11.4 不患寡而患不均最后通牒博弈(Ultimatu,模型假设与建立,1. 每个参与者都喜欢对所有参与者公平的结
14、果;,2. 每个参与者自己受到不公平对待时的“愤怒”,胜过其他参与者受到不公平对待时的“愧疚”,否则,xixj=1-xi时,i(x)xi-i (xi -xj)= i -(2i -1)xi关于xi的系数非正 (过分“愧疚” ),效用函数,财富总额为1接受提议:甲乙所得x1=1-s, x2= s;否则:x1=x2=0,模型假设与建立1. 每个参与者都喜欢对所有参与者公平的结果;,模型求解,如果不接受,则x1=x2=0; U1(s)=U2(s)=0 .,若s1/2,则x2 x1,乙的最优反应,乙的最优反应(给定s),如果接受,则x1=1-s, x2=s.,若s1/2,则x2x1,U2(s)0,1/2
15、0,易知,(s1/2, 两者一致),模型求解如果不接受,则x1=x2=0; U1(s)=U2(s,模型求解,Case 1: 甲知道乙的2,若s1/2,则x2 x1,甲的决策,s=1/2时达到最大值1/2,甲的决策(只需考虑乙接受情形),均衡: (s*,接受),s*严格小于50%; 是乙的“愤怒”系数2的增函数.,模型求解Case 1: 甲知道乙的2 若s1/2,则x2,模型求解:甲的决策,Case 2: 甲不知道乙的2, 但知道2知道分布F(2),若s1/2,则x2 x1,甲的决策,若s1/2,则x2 x1,U1(s)=1-s-1(2s-1) 同前,期望效用,乙接受概率,s*,模型求解:甲的决
16、策Case 2: 甲不知道乙的2, 但知道,模型解释,甲永远不会提出大于/的方案s,乙拒绝过小的方案s,很好地解释了实际中的最后通牒博弈,乙接受概率随s增加不减,参考文献,模型解释 甲永远不会提出大于/的方案s 乙拒绝过小的方案,11.5 效益的合理分配,例,甲乙丙三人合作经商,若甲乙合作获利7元,甲丙合作获利5元,乙丙合作获利4元,三人合作获利11元. 又知每人单干获利1元.问三人合作时如何分配获利?,记甲乙丙三人分配为,解不唯一,(5,3,3)(4,4,3)(5,4,2),11.5 效益的合理分配例甲乙丙三人合作经商,若甲乙合作获,(1) Shapley合作对策, I,v n人合作对策,v
17、特征函数,n人从v(I)得到的分配,满足,v(s) 子集s的获利,(1) Shapley合作对策 I,v n人合作对,公理化方法,s子集 s中的元素数目, Si 包含i的所有子集,由s决定的“贡献”的权重, i 对合作s 的“贡献”,Shapley合作对策,公理化方法s子集 s中的元素数目, Si 包含i的所,三人(I=1,2,3)经商中甲的分配x1的计算,1/3 1/6 1/6 1/3,1 1 2 1 3 I,1 7 5 11,0 1 1 4,1 6 4 7,1/3 1 2/3 7/3,x1=13/3,类似可得 x2=23/6, x3=17/6,1 2 2 3,三人(I=1,2,3)经商中甲
18、的分配x1的计算 1/3,合作对策的应用 污水处理费用的合理分担,污水处理,排入河流.,三城镇可单独建处理厂,或联合建厂(用管道将污水由上游城镇送往下游城镇).,Q污水量,L管道长度建厂费用P1=73Q0.712管道费用P2=0.66Q0.51L,合作对策的应用 污水处理费用的合理分担20km38km河,污水处理的5 种方案,1)单独建厂,总投资,2)1, 2合作,3)2, 3合作,4)1, 3合作,总投资,总投资,合作不会实现,污水处理的5 种方案1)单独建厂总投资2)1, 2合作3)2,5)三城合作总投资,D5最小, 应联合建厂,建厂费:d1=73(5+3+5)0.712=453 12 管
19、道费:d2=0.66 50.51 20=30 23 管道费:d3=0.66 (5+3)0.51 38=73,D5,城3建议:d1 按 5:3:5分担, d2,d3由城1,2担负,城2建议:d3由城1,2按 5:3分担, d2由城1担负,城1计算:城3分担 d15/13=174C(1),不同意!,D5如何分担?,5)三城合作总投资D5最小, 应联合建厂 建厂费:d1=73,特征函数v(s)联合(集s)建厂比单独建厂节约的投资,三城从节约投资v(I)中得到的分配,Shapley合作对策,特征函数v(s)联合(集s)建厂比单独建厂节约的投资三城,计算城1从节约投资中得到的分配x1,x1 =19.7,
20、城1 C(1)-x1=210.4, 城2 C(2)-x2=127.8, 城3 C(3)-x3=217.8,x2 =32.1, x3=12.2,x2最大,如何解释?,计算城1从节约投资中得到的分配x11,优点:公正、合理,有公理化基础。,如n个单位治理污染, 通常知道第i方单独治理的投资yi 和n方共同治理的投资Y, 及第i方不参加时其余n-1方的投资zi (i=1,2, ,n). 确定共同治理时各方分担的费用.,其他v(s)均不知道, 无法用Shapley合作对策求解,Shapley合作对策小结,若定义特征函数为合作的获利(节约的投资),则有,缺点:需要知道所有合作的获利,即要定义I=1,2,
21、n的所有子集(共2n-1个)的特征函数,实际上常做不到.,优点:公正、合理,有公理化基础。如n个单位治理污染, 通常知,求解合作对策的其他方法,例. 甲乙丙三人合作经商,若甲乙合作获利7元,甲丙合作获利5元,乙丙合作获利4元,三人合作获利11元. 问三人合作时如何分配获利?,设只知道无 i 参加时n-1方合作的获利全体合作的获利求解合,(1)协商解,将剩余获利 平均分配,模型,以n-1方合作的获利为下限,求解, xi 的下限,(1)协商解11将剩余获利 平,(2)Nash解,为现状点(谈判时的威慑点),在此基础上“均匀地”分配全体合作的获利B,模型,(2)Nash解 为现状点(谈判时的威慑点)
22、在此基础上,(3)最小距离解,模型,第i 方的边际效益,若令,(3)最小距离解模型 第i 方的边际效益若令3)最小距离解,(4)满意解,di现状点(最低点)ei理想点(最高点),模型,(4)满意解di现状点(最低点)模型4)基于满意度的解,(5)Raiffi 解,与协商解x=(5,4,2)比较,(5)Raiffi 解与协商解x=(5,4,2)比较,求解合作对策的6种方法(可分为三类),Shapley合作对策,A类,B类,协商解,Nash解,最小距离解,求解合作对策的6种方法(可分为三类)Shapley合作对策A,例:有一资方(甲)和二劳方(乙,丙), 仅当资方与至少一劳方合作时才获利10元,应
23、如何分配该获利?,Raiffi解,C类,例:有一资方(甲)和二劳方(乙,丙), 仅当资方与至少一劳,B类:计算简单,便于理解,可用于各方实力相差不大的情况;一般来说它偏袒强者.,C类: 考虑了分配的上下限,又吸取了Shapley的思想,在一定程度上保护弱者.,A类:公正合理;需要信息多,计算复杂.,求解合作对策的三类方法小结,B类:计算简单,便于理解,可用于各方实力相差不大的情况;一般,11.6 加权投票中权力的度量,背景,“一人一票”显示投票和表决的公正.,股份制公司每位股东投票和表决权的大小由所占有的股份多少决定.,一些国家、地区的议会、政府的产生,由所属的州、县等各个区域推出的代表投票决
24、定.,代表投票的权重取决于所代表区域的人口数量.,经济或政治机构权力的分配,11.6 加权投票中权力的度量 背景“一人一票”显示,背景,典型案例: 美国总统选举实行的选举人制度,美全国50个州和华盛顿特区共538张选举人票.,获选举人票数一半以上的总统候选人当选总统.,各州选举人票数与该州在国会的参、众议员数相等.,参议员每州两位,众议员人数由各州人口比例确定.,各州人口悬殊巨大使各州选举人票数相差很大.,(如加利福尼亚州选举人票55张,阿拉斯加州只3张),背景典型案例: 美国总统选举实行的选举人制度 美全国50个,背景,典型案例: 美国总统选举实行的选举人制度,总统候选人在各州内进行普选,获
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十一章 博弈模型课件 第十一 博弈 模型 课件
链接地址:https://www.31ppt.com/p-1390459.html