《第6讲:演化博弈论简介ppt课件.ppt》由会员分享,可在线阅读,更多相关《第6讲:演化博弈论简介ppt课件.ppt(30页珍藏版)》请在三一办公上搜索。
1、第6讲:演化博弈论简介,浙江工业大学经贸管理学院曹柬,在前面的学习中,我们都假设博弈参与人为完全理性的人;但在现实中,不存在完全理性的人。每个人都有学习和改进过错的经历;每个人学习和改进错误的速度是有差异的。具有快速学习能力的小群体成员之间的反复博弈,可以采用“最优反应动态”。学习速度较慢的成员组成的大群体中的反复博弈,可以采用“复制动态”。,第6讲:演化博弈论简介,一、最优反应动态,(一)协调博弈,NE:(A,A),(B,B),(11/61,11/61)其中,(B,B)为pareto最优,但(A,A)为风险上策均衡,第6讲:演化博弈论简介,最优反应动态:能根据对方的上期策略调整自己的策略。,
2、5个博弈方,相邻者彼此博弈,初始策略组合为32种。实际上为8种:无A,1A,相邻2A,不相邻2A,3连A,非3连A,4A,5A,例如:,令xi(t)为t时期博弈方i 的采用策略A的邻居的数量,则xi(t)=0,1,2.,可知,当xi(t)22/61时,UAUB,在t时期,当2个邻居中只要有1个邻居采用策略A,则i在t+1时期必然采用A,第6讲:演化博弈论简介,例举如下:,1、当初始情况为1A时,综上可知,32种初始情况下,只有1种情况稳定于5B,其余31中情况最后都将稳定于5A。(此时,A为“进化稳定策略”,即ESS,evolutionary stable strategy),2、当初始情况为
3、2连A时,3、当初始情况为3连A时,第6讲:演化博弈论简介,(一)连续型的古诺调整过程,则调整过程为:,反应函数:,则最终的进化稳定策略(ESS)为:q1=2,q2=2,第6讲:演化博弈论简介,二、复制动态中的对称博弈,(一)签协议博弈,假设:群体中“Y”的比例为x,“N”的比例为1-x,Y:同意N:不同意,设:群体比例的动态变化速度为,第6讲:演化博弈论简介,图1 签协议博弈的复制动态相位图,x*=0,x*=1为稳定状态,此时,dx/dt=0但x*=1为ESS,即最终所有人都将选择“Y”,第6讲:演化博弈论简介,(二)一般两人对称博弈,群体中采用S1的比例为x,S2的比例为1-x,当F(x)
4、=0时,复制动态稳定状态为:x*=0,x*=1,x*=(d-b)/(a-b-c+d),则复制动态方程F(x):,第6讲:演化博弈论简介,稳定性定理,若x0;若xx*,为使xx*,应满足F(x)0.,这意味着:当F(x*)0,x*为ESS,第6讲:演化博弈论简介,(三)协调博弈的复制动态和ESS,当F(x)=0时,x*=0,x*=1,x*=11/61为稳定状态,复制动态方程F(x):,图2 协调博弈的复制动态相位图,第6讲:演化博弈论简介,当n3,复制动态与最优反应动态的比较:,所以,在有限理性程度下,理性程度较高的一方不一定能得到比理性程度较低的一方更理想的结果。,第6讲:演化博弈论简介,(四
5、)鹰鸽博弈的复制动态和ESS,令x为采用“鹰”策略的群体比例,1-x为采用“鸽”策略的群体比例,则复制动态方程F(x):,当F(x)=0时,x*=0,x*=1,x*=v/c为稳定状态,第6讲:演化博弈论简介,假设v=2,c=12(表示种群间发生冲突导致的损失很大,大于和平共处所得到的收益),F(0)0,F(1)0,而F(1/6)0,则ESS为:x*=1/6,当冲突损失严重时,例如c/v=6时,两个种群发生战争的可能性为1/36;和平共处的可能性为25/36;一方霸道、一方忍让的可能性为10/36。发生战争的可能性随着c/v比值的增加而降低,即:和平共处的可能性也随着增加。,第6讲:演化博弈论简
6、介,假设v=8,c=8(表示种群间和平共处所得到的收益等于两者冲突导致的损失),ESS:x*=1,当cv时,种群间宁可发生冲突,也不愿意和平共处以获得更多的收益。主要原因在于当一方忍让时,另一方可获得更多收益。这是一种悲剧。目前,人类的现状和理性尚不能解决这种悲剧。,第6讲:演化博弈论简介,(四)蛙鸣博弈的复制动态和ESS,令x为采用“鸣”策略的群体比例,1-x为采用“不鸣”策略的群体比例,则复制动态方程F(x):,m、P为求偶成功的概率 z为机会成本(体力消耗、危险性等),满足:m(0.5,1,mP1,稳定状态:x*=0,x*=1,x*=(m-z)/(1-P),第6讲:演化博弈论简介,若(m
7、-z)/(1-P)(0,1),即1-Pm-z0,ESS:x*=(m-z)/(1-P),在这种情况下,无论初始状况如何,最后总有(m-z)/(1-P)比例的雄蛙鸣叫。当个别雄蛙“搭便车”的收益大于群体雄蛙“鸣叫”所获得的收益时,则总会存在搭便车“不鸣叫”的雄蛙。,第6讲:演化博弈论简介,若(m-z)/(1-P)m,ESS:x*=0,显然,当机会成本小于收益时,所有的雄蛙将选择“不鸣叫”。当“鸣叫”的收益大于群体鸣叫而个别雄蛙“搭便车”的收益时,所有雄蛙都将鸣叫。,第6讲:演化博弈论简介,对称博弈:相似/相同群体中的演化博弈行为 非对称博弈:不同群体间的演化博弈行为,三、复制动态中的非对称博弈,有
8、两个群体:竞争者和在位者,第6讲:演化博弈论简介,(一)市场阻入博弈,A:“进入”的群体比例为x“不进”的群体比例为1-xB:“打击”的群体比例为y“不打击”的群体比例为1-y,对A而言:,则竞争者群体的复制动态方程FA(x):,采用A表示竞争者,B表示在位者,假设:,第6讲:演化博弈论简介,竞争者群体的复制动态方程:,A:“进入”的群体比例为x“不进”的群体比例为1-xB:“打击”的群体比例为y“不打击”的群体比例为1-y,竞争者的群体复制动态相位图为:,(b)y1/2ESS:x*=0,(a)y=1/2x*0,1,(c)y1/2ESS:x*=1,第6讲:演化博弈论简介,A:“进入”的群体比例
9、为x“不进”的群体比例为1-xB:“打击”的群体比例为y“不打击”的群体比例为1-y,对B而言:,则在位者群体的复制动态方程FB(x):,第6讲:演化博弈论简介,在位者群体的复制动态方程:,第6讲:演化博弈论简介,A:“进入”的群体比例为x“不进”的群体比例为1-xB:“打击”的群体比例为y“不打击”的群体比例为1-y,在位者的群体复制动态相位图为:,(b)x0ESS:y*=0,(a)x=0y*0,1,A:“进入”的群体比例为x“不进”的群体比例为1-xB:“打击”的群体比例为y“不打击”的群体比例为1-y,最后,得到竞争者和在位者两群体复制动态的关系和稳定性图例,通过分析可知:ESS为x*=
10、1,y*=0 即无论两个群体的初始状态落在哪个区域,最终的演化博弈结果为竞争者“进入”,在位者“不打击”,第6讲:演化博弈论简介,有两个实力不同的群体,争夺/分享资源,第6讲:演化博弈论简介,(二)非对称鹰鸽博弈,若简化问题分析,令v1=10,v2=2,c=12,A:采用“鹰”策略的群体比例为x“鸽”策略的群体比例为1-xB:采用“鹰”策略的群体比例为y“鸽”策略的群体比例为1-y,对A而言:,则A群体的复制动态方程FA(x):,采用A表示甲,B表示乙,假设:,第6讲:演化博弈论简介,A群体的复制动态方程:,A的群体复制动态相位图为:,(b)y5/6ESS:x*=0,(a)y=5/6x*0,1
11、,(c)y5/6ESS:x*=1,第6讲:演化博弈论简介,A:采用“鹰”策略的群体比例为x“鸽”策略的群体比例为1-xB:采用“鹰”策略的群体比例为y“鸽”策略的群体比例为1-y,对B而言:,则B群体的复制动态方程FB(x):,第6讲:演化博弈论简介,A:采用“鹰”策略的群体比例为x“鸽”策略的群体比例为1-xB:采用“鹰”策略的群体比例为y“鸽”策略的群体比例为1-y,B群体的复制动态方程:,第6讲:演化博弈论简介,B的群体复制动态相位图为:,A:采用“鹰”策略的群体比例为x“鸽”策略的群体比例为1-xB:采用“鹰”策略的群体比例为y“鸽”策略的群体比例为1-y,(b)x1/6ESS:y*=0,(a)x=1/6y*0,1,(c)x1/6ESS:y*=1,A:“进入”的群体比例为x“不进”的群体比例为1-xB:“打击”的群体比例为y“不打击”的群体比例为1-y,最后,得到竞争者和在位者两群体复制动态的关系和稳定性图例,当初始状态落在A区域,ESS为x*=0,y*=1 当初始状态落在D区域,ESS为x*=1,y*=0 当初始状态落在B、C区域,为不稳定状态,但可以确定最终大部分结果是落在D区。,落在区域A的概率为1/36,区域D的概率为25/36。剩下的10/36的可能性中绝大部分也会稳定在D区域。,第6讲:演化博弈论简介,
链接地址:https://www.31ppt.com/p-2105235.html