进化稳定策略及其应用ppt课件.ppt
《进化稳定策略及其应用ppt课件.ppt》由会员分享,可在线阅读,更多相关《进化稳定策略及其应用ppt课件.ppt(51页珍藏版)》请在三一办公上搜索。
1、进化稳定策略及其应用,最优化理论(optimization theory)和对策论(game theory,又称博弈论)是进化生物学中两个最常用的、非常相近的研究途径。它们之间的主要区别体现在适用范围上:优化理论适用的情形是当一个个体的最优行为不依赖于其它个体的行为时,而对策论则适用于一个个体的最优行为依赖于其它个体如何行动的情形。最优化理论的基本出发点是,自然选择总是倾向于使生物最有效地传递它们的基因,因而也将是最有效地从事各种活动,包括使它们在时间和能量分配方面达到最优状态 。但是,最优化理论也遇到了一定困难,即在许多情况下普遍意义上的最佳策略往往并不存在。一个个体采取某一对策是好还是坏不
2、仅取决于这个对策本身,而且往往还取决于种群内其它个体所采取的对策是什么。,例如,一个雄性粪蝇在寻觅雌蝇时的最优占位往往取决于其它雄蝇停落在什么位置;在争夺配偶的战斗中,一个雄性动物的最佳对策经常取决于他的对手如何行动,有时退让是有利的,有时激烈争斗是更适合的。在这些例子中,不存在一个任何情形下都一律适用的最佳对策。这时我们观察到的自然界生物它们应该采取何种对策呢?为解决这一难题,Maynard Smith(1982;Maynard Smith & Price 1973)创造性地提出了一个全新概念进化稳定对策,或称ESS(为英文全称evolutionarily stable strategy的简
3、写)。当种群内所有个体都采取了某个对策后,其它对策者都不能侵入该种群,那么这个对策就是进化上稳定的。这个概念不强调绝对意义上的优化,而是从相对意义上寻求所谓的最佳:当种群完全是由ESS对策者组成的时候,ESS对策者的适合度将大于所有突变对策者的适合度。因而,ESS是一个弱化了的最优化概念(Ehrlich & Roughgarden 1987)。,进化稳定策略的简介,进化稳定策略,又称演化稳定策略(ESS),是evolutionarily stable strategy的简写,属于行为生态学的范畴。定义:如果任何策略yx,存在某个 使得不等式 对所有的 都成立,那么 是一个进化稳定策略。5种对策
4、:1 鹰式 2鸽式 3威吓4报复性威胁5试探性威胁,单态ESS,定义 对所有不同于S*的个体策略S,如果有 E(S*, S*)=E(S, S*) 如果在上式中的等式成立,则 E(S*, S)E(S,S)那么,称S*为单态ESS在单种群进化博弈中,ESS是对称纳什均衡,但对称纳什均衡不一定是ESS。(交换经济博弈),经济交换博弈,每个市民生产1或2单位的产品。然后拿到市场上与另一个市民交易。如果他们他们中的每个只生产1单位,交易不能增加他们的支付。然而如果他们生产2单位,他们将一单位交换一单位,增加消费多样性。,在纯策略模型中,有两个纳什均衡:(L,L)和(H,H),(L,L)不是单态ESS。策
5、略L用S*=(1,0)表示,策略H用S=(0,1)表示 E(S*, S*)=(1,0) =1E(S ,S*)=1= E(S*, S*) 而E(S*, S)= =12=E(S,S)所以策略L不是单态ESS,多态ESS(对于有多个个人策略),定义 对所有不同于S*的S m,如果有 E(S*, S*)=E(S, S*) 如果在上式中的等式成立,则 E(S*, S)E(S,S)那么,称S*为一个ESS。,设A= 为进化博弈的行为参与人的支付矩阵,如果存在 使 , 则第 个策略 是进化稳定策略 严格对称的纳什均衡是进化稳定策略,但是进化稳定策略不一定是严格的纳什均衡。(鹰鸽博弈),鹰鸽博弈,有三个纳什均
6、衡:(鹰,鸽),(鸽,鹰)和一个混合策略纳什均衡(每个参与者以概率1/4选择鹰)ESS要求是对称的纳什均衡,两个纯策略不是。鹰策略的种群比例为p(0p1),预期回报E(H)=P(-3)+2(1-P)=2-5P E(D)=P0+(1-p)1=1-p混合策略纳什均和要求E(H)=E(D),解得p=1/4。当p1/4时,则相反。所以进化将导致种群1/4的参与人使用鹰策略。混合策略(1/4,3/4)是ESS。证:S*=(1/4,3/4) S为任意其他策略(p,1-p),p1/4。E(S*,S*)= =3/4=E(S,S*) 而E(S*,S)= =5/4-2pE(S,S)= =1-4p2比较上面两式:
7、E(S*,S)E(S,S)恒成立混合策略(1/4,3/4)是ESS,协调博弈,设某一同质种群的成员任意配对。在这博弈中,(L,L)(D,D)都是严格对称纳什均衡,所以L和D都是ESS。(S*,S*)是对称混合策略均衡, 其中S*=(1/4,3/4)。为了使它为ESS必须使E(S*, S)E(S,S)成立(S*S)在此博弈中参与人选择同一行动要好于选择不同行动,所以这个条件不满足,最可能背离在这个条件的S是纯策略L,这种情况下,E(S,S)=3, E(S*, S)=3/4,确实背离了条件E(S*, S)E(S,S).,局部渐进稳定性判断纳什均衡是否为ESS,动态方程复制者动态增长率 等于参与人的
8、适合度 减去他的平均适合度用此法进行协调博弈分析:将A带入得当初始状态p01/4时,参与人进化稳定策略是L注:,两种群进化稳定策略,定义:对于在mn中(x*,y*)的一些邻域中的所有其他(x,y),要么x*AyxAy,要么y*BxyBx,那么称(x*,y*)为一个ESS.定理:如果(x*,y*)是双矩阵博弈的一个ESS,那么x*和y*分别是m和n 中的纯策略在单种群鹰鸽博弈中,混合策略是ESS,在两种群下则不是。,假设p是行参与人选择鹰策略(H)的概率,q是列参与人选择鹰策略的概率。行参与人的预期支付为: E(H)=q(-3)+2(1-q)=2-5q E(D)=q0+(1-q)1=1-q对于列
9、参与人其支付矩阵与行参与人相同,于是 E(H)=p(-3)+2(1-p)=2-5p E(D)=p0+(1-p)1=1-p,按照学习规则,当q1/4时,行参与人将p上调;当p1/4时,列参与人将q上调。(p,q)平面上的的点(1/4,1/4)处的纳什均衡不是稳定的,此时x*=(1/4,3/4)和y*=(1/4,3/4) 。现在考虑(x,y)=(p,1-p),(q,1-q)(x*,y*) ,检验是否为ESS x*Ay=1/4(2-5q)+3/4(1-q)=5/4-2q (1) xAy=p(2-5q)+(1-p)(1-q)=1+p-q-4pq (2)由上两式得x*Ay-xAy=4(1/4-p)(1/
10、4-q) (3),显然只有当p,q都超过1/4或两个都小于1/4时,(3)式才大于零,其他p,q组合都使(3)式小于零,就是x*AyxAy不成立,同理可证(x*,y*)的一些邻域使得 y*BxyBx不成立,因此(x*,y*) 不是一个ESS。下验证两个纯策略纳什均衡是ESS。引入动态方程复制者动态行参与者的复制者动态为,将A带入得 (4) 同理得列参与人的复制者动态为 (5) 以上两动态系统有5个平衡点(0,1),(1,0),(0,0),(1,1),(1/4,1/4).以上已经证明混合策略纳什均衡(1/4,1/4)不是ESS,而(0,0),(1,1)不是纳什均衡,只证(1,0)是否为ESS,对
11、于两种群两策略的双矩阵进化博弈,要证平衡点是否为ESS,只要证明复制者动态方程的平衡点是进化均衡。动态系统的雅可比矩阵为,雅可比行列式为 detJ=(1-2P)(1-2q)(1-4p)(1-4q)-16pq(1-p)(1-q)雅可比矩阵的迹为 trJ=(1-2p)(1-4q)+(1-2q)(1-4p)在平衡点(1,0),有detJ=30和trJ=-40。这样该点是局部渐进稳定的。同理可证(0,1)是ESS。,3.1 鹰鸽对策与进化稳定对策概念的提出,自然界的每一动物都经常要与其它个体争夺食物、领域和配偶等有限资源。进化稳定对策概念的起源很大程度上是和分析这些动物争斗行为联系在一起的(Mayna
12、rd Smith & Price 1973),其后又被推广应用到其它各式各样频率依赖选择(frequency-dependent selection)的情形(Maynard Smith 1982)。进化稳定对策理论与传统种群遗传学对频率依赖选择的研究相比,最明显的差别可能主要是强调的重点不同。种群遗传学家主要考察基因频率的动态以及平衡态的性质,目的是探讨不同类型的选择对一个位点上不同基因型的效应。为了分析上的方便,对策集经常被高度简化,经常是只考虑对应于两个等位基因的两个对策。而ESS理论家对于遗传学系统本身的问题考虑很少,经常假定对策可以无性繁殖或者有机体是单倍体。这种遗传学上的高度简化使得
13、人们可以考察更为复杂、更为广泛的对策集,以及对策之间更加微妙的适合度相互作用。用Maynard Smith 的话说,ESS概念的精髓就是假定简单化的遗传学而考察复杂的生态学(Hines 1987)。另外一点不同是,ESS只注重考虑种群达到平衡时的性质,而基本上忽略了动态。容易看到,种群遗传学和ESS理论各自都在不同方面上作了一些不现实的假定,因此二者之间更具有互补性,而不是相互对立。,Maynard Smith & Price(1973)最初的目的是希望理解动物个体之间的争斗为什么总是一场“有限的战争”,很少造成严重的伤害。例如,许多蛇类的雄性个体相互之间扭缠打斗时从不使用它们的毒牙。在May
14、nard Smith & Price研究这个问题之前,人们通常给出的解释是,否则许多个体将受到严重伤害,最终对物种生存不利。但是Maynard Smith & Price不满意这种群体选择的观点,并从个体选择的角度运用对策论提出了他们自己的生物学解释。他们的分析是以动物争斗为例进行的。首先让我们只考虑“鹰”“鸽”两种战斗对策。鹰对策者战斗起来总是全力以赴,除非身受重伤否则决不退让;如果争斗双方都是鹰对策者,那么其中一方将最终受到伤害并退让。而鸽对策者则只限于威胁恫吓,对方一旦表现出争斗升级迹象立刻退让;如果对方也是鸽对策者,那么相互对峙一定时间后便会有一方自动退却(鸽子通常视为和平的象征,这里
15、也取其这层含义。但我们都知道,事实上鸽子是非常好斗的)。这里我们假定鹰对策和鸽对策之间没有连续过渡的中间类型;对策集是离散的。,令V表示被争夺资源的价值;胜利的一方获得该资源并使适合度增加V;争斗失败的鹰对策者其适合度损失C。鹰鸽对策的赢得矩阵(payoff matrix)可以表示为表3.1。在完全由鸽对策者组成的种群里,鹰对策者一旦进入它的适合度将可增加V,而鸽对策者的适合度只能增加V/2(未考虑对峙带来的能量或时间消耗);因此,我们得出结论:鸽对策属于在进化上不稳定的类型,它将很容易地被鹰对策侵入。那么完全的鹰对策种群是否就是进化稳定的呢?根据表3.1我们容易看到,鹰对策是否为进化稳定的对
16、策取决于V和C值的相对大小。在一个鹰对策种群里,鹰对策者的平均赢得为(V-C)/2,而侵入的鸽对策者的赢得为0。如果VC,那么鹰对策者的适合度大于鸽对策者的适合度;反之,如果VC,那么鸽对策者的适合度大于鹰对策者的适合度,它将能够侵入鹰对策种群。这时我们看到,无论是纯鹰对策种群还是纯鸽对策种群都不是进化稳定的。所以,种群必然是一个鹰、鸽对策的混合体。那么鹰、鸽对策者在种群内各自所占比例应该是多少呢?令p为种群内鹰对策者所占比例。鹰、鸽对策者的适合度可以分别表示为(3.1)其中,W0表示与对策无关的基本适合度。鹰对策者和鸽对策者的适合度都不是恒定值,依赖于种群内鹰、鸽对策的相对比例,因而我们称其
17、为频率依赖的选择(frequency-dependent selection)。假定个体无性生殖,鹰对策者生育的后代都是鹰对策者,鸽对策者生育的后代也都是鸽对策者,并且每个个体生育的后代数量与其适合度成正比。一代之后,鹰对策者的频率将为(3.2)其中 。方程(3.2)准确地描述了系统的动态。知道了V和C的值以及初始的鹰对策者频率就可以很容易地计算种群内鹰对策者频率的变化过程。然而,对于这类频率依赖的选择,人们往往更关心的是系统将向什么状态趋近,或者说稳定的系统状态是什么。,在一个稳定种群内,鹰、鸽对策者的适合度应该相等,即Wh=Wd;据此我们可以求出鹰对策者的比例为 。如果C值相对于V值来说很
18、大,那么种群内鹰对策者的比例将会很低,鹰-鹰争斗的情形也将极为罕见。我们当然不能期望这个高度简化的模型能够完全解释为什么动物个体间争斗不产生严重伤害的后果。但是这个模型至少可以帮助我们理解为什么在自然界导致严重伤害的激烈争斗非常罕见。上面我们假定个体要么是纯粹的鹰对策者、要么是纯粹的鸽对策者。或者说种群在遗传构成上是多态的。ESS也可以用另一种方式来达到:种群内每个个体都以一定概率采取两种对策,而且在每次博弈中所采取的对策必须是随机确定的。这时种群在遗传构成上是单态的,但表现型上是两种对策共存。以表3.1赢得矩阵为例,ESS对策是以V/C的概率采取鹰对策,以(1V/C)的概率采取鸽对策。在对策
19、论中,人们通常考虑遗传上单态的ESS,而往往忽略了遗传多态所带来的复杂性。隐含在上面这个模型中的一个重要假设是无性生殖。为了使问题简化,人们经常明确或暗含地假设无性(孤雌)生殖,或者真实遗传(breed true),即通俗地说就是“龙生龙,凤生凤”;后代与亲代之间由于有性生殖过程而必然存在的遗传差异被忽略了。因为我们面对的有机体绝大多数都是有性生殖的二倍体生物,所以这个假设只能理解为对非常复杂问题的一个初步探索。Maynard Smith(1982)认为,忽略有性生殖多数情形下不会产生太大的影响。值得注意的是,在ESS种群内每个个体的期望赢得为 ,而在纯鸽对策种群内每个个体的期望赢得为V/2。
20、虽然纯鸽对策种群个体平均适合度大于ESS种群内个体的平均适合度,但它是一个不稳定的种群,随时都有可能受到其它对策(鹰对策)的侵蚀。人们普遍相信,自然选择所选择的最终结果应该是稳定的、不会受到任何其它对策侵蚀的ESS种群。,ESS,与最优化理论一样,都是只能从可供选择的对策集(strategy set)中选取“最佳”的对策。所以进化稳定对策也将受到可供选择的对策范围所制约。为了说明这一点,让我们在上面的鹰鸽对策的博弈中再增加一种对策,中庸对策。中庸对策者表现的行为是:当自己是资源(例如一块领域)占有者时表现为鹰,当自己是入侵者时表现为鸽;并且假定中庸对策者表现为鹰(资源占有者)或鸽(入侵者)的概
21、率相等。赢得矩阵为表3.2。当两个中庸相遇时,一个肯定是资源占有者并采取鹰对策,而另一个则是入侵者并采取鸽对策。,我们容易证明,当VC时,中庸对策是进化稳定的对策,并且是唯一的ESS。所以ESS具体形式是什么依赖于有多少可供选择的对策.同时,这个博弈 与前面的鹰鸽博弈还有一个不同之处:,鹰鸽博弈是对称的,而表3.2的博弈是非对称的。所谓对称是指争斗双方处于完全等同的地位:它们可选择的对策集相同,它们的期望赢得也相同。而在鹰-鸽-中庸博弈中,中庸对策者根据其对资源的拥有状况选取相应的对策,因而争斗双方在对策的选择上不是完全对等的。后面我们还将回到这个博弈问题上来。,对称的二人博弈,现在我们来考察
22、对称的、二人进化博弈的一些一般性质。假设有m个可能的对策,表示为1,2,m。博弈(争斗)可以发生在任何一对随机选取的动物个体之间。赢得矩阵 dij 为mm,其中dij表示采取对策i的动物与j对策者博弈时的赢得值(适合度增加值)。系统动态可以用两种稍有不同的方式进行分析。首先,我们假定一个个体总是采取相同的纯对策,并且这种特性被它所有后代所继承。令ni 为 i对策者在某一时刻的个体数量,pi 为它们的相对频率。一个 i对策者的适合度为(3.3)种群的平均适合度为(3.4),各个对策的个体数量增加符合下列方程 (3.5)因此,我们可以得到 (3.6)当系统达到平衡时,即,必然有或者。因此在系统达到
23、平衡态时,所有频率不为零的对策它们的适合度必然相等。在频率依赖的选择下,各个类型的频率将受到调整以使它们的适合度正好相等。我们还需要确定一个系统平衡态是否是局域稳定的;数学上这可以通过解雅可比矩阵的特征根来判断。模型(3.6)的一个稳定平衡态,称为进化稳定的状态(evolutionarily stable state);其中代表平衡种群内采用i对策的个体所占的比例。这个模型的结果是导致产生各种纯对策的多态,也被称为“纯对策模型”(pure strategy model; Bulmer 1994)。而另外一种在博弈论中更常见的途径是认为,个体可以采取混合对策,即是以一定概率采取各个纯对策。例如,
24、在前面介绍的鹰鸽博弈中,动物可能以50%的概率采取鹰对策,以50%的概率采取鸽对策。然后,我们来寻找这样的混合对策(或者纯对策),当它在种群内被所有成员采纳时,任何其它对策都不能成功地侵入。这样的一个对策就称为进化稳定对策,或者简称为ESS。这种途径的一个优点是我们不必明确考虑系统平衡态的动态稳定性问题。,考虑混合对策p和q,它们分别以概率pi 和qi采用纯对策i。一个p对策者与q对策者博弈时其平均赢得值(用表示)为(3.7)或者我们用矩阵形式表示,即(3.8)如果对策p是个ESS,那么当它的适合度必须大于突变对策q的适合度。用x表示q在种群内的频率,对策p和q的适合度分别为 (3.9)p为E
25、SS的条件是当x无限小时,对于所有的qp都有WPWq;因此,如果满足条件(3.10)那么p即为ESS;如果则需要满足(3.11)p才是一个ESS。,(3.10)式是说,对策p是对自己的最好应答。如果你知道你的对手将采取对策p,那么你别无选择只能也采取对策p,因为采取任何其它对策都不如采取对策p好。换言之,这要求p是一个严格的Nash平衡(Nash 1951)。(3.11)式则是说,如果q是另外一个同样好的对于p的应答,那么p对q的应答就必须比q对自己的应答更好。这个条件保证了任何稀有突变,q-对策者,都不能侵入p-对策者组成的种群。这时的p我们说是一个弱Nash平衡。所有具有非零概率的纯对策组
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 进化 稳定 策略 及其 应用 ppt 课件
链接地址:https://www.31ppt.com/p-1458671.html