第八讲有限理性及其对博弈的影响ppt课件.ppt

上传人：小飞机

文档编号：1360650

上传时间：2022-11-14

格式：PPT

页数：54

大小：1.65MB

《第八讲有限理性及其对博弈的影响ppt课件.ppt》由会员分享，可在线阅读，更多相关《第八讲有限理性及其对博弈的影响ppt课件.ppt（54页珍藏版）》请在三一办公上搜索。

1、第八讲有限理性和进化博弈,苏兵西安工业大学经济管理学院2008年,2,有限理性博弈及其分析框架最优反应动态复制动态和进化稳定性：两人对称博弈复制动态和进化稳定性：两人非对称博弈,有限理性及其对博弈的影响,主要内容,3,有限理性：追求最大利益的理性意识，分析推理能力，识别判断能力，记忆能力和准确行为能力等多方面的要求有任何一方面的不完美即为有限理性有限理性的非唯一性：博弈方有限理性的层次及各方面能力的侧重存在差异有限理性博弈：至少有部分博弈方具有有限理性,有限理性及其对博弈的影响,8.1.1 有限理性及其对博弈的影响,4,博弈方有限理性对博弈的影响博弈方不会一开始就找到最优策略，会在博弈过

2、程中学习博弈，必须通过试错来寻找较好的策略；也意味着至少有部分博弈方不会采用完全理性博弈的均衡策略，均衡是不断调整和改进而不是一次性选择的结果，而且即使达到均衡也有可能再次偏离,有限理性及其对博弈的影响,8.1.1 有限理性及其对博弈的影响,5,8.1.2 有限理性博弈分析框架,进化博弈论研究有限理性博弈的理论进化博弈的均衡能通过博弈方模仿，学习的调整过程达到，能经受错误偏离的干扰，在受到少量干扰后仍能恢复的稳健的均衡分析框架由有限理性博弈方构成的，一定规模的特定群体内成员的某种反复博弈,有限理性博弈分析框架,6,进化博弈分析的关键确定博弈的分析框架，即博弈方学习和策略调整的模式或机制

3、以及相互学习、模仿的环境条件。主要讨论两种动态机制有快速学习能力的小群体成员的反复博弈。最优反应动态学习速度很慢的成员组成的大群体随机配对的反复博弈。生物进化的 “复制动态”机制,有限理性博弈分析框架,8.1.2 有限理性博弈分析框架,7,8.2 最优反应动态,分析内容少数有快速学习能力的有限理性博弈方之间的反复博弈和策略进化最优反应动态博弈方虽然在复杂局面下准确分析判断和运用预见性的能力稍差，但能对不同策略的结果作出较正确的事后评估，并相应调整策略。最适合描述这种理性层次博弈方的策略调整机制，即“最优反应动态”,最优反应动态,8,8.2.1 协调博弈的有限博弈方快速学习模型,5个博弈

4、方，相邻博弈方相互博弈的快速学习动态调整模型：博弈内容如上图得益矩阵所示的两人对称静态博弈，称之为“协调博弈”。该博弈有两个纯策略纳什均衡 (A,A) ，(B,B) ，一次性博弈中博弈结果具有不确定性,协调博弈的优先博弈方快速学习模型,9,确定分析框架博弈方虽缺乏预见能力但能够对上一阶段博弈结果进行总结，作出策略调整设 5 个博弈方分别处于下图所示圆周中的 5个位置上，每个博弈方都与左右相邻的博弈方反复博弈,协调博弈的优先博弈方快速学习模型,8.2.1 协调博弈的有限博弈方快速学习模型,10,每个位置的博弈方既可能采用 A 也可能采用 B，总共有种可能，包括全部采用 A，全采用 B 和两

5、种策略都有人采用。根据采用 A 博弈方的数量和分布，总共有无A，1A、有相邻2A、有不相邻 2A、有3连A、有非3连A、4A、5A共 8 种有实质差异,博弈方能否在反复博弈过程中出现策略的收敛？,协调博弈的优先博弈方快速学习模型,8.2.1 协调博弈的有限博弈方快速学习模型,11,设为时期博弈方的邻居中采用 A策略邻居的数量则采用 B 策略邻居的数量相应根据第期的相关情况博弈方采用 A 的得益为，采用B的得益为根据动态反应机制当即时博弈方在时期会采用 A 当即时博弈方在时期会采用 B,协调博弈的优先博弈方快速学习模型,8.2.1 协调博弈的有限博弈方快

6、速学习模型,12,反应规则：如在时期博弈方的两个邻居只要有 1个采用 A，则在时期采用 A，两个邻居都没采用 A，则在时期采用 B。博弈方在时期的策略与自己在时期采用的策略无关5 个博弈方完全相似，除了初次博弈时所有博弈方都采用 B 的情况外，从其余情况出发，经最优反应动态法则的调整，最终都会收敛到所有博弈方都采用 A 的稳定状态。分析过程如下,协调博弈的优先博弈方快速学习模型,8.2.1 协调博弈的有限博弈方快速学习模型,13,全部采用 A 或 B 的情况不需讨论，采用 A 策略博弈方数量和位置有实质差异的只有 6 种情况,初次博弈为 1A 的最优反应动态（已包含有相邻 2A

7、，非相连 3A 和 4A 三种情况）,协调博弈的优先博弈方快速学习模型,8.2.1 协调博弈的有限博弈方快速学习模型,14,初次博弈为相连 3A 的最优反应动态,协调博弈的优先博弈方快速学习模型,8.2.1 协调博弈的有限博弈方快速学习模型,15,进化稳定策略在博弈方的动态调整策略中能达到，又对少量偏离的扰动有稳健性，满足这两种性质的稳定状态称“进化稳定策略”（ESS）分析现实问题，必须根据实际情况建立分析框架,协调博弈的优先博弈方快速学习模型,8.2.1 协调博弈的有限博弈方快速学习模型,16,8.2.2 古诺调整过程,博弈方策略连续分布时的最优反应动态分析以古诺模型为例，两个寡头的反应

8、函数分别是存在纳什均衡，即各生产 2 个单位。现假设两博弈方都知道自己的反应函数，只是不知道对方的利润和反应函数，也没有预见能力。在这种假设下，两寡头在第一次博弈时各自的产量就难以确定。,古诺调整过程,17,分析过程若寡头 1 生产 2.5 单位，寡头 2 生产 3 单位。第一期结束后将这两个产量分别带入寡头 1、2 的反应函数，得到第二期的产量 1.5 和 1.75 单位；如此类推，动态调整过程将趋向于两寡头各生产 2 个单位。这个稳定状态具有对微小扰动的稳健性，是一个进化稳定策略。注意收敛是有条件的，分析的逻辑基础不同，则构成不同的动态机制。,古诺调整过程,8.2.2 古诺调整过程,18

9、,8.3.1 签协议博弈的复制动态和进化稳定策略,分析对象学习速度较慢的有限理性博弈方的动态策略调整及其稳定性分析框架博弈方组成的大群体成员的随机配对反复博弈分析过程博弈方学习速度慢意味着向优势策略转变是一个渐进的过程，可以用生物进化的进化动态方程，即复制动态公式来表示,签协议博弈的复制动态和进化稳定策略,19,经济活动中的各种合作都可以用签协议来代表，以右图所示的签协议博弈为例：根据该博弈的得益情况，有两个纯策略纳什均衡， (同意,同意) (不同意,不同意) 前者帕累托优于后者，在理性层次较低的有限理性博弈方组成的大群体成员随机配对反复博弈的框架内分析该博弈,签协议博弈的复制动态和进

10、化稳定策略,8.3.1 签协议博弈的复制动态和进化稳定策略,20,分析过程博弈方理性较低，不会一开始就找到最佳策略。不同策略的博弈方可看作不同的类型。假设，整个群体中为“同意”类型的博弈方占整个群体的比例为 x ，则“不同意”博弈方比例为 1-x 博弈方的得益不仅取决于自己和随机配对遇到的对手类型。“同意”与“不同意”两种类型博弈方各自的期望得益和分别为：,签协议博弈的复制动态和进化稳定策略,8.3.1 签协议博弈的复制动态和进化稳定策略,21,核心：博弈方策略类型比例是动态变化的，其变化速度可用动态复制方程表示：时，无模拟榜样，博弈方不会有意识地改变策略。时，若变化率为正，采用“

11、同意”策略的博弈方逐渐增多；若变化率为负，采用“不同意”策略的博弈方逐渐增多。,签协议博弈的复制动态和进化稳定策略,8.3.1 签协议博弈的复制动态和进化稳定策略,22,上述复制动态微分方程的相位图如下图：除外，其他所有初始情况出发的复制动态过程，都会使博弈方都趋向于“同意”，即和是上述复制过程的两个稳定状态。,签协议博弈的复制动态和进化稳定策略,8.3.1 签协议博弈的复制动态和进化稳定策略,23,当时，假设比例为的博弈方“犯错误”偏离“同意” 策略，则分别采取两种策略博弈方的期望得益和平均得益为：当时，假设比例为的博弈方“犯错误”偏离“不同意”策略，则分别采取两种策略博弈方

12、的期望得益和平均得益为：,由于且接近于1，具有对少量错误偏离的稳健性，是ESS,由于采用“不同意”策略博弈方得益为0，博弈方会不断减少，不是ESS,签协议博弈的复制动态和进化稳定策略,8.3.1 签协议博弈的复制动态和进化稳定策略,24,8.3.2 一般两人对称博弈的复制动态和进化稳定策略,将上述签协议博弈的分析推广至一般的 22 对称博弈，博弈内容如右图所示：则采用两种策略博弈方的期望得益和群体平均得益为：可得一般 22 对称博弈的复制动态方程：,25,稳定状态：令复制动态方程可得复制动态的稳定状态，最多有 3 个，分别为进化稳定策略：由微分方程的“稳定性定理”可知，当且时所对应的稳

13、定状态具有稳健性，为进化稳定策略。如右图所示，为进化稳定策略。,8.3.2 一般两人对称博弈的复制动态和进化稳定策略,26,8.3.3 协调博弈的复制动态和进化稳定策略,例：如右图所示博弈内容将 a=50 , b=49 , c=0 , d=60 代入一般复制动态方程：令解出三个稳定状态，而根据微分方程稳定性定理，可知都是该博弈的进化稳定策略，而则不是。,27,上述复制动态相位图如下当时稳定状态为，所有博弈方都采用策略 2 ；当时稳定状态为，所有博弈方都采用策略 1 。,博弈方都采用策略 2 的均衡是两个均衡效率较高的，若 x 落在 (0,1) 概率相同，复制动态实

14、现高效率均衡的机会较小，只有 11/61,8.3.3 协调博弈的复制动态和进化稳定策略,28,有限理性博弈方通过复制动态的学习和策略调整也不一定能够实现最理想的结果，达到优化。以复制动态为核心的进化博弈分析结果和以最优反应动态为核心的进化博弈分析结果既相似又有差别。相似：两者大多情况下都会趋向于博弈方都采用策略1的效率较低的均衡。差异：复制动态趋向效率较高均衡的机会为11/61，比最优反应动态趋向较高效率均衡的机会1/32要高。主要原因：理性程度稍高的博弈方并不一定能得到比理性稍差的博弈方更理想的结果，这是囚徒困境的一种表现形式。,8.3.3 协调博弈的复制动态和进化稳定策略,29,8.3.4

15、鹰鸽博弈的复制动态和进化稳定策略,“鹰鸽博弈”是指同一物种内部冲突中的策略和均衡问题，“鹰”和“鸽”分别指“攻击型”和“和平型”两种策略。代表双方争夺的利益，是争夺中失败一方的损失。,鹰鸽博弈的复制动态和进化稳定策略,30,运用前述对称博弈复制动态的一般公式，用 x 表示采用“鹰”策略博弈方的比例，把代入，得采用“鹰”策略博弈方比例的动态复制方程为：,鹰鸽博弈的复制动态和进化稳定策略,8.3.4 鹰鸽博弈的复制动态和进化稳定策略,31,例：假设上述“鹰鸽博弈”中，则复制动态方程为解得 3 个稳定状态：，其中是ESS 。现实意义：人们争夺的利益和严重冲突后果符合上述设定时，在较大

16、规模群体长期进化中，采用攻击型策略博弈方的数量稳定在 1/6 左右，而大多数人为 5/6 ，会采用较和平的策略。,鹰鸽博弈的复制动态和进化稳定策略,8.3.4 鹰鸽博弈的复制动态和进化稳定策略,32,鹰鸽博弈的进化博弈分析可以揭示人类社会或动物世界发生战争或激烈冲突的可能性及其频率国际关系中霸道和软弱，侵略和反抗，威胁和妥协等共存的原因,鹰鸽博弈的复制动态和进化稳定策略,8.3.4 鹰鸽博弈的复制动态和进化稳定策略,33,8.3.5 蛙鸣博弈的复制动态和进化稳定策略,亿万年以前青蛙的祖先既无耳朵也不会发声。但经过长期进化的现代青蛙却变成能够非常响亮地鸣叫，而雌蛙则有相当好的听力。雄蛙的响亮叫声

17、是吸引雌蛙注意，有机会交配的重要手段。雄蛙鸣叫也有一定的“成本”：更容易被天敌蛇发现，有丧命的危险消耗宝贵的能量有“搭便车”的现象雄蛙应不应该鸣叫呢？,蛙鸣博弈的复制动态和进化稳定策略,34,把蛙鸣问题抽象成两只雄蛙之间的策略博弈某一范围有两只雄蛙，如果它们都不鸣叫，则吸引来的雌蛙的数量为0，即它们都没有交配机会；如果只有一只雄蛙鸣叫，其获得交配机会为，但鸣叫者有成本。如果两只都鸣叫，获得交配的机会为，各有成本。,蛙鸣博弈的复制动态和进化稳定策略,8.3.5 蛙鸣博弈的复制动态和进化稳定策略,35,蛙鸣博弈的复制动态和进化稳定策略,8.3.5 蛙鸣博弈的复制动态和进化稳定策略,36,

18、如果，因为，因此。该博弈有唯一的纳什均衡，不鸣叫是双方的上策。如果，仍然成立，则此时该博弈存在两个纯策略纳什均衡，即两雄蛙都鸣叫和两雄蛙都不鸣叫，还存在一个混合策略的纳什均衡，两蛙都以一定概率决定是否鸣叫。如果，在的情况下，存在唯一的纯策略纳什均衡，鸣叫是双方的上策。,蛙鸣博弈的复制动态和进化稳定策略,8.3.5 蛙鸣博弈的复制动态和进化稳定策略,37,蛙鸣博弈的复制动态和进化稳定策略,分析框架：对青蛙没有理性要求，通过遗传特征的变异和自然选择决定青蛙器官特性的动态进化过程。属于 22 对称博弈，则可得复制动态方程：求得三个稳定状态：当时，三个稳定状态均处于的有效范

19、围，复制动态方程的相位图如下：是进化稳定策略，即一旦少数雄蛙发生从不鸣到鸣的变异，这种变异雄蛙的数量会不断增加最终占到整个雄蛙比重的。,8.3.5 蛙鸣博弈的复制动态和进化稳定策略,38,当，上述复制动态方程只有两个不动点符合要求，此时复制动态方程的相位图如右图：是唯一进化稳定策略。即如果从所有雄蛙都不鸣叫开始，即使出现少量变异，也很快会消失。当，复制动态也只有两个不动点符合要求，复制动态方程如右图：是唯一ESS。,蛙鸣博弈的复制动态和进化稳定策略,39,8.4 复制动态和进化稳定性,分析框架对称博弈相似博弈方群体的策略进化和稳定性，对应大群体成员间随机配对反复博弈。非对称博

20、弈有差别的有限理性博弈方群体的成员，相互之间随机配对博弈。,复制动态和进化稳定性,40,8.4.1 复制动态和进化稳定性:两人非对称博弈,考虑市场阻入博弈，如右图所示：该博弈为一个非对称两人博弈。用得益矩阵图示，存在两个纳什均衡，(进,不打击) 和 (进,打击)，前者是子博弈完美纳什均衡。,复制动态和进化稳定性:两人非对称博弈,41,分析框架：博弈方的学习和策略模仿局限在他们所在群体内部，策略调整的机制仍然与两人对称博弈中的复制动态相似。分析过程：假设 1 位置采用“进”策略的博弈方比例为 x，2 位置采用“打击”策略的博弈方比例为y，则在博弈方 1 位置博弈的“进”和“不进”两类博弈方的期

21、望得益和群体平均得益。博弈方 2 位置博弈的“打”和“不打”两类博弈方的期望得益和群体平均得益分别为：,复制动态和进化稳定性:两人非对称博弈,8.4.1 复制动态和进化稳定性:两人非对称博弈,42,将两人对称进化博弈的复制动态分析用于两个位置的博弈方群体，可得博弈方 1 位置博弈的博弈方类型比例的复制动态方程：若，则始终为 0 ，即所有水平都是稳定状态。若，则和是两个稳定状态。其中，若，则是进化稳定策略。若，则是进化稳定策略。,复制动态和进化稳定性:两人非对称博弈,8.4.1 复制动态和进化稳定性:两人非对称博弈,43,如下给出三种情况下复制动态的相位图，可看出 x

22、的动态趋势及其稳定性：,复制动态和进化稳定性:两人非对称博弈,8.4.1 复制动态和进化稳定性:两人非对称博弈,44,同理：可得博弈方 2 位置博弈的博弈方类型比例的复制动态方程：可得：若，那么始终为 0，即所有水平都是稳定状态。若，则和是两个稳定状态，其中是进化稳定策略。如下相位图给出了 y 的动态趋势及其稳定性：,复制动态和进化稳定性:两人非对称博弈,8.4.1 复制动态和进化稳定性:两人非对称博弈,45,复制动态和进化稳定性:两人非对称博弈,8.4.1 复制动态和进化稳定性:两人非对称博弈,46,将上述两群体类型比例变化复制动态的关系表示在坐标平面上，如图：,非对称博弈两

23、群体复制动态的关系和稳定性,该博弈的进化稳定策略只有和，意味着有限理性的博弈方通过长期反复博弈是能够得到子博弈完美纳什均衡的。,复制动态和进化稳定性:两人非对称博弈,8.4.1 复制动态和进化稳定性:两人非对称博弈,47,8.4.2 非对称鹰鸽博弈的进化博弈分析,鹰鸽博弈也可以是非对称博弈，因为当人们为了某件事物发生冲突竞争的时候，所争夺的目标对冲突各方的价值不一定一致。假设：鹰鸽博弈所争夺目标对博弈方 1 的价值为，对博弈方 2 的价值为，。得益矩阵为下图，显然为非对称博弈。,博弈方 2,鹰,鸽,鹰,鸽,博弈方1,非对称鹰鸽博弈的进化博弈分析,48,上述博弈中令：设博弈方 1 位

24、置博弈的群体中采用“鹰”策略的博弈方比例为 x ，博弈方 2 位置博弈的群体中，采用“鹰”策略的博弈方比例为 y ，则在博弈方 1位置博弈的“鹰”和“鸽”两类博弈方的期望得益和群体平均得益以及博弈方 2 位置博弈的“鹰”和“鸽”两类博弈方的期望得益和群体平均得益分别为：,非对称鹰鸽博弈的进化博弈分析,8.4.2 非对称鹰鸽博弈的进化博弈分析,49,则令，可解得：若，那么始终为 0，即所有水平都是稳定状态。若，则和是两个稳定状态，其中是 ESS。若，则和是两个稳定状态，其中是 ESS。如下相位图给出了 x 的动态趋势及稳定性：,非对称鹰鸽博弈的进化博弈分析,8.

25、4.2 非对称鹰鸽博弈的进化博弈分析,50,非对称鹰鸽博弈的进化博弈分析,8.4.2 非对称鹰鸽博弈的进化博弈分析,51,同样，若，所有 y 水平都是稳定状态。若，则和是两个稳定状态，是ESS。若，则和是两个稳定状态，是ESS。如下相位图给出了 y 的动态趋势及稳定性：,非对称鹰鸽博弈的进化博弈分析,8.4.2 非对称鹰鸽博弈的进化博弈分析,52,将上述比例变化复制动态关系用一个坐标平面图表示，如右图：本博弈中，大部分情况下都会收敛于博弈方 1采用鹰策略，博弈方 2采用鸽策略的均衡。,非对称鹰鸽博弈两博弈方群体复制动态和稳定性,非对称鹰鸽博弈的进化博弈分析,8.4.2 非对称鹰鸽博弈的进化博弈分析,53,其他博弈,在线博弈微分博弈,其他博弈,54,总结,本课程首先介绍了博弈的基本概念以及博弈的组成，重点介绍了六种不同类型的博弈：完全信息静态博弈完全且完美信息动态博弈重复博弈完全但不完美信息动态博弈不完全信息静态博弈不完全信息动态博弈并针对每种类型问题提出具体的解决办法。通过实例介绍概念和原理，深入浅出地对各种博弈问题、博弈原理的经济意义进行阐述。,总结,