第八讲有限理性及其对博弈的影响ppt课件.ppt
《第八讲有限理性及其对博弈的影响ppt课件.ppt》由会员分享,可在线阅读,更多相关《第八讲有限理性及其对博弈的影响ppt课件.ppt(54页珍藏版)》请在三一办公上搜索。
1、第八讲 有限理性和进化博弈,苏 兵西安工业大学经济管理学院2008年,2,有限理性博弈及其分析框架最优反应动态复制动态和进化稳定性:两人对称博弈复制动态和进化稳定性:两人非对称博弈,有限理性及其对博弈的影响,主要内容,3,有限理性:追求最大利益的理性意识,分析推理能力,识别判断能力,记忆能力和准确行为能力等多方面的要求有任何一方面的不完美即为有限理性有限理性的非唯一性:博弈方有限理性的层次及各方面能力的侧重存在差异有限理性博弈:至少有部分博弈方具有有限理性,有限理性及其对博弈的影响,8.1.1 有限理性及其对博弈的影响,4,博弈方有限理性对博弈的影响 博弈方不会一开始就找到最优策略,会在博弈过
2、程中学习博弈,必须通过试错来寻找较好的策略;也意味着至少有部分博弈方不会采用完全理性博弈的均衡策略,均衡是不断调整和改进而不是一次性选择的结果,而且即使达到均衡也有可能再次偏离,有限理性及其对博弈的影响,8.1.1 有限理性及其对博弈的影响,5,8.1.2 有限理性博弈分析框架,进化博弈论 研究有限理性博弈的理论进化博弈的均衡 能通过博弈方模仿,学习的调整过程达到,能经受错误偏离的干扰,在受到少量干扰后仍能恢复的稳健的均衡分析框架 由有限理性博弈方构成的,一定规模的特定群体内成员的某种反复博弈,有限理性博弈分析框架,6,进化博弈分析的关键 确定博弈的分析框架,即博弈方学习和策略调整的模式或机制
3、以及相互学习、模仿的环境条件。主要讨论两种动态机制有快速学习能力的小群体成员的反复博弈。 最优反应动态学习速度很慢的成员组成的大群体随机配对的反复博弈。 生物进化的 “复制动态”机制,有限理性博弈分析框架,8.1.2 有限理性博弈分析框架,7,8.2 最优反应动态,分析内容 少数有快速学习能力的有限理性博弈方之间的反复博弈和策略进化最优反应动态 博弈方虽然在复杂局面下准确分析判断和运用预见性的能力稍差,但能对不同策略的结果作出较正确的事后评估,并相应调整策略。最适合描述这种理性层次博弈方的策略调整机制,即“最优反应动态”,最优反应动态,8,8.2.1 协调博弈的有限博弈方快速学习模型,5个博弈
4、方,相邻博弈方相互博弈的快速学习动态调整 模型: 博弈内容如上图得益矩阵所示的两人对称静态博弈,称之为“协调博弈”。该博弈有两个纯策略纳什均衡 (A,A) ,(B,B) ,一次性博弈中博弈结果具有不确定性,协调博弈的优先博弈方快速学习模型,9,确定分析框架博弈方虽缺乏预见能力但能够对上一阶段博弈结果进行总结,作出策略调整设 5 个博弈方分别处于下图所示圆周中的 5个位置上,每个博弈方都与左右相邻的博弈方反复博弈,协调博弈的优先博弈方快速学习模型,8.2.1 协调博弈的有限博弈方快速学习模型,10,每个位置的博弈方既可能采用 A 也可能采用 B,总共有 种可能,包括全部采用 A,全采用 B 和两
5、种策略都有人采用。根据采用 A 博弈方的数量和分布,总共有 无A,1A、有相邻2A、有不相邻 2A、有3连A、有非3连A、4A、5A共 8 种有实质差异,博弈方能否在反复博弈过程中出现策略的收敛?,协调博弈的优先博弈方快速学习模型,8.2.1 协调博弈的有限博弈方快速学习模型,11,设 为 时期博弈方 的邻居中采用 A策略邻居的数量 则采用 B 策略邻居的数量相应 根据第 期的相关情况博弈方 采用 A 的得益为 ,采用B的得益为 根据动态反应机制 当 即 时 博弈方 在 时期会采用 A 当 即 时 博弈方 在 时期会采用 B,协调博弈的优先博弈方快速学习模型,8.2.1 协调博弈的有限博弈方快
6、速学习模型,12,反应规则:如在 时期博弈方 的两个邻居只要有 1个采用 A,则在 时期采用 A,两个邻居都没采用 A,则在 时期采用 B。博弈方 在 时期的策略与自己在 时期采用的策略无关5 个博弈方完全相似,除了初次博弈时所有博弈方都采用 B 的情况外,从其余情况出发,经最优反应动态法则的调整,最终都会收敛到所有博弈方都采用 A 的稳定状态。分析过程如下,协调博弈的优先博弈方快速学习模型,8.2.1 协调博弈的有限博弈方快速学习模型,13,全部采用 A 或 B 的情况不需讨论,采用 A 策略博弈方数量和位置有实质差异的只有 6 种情况,初次博弈为 1A 的最优反应动态(已包含有相邻 2A
7、,非相连 3A 和 4A 三种情况),协调博弈的优先博弈方快速学习模型,8.2.1 协调博弈的有限博弈方快速学习模型,14,初次博弈为相连 3A 的最优反应动态,协调博弈的优先博弈方快速学习模型,8.2.1 协调博弈的有限博弈方快速学习模型,15,进化稳定策略 在博弈方的动态调整策略中能达到,又对少量偏离的扰动有稳健性,满足这两种性质的稳定状态称“进化稳定策略”(ESS)分析现实问题,必须根据实际情况建立分析框架,协调博弈的优先博弈方快速学习模型,8.2.1 协调博弈的有限博弈方快速学习模型,16,8.2.2 古诺调整过程,博弈方策略连续分布时的最优反应动态分析 以古诺模型为例,两个寡头的反应
8、函数分别是存在纳什均衡,即各生产 2 个单位。现假设两博弈方都知道自己的反应函数,只是不知道对方的利润和反应函数,也没有预见能力。在这种假设下,两寡头在第一次博弈时各自的产量就难以确定。,古诺调整过程,17,分析过程 若寡头 1 生产 2.5 单位,寡头 2 生产 3 单位。第一期结束后将这两个产量分别带入寡头 1、2 的反应函数,得到第二期的产量 1.5 和 1.75 单位;如此类推,动态调整过程将趋向于两寡头各生产 2 个单位。这个稳定状态具有对微小扰动的稳健性,是一个进化稳定策略。注意收敛是有条件的,分析的逻辑基础不同,则构成不同的动态机制。,古诺调整过程,8.2.2 古诺调整过程,18
9、,8.3.1 签协议博弈的复制动态和进化稳定策略,分析对象 学习速度较慢的有限理性博弈方的动态策略调整及其稳定性分析框架 博弈方组成的大群体成员的随机配对反复博弈分析过程 博弈方学习速度慢意味着向优势策略转变是一个渐进的过程,可以用生物进化的进化动态方程,即复制动态公式来表示,签协议博弈的复制动态和进化稳定策略,19,经济活动中的各种合作都可以用签协议来代表,以右图所示的签协议博弈为例: 根据该博弈的得益情况,有两个纯策略纳什均衡, (同意,同意) (不同意,不同意) 前者帕累托优于后者,在理性层次较低的有限理性博弈方组成的大群体成员随机配对反复博弈的框架内分析该博弈,签协议博弈的复制动态和进
10、化稳定策略,8.3.1 签协议博弈的复制动态和进化稳定策略,20,分析过程 博弈方理性较低,不会一开始就找到最佳策略。不同策略的博弈方可看作不同的类型。假设,整个群体中为“同意”类型的博弈方占整个群体的比例为 x ,则“不同意”博弈方比例为 1-x 博弈方的得益不仅取决于自己和随机配对遇到的对手类型。“同意”与“不同意”两种类型博弈方各自的期望得益 和 分别为:,签协议博弈的复制动态和进化稳定策略,8.3.1 签协议博弈的复制动态和进化稳定策略,21,核心:博弈方策略类型比例是动态变化的,其变 化速度可用动态复制方程表示: 时,无模拟榜样,博弈方不会有意识地改变策略。 时,若变化率为正,采用“
11、同意”策略的博弈方逐渐增多;若变化率为负,采用“不同意”策略的博弈方逐渐增多。,签协议博弈的复制动态和进化稳定策略,8.3.1 签协议博弈的复制动态和进化稳定策略,22,上述复制动态微分方程的相位图如下图: 除 外,其他所有初始情况出发的复制动态过程,都会使博弈方都趋向于“同意”,即 和 是上述复制过程的两个稳定状态。,签协议博弈的复制动态和进化稳定策略,8.3.1 签协议博弈的复制动态和进化稳定策略,23,当 时,假设比例为 的博弈方“犯错误”偏离“同意” 策略,则分别采取两种策略博弈方的期望得益和平均得益为:当 时,假设比例为 的博弈方“犯错误”偏离“不同意”策略,则分别采取两种策略博弈方
12、的期望得益和平均得益为:,由于 且接近于1,具有对少量错误偏离的稳健性,是ESS,由于采用“不同意”策略博弈方得益为0,博弈方会不断减少,不是ESS,签协议博弈的复制动态和进化稳定策略,8.3.1 签协议博弈的复制动态和进化稳定策略,24,8.3.2 一般两人对称博弈的复制动态和进化稳定策略,将上述签协议博弈的分析推广至一般的 22 对称博弈,博弈内容如右图所示:则采用两种策略博弈方的期望得益和群体平均得益为:可得一般 22 对称博弈的复制动态方程:,25,稳定状态:令复制动态方程 可得复制动态的稳定状态,最多有 3 个,分别为进化稳定策略:由微分方程的“稳定性定理”可知,当 且 时所对应的稳
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 有限 理性 及其 博弈 影响 ppt 课件

链接地址:https://www.31ppt.com/p-1360650.html