中科大管理经济学课件第十一章博弈论和策略行为.ppt
《中科大管理经济学课件第十一章博弈论和策略行为.ppt》由会员分享,可在线阅读,更多相关《中科大管理经济学课件第十一章博弈论和策略行为.ppt(75页珍藏版)》请在三一办公上搜索。
1、1,第十一章 博弈论和策略行为,2,一、博弈论导论,博弈论(game theory)是由美国数学家冯诺依曼(Von.Neumann)和经济学家摩根斯坦(Morgenstern)于1944年创立的带有方法论性质的学科,它被广泛应用于经济学、人工智能、生物学、火箭工程技术、军事及政治科学等。1994年,三位博弈论专家即数学家纳什(Nash,他的故事被好莱坞拍成电影美丽心灵,该影片获得了2002年奥斯卡金像奖的四项大奖)、经济学家海萨尼(Harsanyi)和泽尔滕(Selten)因在博弈论及其在经济学中的应用研究上所作出巨大贡献而获得诺贝尔经济学奖。,声明:以下部分内容借鉴了重庆大学蒲勇健教授的资料
2、。,3,1996年,两位将博弈论应用于不对称信息下机制设计的经济学家莫里斯(Mirrlees)和维克里(Vickrey)、以及2001年三位经济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞(Spence)因运用博弈论研究信息经济学所取得的成就而成为这两个年度的诺贝尔经济学奖得主。,4,瑞典皇家科学院已决定将2012年度瑞典央行纪念诺贝尔奖授给授予哈佛大学教授埃尔文.罗斯(Alvin E.Roth)及加州大学罗伊德.沙普利(Lloyd S.Shapley)。他们得奖的理由是“以鼓励他们在稳定配置理论及市场设计实践上所作出的贡献”。2012年的诺贝尔经济学奖关注了一个经济
3、学的中心问题:如何尽可能恰当地匹配不同的市场主体。尽管两位研究者的研究是各自独立完成的,但沙普利的基础理论与罗斯的经验性调查一经结合,各类实验和实际设计已经产生出了一个繁荣的研究领域,改善了许多市场的表现。,5,2012年诺贝尔经济学奖获奖点评获奖理论应用性更强 国人民大学经济学院教授郑超愚表示,对于这两位经济学家的获奖有些意外,但对博弈论的获奖不意外。博弈论虽然被划为微观经济学,但对于宏观经济学的指导意义很大。郑超愚认为,获奖理论更多的是看研究问题的方法和思路,打破完美的假设,更加贴近现实,对于指导实际决策尤为重要。博弈论正在受到重视 中国人民大学经济学院教授方福前表示,自上世纪90年代中期
4、以来,诺贝尔奖正倾向于把奖项颁发给应用性更强的领域。获奖的这两位学者所研究的领域是个较为偏的领域,不是主流学科,应该是“机制设计”方面的研究。,6,2012年诺贝尔经济学奖获奖点评国家信息中心预测部世界经济研究室副研究员张茉楠则表示,从1994年诺贝尔经济学奖授予3位博弈论专家开始,共有5届的诺贝尔经济学奖与博弈论的研究有关,分别为:1994年,普林斯顿大学的约翰纳什;1996年,授予英国剑桥大学的詹姆斯莫里斯,而今又是博弈论学派的,说明博弈论很受重视。,7,1957年的纳什(Nash),8,老年纳什,9,美丽心灵的剧照,10,收益矩阵,策略:博弈的参加者所采取的行动方案 收益:策略实行的结果
5、,11,举例:囚徒困境,两嫌犯被警方抓住但未获证据。警方将两人分别置于两间房间分开审讯,每个嫌犯都被告知:若一人承认供但另一人未承认,则承认者只需坐5年牢,未承认者判入狱15年;若二人都承认则两人各判刑5年;若两人都不承认,则因未获证据,两人均释放。,本例中,“承认”与“不承认”,是两策略;被判坐牢年份的负值,是收益。,12,说明,很多人例如纳什习惯于用代数的方法表示博弈,也就是用目标函数、约束条件这样的方式演示和推导。,我们还是用比较形象的“收益矩阵”方式表达。,13,乙(嫌疑犯2)不承认 承认 不承认 甲(嫌疑犯1)承认,收益矩阵,14,尽管甲不知乙是否承认,但他认为自己选“承认”最好,因
6、而甲会选择“承认”,乙也同样会选择“承认”,结果各判5年;但若两人都不承认,结果是两人全被释放,但这种结果是不会出现的。,乙 不承认 承认 不承认甲 承认,15,甲或乙可以作出的选择被称为“策略”,如“承认”或“不承认”都是策略。一方的各种策略,称“策略集”。双方各采用一种策略,搭配起来称“策略组合”。,甲和乙是参与博弈的人,称为“局中人”。表中每一个小方格内的数字被称为局中人的收益(有的翻译为“支付”),其中左边的数字代表甲的收益,右边的是乙的收益。表中的双变量矩阵称为博弈收益矩阵。,乙 不承认 承认 不承认甲 承认,16,另一个说明,局中人的策略,并不总是只有2个,双方的策略也并非总相同。
7、,比如老板和员工,员工的策略集是(跳槽、留下),老板的策略集是(升职、加薪、休假)。,再如老师和学生,老师的策略集是(开卷考试、闭卷考试、多次随堂考试),学生的策略集是(复习、不复习)。,另举一例:夫妻。妻子的策略集是(买衣服、逛街、泡吧),丈夫的策略集是(看球赛、不看球赛)。,17,企业2 价格不变 涨价 价格不变企业1 涨价,从囚徒到竞争企业,18,企业2 价格不变 涨价 价格不变企业1 涨价,企业2 价格不变 涨价 价格不变企业1 涨价,或写为,等等形式,19,商家价格战,出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利,但实际上却是相互杀价,结果都赚不到钱。当一些商家共谋将
8、价格抬高,消费者实际上不用着急,因为商家联合维持高价的垄断行为一般不会持久,可以等待垄断的自身崩溃,价格就会掉下来。2000年我国几家生产彩电的大厂商合谋将彩电价格维持高位,他们搞了一个“彩电厂家价格自律联盟”,并在深圳举行了由多家彩电厂商首脑参加的“彩电厂商自律联盟高峰会议”。,20,当时,国家有关部门还未出台相关的反垄断法律,对于这种在发达国家明显属于违法行为的所谓“自律联盟”,国家在法律上暂时还是无能为力的。寡头厂商在光天化日之下进行价格合谋,并且还通过媒体大肆炒作!但是,尽管政府当时无力制止这种事情,公众也不必担心彩电价格会上涨。这是因为,“彩电厂商自律联盟”只不过是一种“囚徒困境”,
9、彩电价格不会上涨。在高峰会议之后不到二周,国内彩电价格不是上涨而是一路下跌。这是因为厂商们都有这样一种心态:无论其他厂商是否降价,我自己降价是有利于自己的市场份额扩大的。,21,纳什均衡指这样一种策略:使所有局中人都不能再提高收益的状态,如果另一局中人给定策略的话。假定企业2“价格不变”,企业1也“价格不变”,这是企业1根据企业2的行为采取的相应的最佳措施。反之亦然。这就是一个纳什均衡。,纳什均衡,企业均衡:利润最大的稳定状态。,22,纳什均衡是局中人战略选择上构成的一种“僵局”,给定其他局中人的选择不变,任何一个局中人作最好的选择,他也不会改变其战略选择。第10章中的古尔诺双头垄断模型是如何
10、确定的?古尔诺模型的均衡本质上也是一种纳什均衡,每个企业都是根据另一家企业的产量来确定最优产量的,因此都没有再变动产量的驱动。,纳什均衡,23,企业2 价格不变 涨价 价格不变企业1 涨价,纳什均衡,纳什均衡的局限性是:博弈中可能存在不止一个纳什均衡。本例中,(涨价,涨价)也是一个纳什均衡。,对有的博弈来说,也可能不存在纳什均衡。在这种情况下,局中人有可能不断地转换策略。,24,支配性策略,企业2 价格不变 涨价 价格不变企业1 涨价,如果企业1选择策略“价格不变”,则企业2选择“价格不变”。,如果企业1选择策略“涨价”,则企业2仍然选择“价格不变”。,所以企业2的支配性策略是“价格不变”。,
11、10,-30,30,25,支配性策略:不取决于其他局中人策略便可自我决定的最佳策略。又称“占优策略”,相对的策略称“劣策略”。,比较本例与上例的数字差异,25,支配性策略,企业2 价格不变 涨价 价格不变企业1 涨价,如果企业2选“价格不变”时,企业1应选“价格不变”。,如果企业2选“涨价”时,企业1应选“涨价”。,所以企业1没有固定的支配性策略。,26,支配性策略,企业2 价格不变 涨价 价格不变企业1 涨价,如果某一局中人有支配性策略,博弈总会有一个纳什均衡。本例中,局中人2 的支配性策略是“价格不变”,那么相应地,局中人1也要选择“价格不变”。因此,(价格不变,价格不变)就成为一个纳什均
12、衡。博弈的最终结果,取决于首先采取什么行动。,27,防守策略 拦截带球 撤回线卫 突袭 带球进攻策略 传球,被支配策略,进攻方收益,防守方的被支配策略(劣策略)为“突袭”。只要存在被支配策略,收益矩阵就可以简化(删除列)。,28,防守策略 拦截带球 撤回线卫 突袭 带球进攻策略 传球,进攻方收益,10,7,8,14,6,2,转到进攻方角度有没有劣策略?进攻方的被支配策略(劣策略)为“带球”。收益矩阵就又可以简化(删除行)。,29,防守策略 拦截带球 撤回线卫 突袭 带球进攻策略 传球,进攻方收益,10,7,8,14,6,2,再一次转到防守方角度有没有劣策略?防守方的被支配策略(劣策略)为“拦截
13、带球”。收益矩阵就又可以简化(删除列)。,30,防守策略 拦截带球 撤回线卫 突袭 带球进攻策略 传球,进攻方收益,10,7,8,14,6,2,最后,收益矩阵只剩下一个策略组合、一个收益(组合)。这就是纳什均衡解。,31,拦截带球,撤回线卫,突袭,带球,传球,进攻方收益,防守方,进攻方,下面分解一下步骤,32,拦截带球,撤回线卫,突袭,带球,传球,进攻方收益,防守方,进攻方,考虑:此时,进攻方呢?,33,7,8,6,2,拦截带球,撤回线卫,带球,传球,进攻方收益,防守方,进攻方,考虑:此时,防守方呢?,34,7,8,拦截带球,撤回线卫,传球,进攻方收益,防守方,进攻方,35,7,撤回线卫,传球
14、,进攻方收益,防守方,进攻方,36,总结:纳什均衡的解法步骤,考察哪一局中人有支配性策略,删除其相对的劣策略。交换角色,逐步删除劣策略对应的行或列。直至得到纳什均衡,或者,停留,无纳什均衡解。,37,企业2 价格不变 涨价 价格不变企业1 涨价,根据上述分析,企业1没有占优策略。,企业2占优策略为“价格不变”,可以先删除劣策略涨价一列。,再看企业1,此时占优策略为“价格不变”,可以将第二行涨价删除。,最后,博弈唯一纳什均衡为(价格不变,价格不变)。,看上面这个例子,P298,练习题4,先做(2),并加一个问题(3)此博弈有无纳什均衡?若有,是什么?5分钟,38,最大最小策略,风险厌恶型策略:在
15、可能的最坏结果中得到最好的结果maxmin,无新产品,有新产品,无新产品,有新产品,企业2,企业1,企业1最小,3,2,企业2最小,3,2,第一行,第一列,策略结果:双方均“无新产品”。这是一种避免损失过多的选择。,P298,练习题4,做(1),5分钟。,39,混合策略,小孩玩的游戏“石头,剪子,布”,也是一种博弈。但是,这个博弈有一种有趣的特征,即给定一方的任何选择,另一方都有制胜对方的策略,所以,给定一方任何一个策略,对方都有制胜这个策略的策略,因而这个策略不是最优的。任何“纯策略”都不是最优的,纯策略是“石头,剪子,布”中的任何一个。但是,我们知道,玩这个游戏是总是以对方不易猜出的随机方
16、式出招。事实上,可以通过数学证明,当双方都以每个策略按1/3的概率出招时,达成一种双方都不愿改变这种概率分布的局面。这被称为“混合策略纳什均衡”,而这种以随机方式选择纯战略的博弈被称为“混合策略博弈”。,40,投球手 投快速球 投曲线球 预期是快速球击球手 预期是曲线球,40%,20%,20%,40%,击中的百分数,如果击球手对快速球的预期是50%,对曲线球的预期也是50%,投球手以50%概率投快速球,也以50%概率投出曲线球,则击中的预期为:(40%+20%+20%+40%)/4=0.30 40%*0.25+20%*0.25+20%*0.25+40%*0.25=0.30四种预期投中的百分数机
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中科大 管理 经济学 课件 第十一 博弈论 策略 行为

链接地址:https://www.31ppt.com/p-5909953.html