《对策论基础》PPT课件.ppt
《《对策论基础》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《对策论基础》PPT课件.ppt(82页珍藏版)》请在三一办公上搜索。
1、第十四章 对策论基础,概论基本概念与名词对策分类矩阵对策的基本理论矩阵对策的数学模型最优纯策略混合策略与混合扩充,第十四章 对策论基础,竞争无处不在,体育比赛、军事斗争、商业谈判、市场争夺、职位竞聘。为了在竞争中谋取最大利益,必须采取对抗其他竞争者的策略,这就是对策问题。研究竞争场合下决策者采取对策的理论与方法,称为对策论,又称为博弈论。我国古代就有著名的“齐王赛马”例子。,第一节 概论,基本概念与名词对策分类,对策现象的三个基本要素,1.局中人:在竞争中,拥有决策权的参与者,可以是个人,也可以是团体。桥牌,象棋;2.策略:可供局中人选择对付其他局中人行动方案称为一个策略。该方案必须是自始至终
2、通盘筹划的行动方案。例子。“当头炮”不是一个策略,而是某一个策略的组成部分。3.一局对策的得失:一局对策结束后,对每个局中人来说,不外乎胜利和失败,或其它收入,这些统称为“得失”.,对策现象的三个基本要素,4.策略集:一个局中人所拥有的策略全体。5.局势:各局中人使用一定的对策,从而形成了一种状态称为局势。6.支付函数:局中人不同的策略,会有不同的得失,故”得失”是策略组合的结果;即一局对策结束时,每个局中人的“得失”是全体局中人所取定的一组策略的函数,称为“支付函数”.,一、基本概念与名词,7.零和对策:如果在任一“局势”中,全体局中人的“得失”相加总是等于0时,这个对策就称为零和对策。上述
3、赛马就是零和对策。否则称为非零和对策8.矩阵对策:参加对策的局中人只有二人,而每个局中人可选策略只有有限个,每局的得失之和为零.,二、对策分类,对策,静态对策,动态对策,结盟对策,不结盟对策,微分对策,联合对策,合作对策,三、博弈论发展史,1944年,von Neumann and Oskar Morgenstern发表专著 The Theory of Games and Economic Behavior创立了博弈论1950,1951年,纳什(Nash)和图克(Tucker)奠定了非合作博弈论的基础1965年,泽尔腾(Selten)将动态分析引入纳什平衡,建立了精炼纳什平衡1967,1968
4、年,海萨尼(Harsanyi)将不完全信息引入博弈论,三、博弈论发展史,1982年,克瑞普斯(Kreps)和威尔逊(Wilson)发表了动态不完全信息博弈的重要文章,建立了动态不完全信息博弈的理论上世纪八十年代开始,博弈论进入经济学,进而在管理学中得到了很好的应用;九十年代,经济学教科书中加入了博弈论1994年,Nash,Selten&Harsanyi三人获得了诺贝尔经济学奖,博弈论的地位正式确立。恰逢Von Neumann and Morgenstern建立博弈论50周年。,三、博弈论发展史,1994-1996年美国国会授权联邦通讯委员会(FCC)公开拍卖部分用于个人通讯服务(PCS)的无线
5、电频段,FCC接受博弈论专家的设计,采用多回合的竞买者同时出价的增价模式,取得了巨大的成功。博弈论开始为企业界所接受并走向实用。1999-2001年美国先后出版了小说美丽的心灵和拍成了电影美丽的心灵,并获奥斯卡奖。纳什和博弈论妇孺皆知。,第二节 矩阵对策的基本理论,矩阵对策的数学模型最优纯策略混合策略与混合扩充,一、矩阵对策的数学模型,以齐王赛马为例说明齐王赛马二人非合作零和对策局中人齐王和田忌策略 上 中下三种等级的马的组合,比三次,有六组策略:(上,中,下)、(中,上,下)、(上,下,中)、(中,下,上)、(下,上,中)、(下,中,上)对齐王,这六组策略用 表示,对田忌,则用 表示。,四、
6、博弈论的典型例子,齐王赛马支付函数,(上中下)(上下中)(中上下)(中下上)(下中上)(下上中),田 忌,(上中下),(上下中),(中上下),(中下上),(下中上),(下上中),齐王,策略组合的得失:齐王赛马赢得矩阵A,(上中下)(上下中)齐(中上下)王(中下上)(下中上)(下上中),田 忌,(上中下)(上下中)齐(中上下)王(中下上)(下中上)(下上中),田 忌,当齐王从S1中选定一个策略ai,田忌从S2挑选一个策略bj应对,那么双方就形成了一个局势(ai,bj),称为纯局势.ai,bj称为纯策略.,对策的数学表示,齐王,田忌赛马的模型可表示为:其中I、II表示两个局中人,S1、S2分别表示
7、局中人I、II的策略集,A则表示赢得矩阵:,2.最优纯策略,现有一矩阵对策其中,从最坏处着想,去争取最好的结果-即最优纯策略。对局中人甲来说,所有最坏的结果是(取A中每一行的最小):得-8,2,-10,-3,在这些最坏的情况中最好的结果是2,因此,无论局中人乙采取什么策略,局中甲只要选a2参加对策,就能保证收入不会小于2。对局中人乙来说,所有最坏的结果是(取A中每一列的最大元素,损失最大):9,2,6,在这些最坏的情况中最好的结果是2,因此,无论局中人甲采取什么策略,局中乙只要选B2参加对策,就能保证损失(支出)不会大于2。那么,此时,局中人甲和乙的最坏情况下的最好结果的绝对值相等(都是2),
8、那么我们就称a2为局中人甲的最优策略,B2就称为局中人乙的最优策略。(a2,B2)就称为对策模型G=S1,S2,A的最优局势,而局中人甲的赢得值2称为对策G的值;,例:甲乙乒乓球队进行团体对抗赛,每队由三名球员组成,双方都可排成三种不同的阵容,每一种阵容可以看成一种策略,双方各选一种策略参赛.比赛共三局,规定每局胜者得1分,输者得-1分.甲队的策略集为S1=a1,a2,a3;乙队的策略集S2=B1,B2,B3。根据以往比赛得分资料,可得甲队的赢得矩阵为A:,1 2 3,1 2 3,A=,试问这次比赛各队应采用哪种阵容上场最为稳妥?,上述描述可表示为:G=甲,乙;S1,S2;A;G=S1,S2;
9、A题中所谓的稳妥,是指不求得分最多,期望失分最少;由于A是甲队的赢得矩阵(得分矩阵),因此,甲队失分最少,意味着有最基本的得分底线(最少应得分).甲队采用策略1,可得分min=1,max=12,可得分min=-3,max=13,可得分min=-1,max=3很显然,甲队有保底得分:max1,-3,-1=1只要采用策略1即可实现.,1 2 3,1 2 3,A=,从乙队角度看,采用以下策略的最少赢得(即A中最大):1,失分3,1,2,失分1,-1,3,失分3,-3,为稳妥起见,乙队应从失分中挑选最小的.即采用策略2,无论甲队怎样布阵,乙队最多失1分.总结上述可知,在上述对策中,甲队采用策略1,乙队
10、采用策略2,可获取自己所需要的最底线.称(1,2)为局中人甲队,乙队的最优策略。,1 2 3,1 2 3,A=,在一个对策G中,局中双方要获得最优纯策略,必须满足一定的条件,,1 2 3,1 2 3,A=,得分方:正方,失分方:反方,例子1,B1 2 3,12 3,3 1 3,1-3-1,Min3,1,3=1,Max:1,理智行为,各列最大(Max):,A=,各行最小(Min),例子2,采购博弈二人非合作零和博弈局中人采购员和气候策略 气候:偏暖、正常、偏冷;采购员购煤:10、15、20吨支付函数秋天购买价格为10元/吨,冬天再购买价格是10元/吨(偏暖)、15元/吨(正常)、20元/吨(偏冷
11、)吨。假设不知天气预报,问:秋天应贮存多少吨煤能使单位的支出最少?,气候 偏暖 正常 偏冷,10采购员 15 20,MAX:,MIN,Min:-200,MAX:-200,例子2,气候 偏暖 正常 偏冷,采 10购 15员 20,MAX:,MIN,Min:-200,MAX:-200,秋季采购,最优纯策略的表述,设对于矩阵对策G:G=S1,S2,A等式成立,记其值为VG,则称VG 为对策G的值。如果纯局势 使 则称 为对策G的鞍点,也称为对策G的在纯策略中的解(矩阵对策的最优解),分别是局中人I、II的最优纯策略。,练习:1.设对策G=S1,S2,A,其中,A=,S1=a1,a2,a3,a4,S2
12、=B1,B2,B3求对策G的鞍点和对策值,及局中人的最优策略,VG=2,(a2,B2),MAXMIN=5,练习:2.设对策=S1,S2,A,其中,A=,S1=a1,a2,S2=B1,B2求局中人的最优策略和对策值,MAXMIN=0MINMAX=1,不相等,无解,练习:3.设对策=S1,S2,A,其中,A=,S1=a1,a2,a3,a4,S2=B1,B2,B3,B4求局中人的最优策略和对策值,VG=5,(a1,B2),(a3,B4)(a1,B4),(a3,B2)MAXMIN=5,定理1:矩阵对策G=S1,S2,A有纯策略解的充要条件是存在一个纯局势 使得,或赢得矩阵满足条件:,证明略.,3、混合
13、策略与混合扩充,基本概念:当时不存在最优纯策略,此时需要应用混合策略的方法确定参加对策的纯策略。例如,分析上述例子,因为所以从 看,最优策略是甲选a2,乙选B2,但从 看,甲应选a1,乙选B2两个局人没有稳妥的策略,此时,这时就得估计选取各个策略可能性的大小来进行对策.即就是用多大概率选取各个纯策略.这样局中人不能单独地使用某一个策略,只好结合不同概率分布以使甲(乙)平均赢得(损失)最多(最少),为标准来选取策略,这种策略称之为混合策略.,分析上述例子,因为所以此时假设局中人I以概率x选取策略a1,以概率(1-x)选取策略a2;局中人II以概率y选取策略B1,以概率(1-y)选取策略B2。则对
14、于局中人I来说,赢得的期望值为E(x,y),它等于,例子引出混合策略,赢得期望值当X=1/2在x=1/2,y=1/4时,赢得函数取得最优值5/2。这实际上是对策双方都满意的结果。我们把纯策略对应的概率向量叫做混合策略,最优解则是最优混合策略。本例中,最优混合策略是(1/2,1/2)和(1/4,3/4)。,混合策略的定义,令纯策略集对应的概率向量是它们满足定义:为局中人甲的赢得,-E(X,Y)为局中人乙的赢得.,混合策略的定义,局中人甲,乙的混合策略的集合为:将 叫做G=S1,S2,A的混合扩充。,最优混合策略的定义,若令并有则称(X*,Y*)为最优混合局势,或叫做G在混合策略下的解,V叫做对策
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 对策论基础 策论 基础 PPT 课件

链接地址:https://www.31ppt.com/p-5496795.html