《决策分析》PPT课件.ppt
第10章 决策分析,(Decision making analysis),决策的基本概念,不确定型决策,风险决策,效用理论在决策中的应用,决策树,灵敏度分析,10.1决策的基本概念,10.1.1 决策问题的三要素,(1)状态集。把决策的对象称为一个系统,系统所处的不同情况称为状态,将其数量化后得到状态变量。所有状态构成的集合称为状态集,记为,其中 si 是第 i 种状态的状态变量;表示各种状态出现的概率,其中 p(si)表示第 i 种状态 si(i=1,2,m)发生的概率。,(2)决策集。为达到某种目的而选择的行动方案称为方案;将其数量化后称为决策变量,记为 a。决策变量的集合称为决策集()。,(3)效益函数。定义在 的一个二元函数 R(ai,sj),它表示在状态 sj出现时,决策者采取方案 ai 所得到的收益或损失值,即称为效益。对所有的状态和所有可能的方案所对应效益的全体构成的集合称为效益函数,记为。,一般地,决策模型记为,10.1.2 决策的分类,按照决策的环境分类 确定型决策风险型决策不确定型决策,按照决策的重要性分类 战略决策策略决策执行决策,按决策的结构分类 程序决策非程序决策,按决策过程的连续性分类 单项决策序贯决策,按决策目标的个数分类单目标决策多目标决策按照目标函数的形式分类显式决策隐式决策,10.1.3 决策过程,构造人们决策行为的模型主要有两种方法面向决策结果的方法若决策者能正确地预见到决策结果,其核心是决策的结果和正确的预测。通常的单目标和多目标决策属此类型。面向决策过程的方法若决策者了解了决策过程,掌握了过程和能控制过程,它就能正确地预见决策的结果。,实际中的决策问题整个过程分为下列的步骤:(1)明确问题(2)确定目标(3)制定方案(4)方案评估(5)选择方案(6)组织实施(7)反馈调整,任何决策问题都有以下要素构成决策模型。(1)决策者,他的任务是进行决策(2)可供选择的方案(替代方案)、行动或策略(3)准则(4)事件(5)每一事件的发生将会产生的某种结果(6)决策者的价值观,10.2 不确定型决策,不确定型决策是指决策者对决策环境情况一无所知,即决策环境是不确定的,决策的效益也是不确定的,甚至对各种可能的方案发生的概率也是未知的。决策者只能根据自己的主观倾向进行判断,按照一定的准则作出选择决策。,构成不确定型决策的基本条件(1)存在着决策者希望达到的目标(利益最大或损失最小);(2)存在着两个以上的行动方案供决策者选择;(3)存在着两个以上的自然状态;(4)可以计算不同行动方案在不同自然状态下的相应损益值。,由于决策者的主观态度的差异,则一般可遵守的准则也不相同,基本可以分为五种:悲观决策准则、乐观决策准则、等可能性决策准则、最小机会损失决策准则和折中决策准则。,10.2.1 悲观(max min)决策准则,悲观决策方法的基本步骤(1)在效益矩阵(效益函数)中,从每一种策略所对应的各行动方案的效益中选出最小值;(2)从各策略的最小值中选出最大值,以此对应的策略作为问题的决策策略。即取所对应的策略为悲观决策准则下的最优策略。,例10.1 设某工厂按批生产某产品并按批销售。产品的成本为30元/件,批发价格为35元/件。若每月生产的产品当月销售不完,则每件损失1元。工厂每投产一批是10件,最大月生产能力为40件。决策者可选择的生产方案为0、10、20、30、40五种。假设决策者对其产品的需求情况一无所知,试问这时决策者应如何决策?,解:此问题可用决策矩阵来描述。决策者可选的行动方案有5种,这时他的策略集合,记作。销售情况有5种,即销售量分别为0,10,20,30,40,但不知道它们发生的概率,这就是事件集合,记作。每个“决策-事件”对都可以计算出相应的收益值或损失值(记作 aij)。例如,当选择月产量为20件,而销售量为10件时的收益额为 10*(35-30)-1*(20-10)=40(元)。计算出所有的,并将这些数据汇总在矩阵中,如表10-1所示。,表10-1,根据max min准则,在收益矩阵中先从各策略所对应的可能发生的“策略事件”对的结果中选出最小值,将它们列在表的最右列;再从此列的数值中选出最大者,以它对应的策略为决策者应选的决策策略。计算见表10-2。,表10-2,根据max min准则有 max(0,-10,-20,-30,-40)=0,它所对应的策略为 S1,即S1为决策者的应选策略。在这里是“什么也不生产”,在实际中表示先看一看,以后再做决定。,10.2.2 乐观(max max)决策准则,乐观决策方法的基本步骤(1)从每一策略所对应的各行动方案的效益中选出最大值;(2)从各策略的最大值中选出最大值。乐观决策准则又称为“最大最大准则”,用符号“max max”表示。以此对应的策略作为问题的决策策略,即取所对应的策略为乐观决策准则下的最优策略。,例10.2 采用max max决策准则,对例10.1进行决策。解:根据max max决策准则的基本步骤,决策过程列于表10-3。它所对应的策略为 S5,即采用乐观决策准则进行决策的决策者将采用生产 40 件的策略进行生产。,表10-3,10.2.3 等可能性(Laplace)决策准则,假设问题的事件(状态)集合中,各事件发生的概率是均等的,由此确定出最佳的决策。即当决策者面对问题的事件集合中的各事件不能确定一个事件的发生比其他事件的发生机会多的时候,就可以假设各事件发生的概率是均等的。如果事件集中共有n个事件,即事件集合为,则每一个事件 si 发生的概率为 pi=1/n。由此可以计算出各种状态下效益的期望值,然后在所有可能策略的期望值中选择最大者,即 所对应的策略为等可能性决策准则下的最优策略。,例10.3 采用Laplace决策准则对例10.1进行决策。解:根据Laplace决策准则的基本步骤,计算结果列在表10-4的最右列。在本例中 p=1/5,从表10-4可以看出,按照Laplace决策准则进行决策,策略 s5 为决策策略,即每月生产40件。,表10-4,10.2.4 最小机会损失决策准则,最小机会损失决策准则亦称为最小遗憾值决策准则或savage决策准则,是在将由于策略的选择所造成的损失机会控制在最小的前提下来追求最大效益,由此确定相应的决策策略。其步骤是:(1)将效益矩阵 A 中的各元素转换为每一策略下各事件(状态)的发生的机会所造成的损失值。其具体的含义是:当某一事件发生后,由于决策者没有选用效益最大的策略而造成的损失值。譬如,如果第k个事件 sk 发生,相应各策略的效益为 aik(i=1,2,m),其中最大值为,此时各策略的机会损失值为(2)从所有最大机会损失值中选取最小者,即取所对应的策略为最小机会损失决策准则下的最优策略。,例10.4 采用最小机会损失决策准则对例10.1进行决策。解:计算结果如表10-5所示。策略 s5 为决策策略,即每月生产40件。,表10-5,10.2.5 折中主义准则,在某些情况下,对有些决策者来说,可能会觉得悲观决策准则和乐观决策准则都太极端了。于是就可把二者综合起来考虑,则可以取在这种决策准则下的最佳效益值的凸组合作为决策策略的效益值,即取乐观决策系数为,对于每一个策略 si,令则所对应的策略即为折中决策准则下的最优策略。,例10.5 采用折中主义准则求解例10.1。解:设=1/3,计算得到 bi 的列在表10-6的右端。从表10-6看出,按照折中主义准则,策略 s5 仍为决策策略,即每月生产40件。,表10-6,10.3 风险决策,风险决策是指决策者对客观情况不甚了解,但对将发生各事件的概率是已知的。决策者往往通过调查,根据过去的经验或主观估计等途径获得这些概率。在风险决策中一般采用期望值作为决策准则,常用的有最大期望收益准则和最小机会损失决策准则。,10.3.1 最大期望效益决策准则(expected monetary value,EMV),决策矩阵的各元素代表“策略(Si)事件(Ej)”对的收益值(aij),各事件发生的概率为 pj。采用EMV决策准则进行决策的步骤为,(1)计算各策略的期望收益值(2)从这些期望收益值中选取最大者,它所对应的策略为决策应选策略。即,例10.6 以例1的数据采用EMV决策准则进行决策。解:计算的结果见表10-7。这时即选择策略=30。,表10-7,EMV决策准则适用于一次决策多次重复进行生产的情况,它是平均意义下的最大收益。,10.3.2 最小机会损失决策准则(expected opportunity loss,EOL),决策矩阵的各元素代表“策略(Si)事件(Ej)”对的收益值(aij),各事件发生的概率为 pj。采用EOL决策准则进行决策的步骤为,(1)计算各策略的期望损失值。,(2)从这些期望损失值中选取最小者,它对应的策略应是决策者所选策略。即,表上运算与EMV相似。,10.3.3 EMV与EOL决策准则的关系,从本质上讲EMV与EOL决策准则是一样的。设 aij 为决策矩阵的收益值。因为当发生的事件的所需量等于所选策略的生产量时,收益值最大,即在收益矩阵的对角线上的值都是其所在列中的最大者。于是机会损失矩阵可通过以下求得,见表10-8。,表10-8,第 i 策略的机会损失,故当EMV为最大时EOL便为最小。所以在决策时用这两个决策准则所得结果是相同的。,10.3.4 全情报的价值(EVPI)当决策者耗费了一定经费进行调研,获得了各事件发生概率的信息,应采用“随机应变”的战术。这时所得的期望收益称为全情报的期望收益,记作EPPL。此收益应当大于至少等于最大期望收益,即EPPL EMV*。则EPPL一EMV*EVPI称为对全情报的价值。这就是说明获取情报的费用不能超过EVPI值,否则就没有增加收入。实际应用时考虑费用构成很复杂,这里仅说明全情报价值的概念和其意义。,教材习题10.2 某地方书店希望订购最新出版的好的图书。根据以往经验,新书的销售量可能为50,100,150或200本。假定每本新书的订购价为4元,销售价为6元,剩书的处理价为每本2元。要求:(1)建立损益矩阵;(2)分别用悲观法、乐观法及等可能法决定该书店应订购的新书数字;(3)建立后悔矩阵,并用后悔值法决定书店应订购的新书数;,(4)如果书店据以往统计资料预计新书销售量的规律如下表所示。,分别用期望值法和后悔值法决定订购数量;(5)如果某市场调查部门能帮助书店调查销售量的确切数字,该书店愿意付出多大的调查费用?,解:(1)损益矩阵,(2)悲观法:S1,乐观法:S4,等可能法:S2或S3。(3)后悔矩阵,故按后悔值法决策为S2或S3。(4)按期望值法和后悔值法决策,书店订购新书的数量均为100本。(5)如书店能知道确切销售数字,则可能获得的最大利润为100*0.2+200*0.4+300*0.3+400*0.1=230元由于不确切知道每种新书销售数量,期望可获取利润为160元(根据EMV法求得),230-160=70元就是该书店愿意付出的最大调查费用。,10.3.5 主观概率,风险决策时决策者要估计各事件出现的概率,而许多决策问题的概率不能通过随机试验去确定,根本无法进行重复试验,只能由决策者根据他对这事件的了解去确定。这样确定的概率反映了决策者对事件出现的信念程度,称为主观概率。,确定主观概率时,一般采用专家估计法。,1、直接估计法直接估计法是要求参加估计者直接给出概率的估计方法。例如推荐三名大学生考研究生时,请五位任课教师估计他们谁得第一的概率。若各任课教师作出如下的估计,见表10-9。由表10-9的末行得到学生1的概率是0.47,他是最高者。,表10-9,2、间接估计法参加估计者通过排队或相互比较等间接途径给出概率的估计方法。例如估计五个球队比赛谁得第一的问题,请十名专家作出估计,每位都给出一个优胜顺序的排列名单,排队名单汇总在表10-10。,分别从表10-10查得每队被排的名次的次数,如A1所处各名次的意见为:qj 次数 评定权数1 1 w4=0.72 3 w2=0.8,w7=0.7,w9=0.73 2 w1=0.7,w5=0.94 4 w10=0.8,w3=0.6,w6=0.8,w8=0.95 0,然后计算加权平均数,采用同样方法得到,w(A2)=2.26,w(A3)=3.43,w(A4)=4.56,w(A5)=1.78,这就可以按此加权平均数给出各队的估计名次,即,10.5 决策树,描述序列决策的一个有效工具是决策树,图10-2是决策树的一般结构图。利用决策树进行决策的方法称为决策树法。,图10-2 决策树,决策树中的基本符号:口决策点,从它引出的分支叫方案分支,分支数反映可能的行动方案数;机会节点,从它引出的分支,叫事件分支或概率分支,每条分支上写明自然状态及其出现的概率,分支数反映可能的自然状态数;结果节点,它旁边的数值是每个方案在相应的自然状态下的效益值。机会节点上方的数字是各机会或方案的期望值,在决策点,经过比较将期望值最大的一支保留,其他各支去掉,称为剪枝。最后决策点上方的数字就是最优方案的期望值。,绘制决策树时应注意的几个问题:(1)要确定决策分析的时间段。这个时间段应当保证能够计算出决策的结果。(2)确定当前要做出的决策和所有可能的备选方案。要注意各备选方案之间是不相容的,而且在所选的时间段内能够评价其结果。(3)确定所有的机会点,并列举直接影响决策后果的各种事件(自然状态)。要注意各事件之间是互不相容的,其中一个事件发生,其他事件就不可能发生,且各事件发生概率的总和为1。(4)确定在当前要做的决策之后还可能进行的决策,以及与任何插进来的事件相关的决策。把每一个即将要做的决策与当前要做的决策重复(3)、(4)两步,直到所有机会点和决策点都被确定后为止。,例10.10 为生产某种产品,设计了两个基建方案:一是建大厂,二是建小厂。大厂需要投资300万元,小厂需要投资160万元,两者的使用期都是10年。估计在此期间,产品销路好的可能性是0.7,两个方案的年度益损值如表10-17所示。,表10-17 单位:万元,解:(1)画决策树(图10-3)(2)计算各点的益损期望值:点2:0.7*100*10年0.3*(-20)*10年-300(大厂投资)=340(万元)点3:0.7*40*10年0.3*10*10年-160(小厂投资)=150(万元)两者比较,建大厂的方案是合理的。,图10-3 决策树,例10.11 假定对例10.10分为前三年和后七年两期考虑。根据市场预测,前三年销路好的概率为0.7,而如果前三年的销路好,则后七年销路好的概率为0.9,如果前三年的销路差,则后七年的效率肯定差,在这种情况下,建大厂和建小厂哪个方案好?解:(1)画出决策图,如图10-4所示。,(2)计算各点的益损期望值点4:0.9*100*7(年)+0.1*(-20)*7(年)616点5:1.0*(-20)*7(年)=-140点6:0.9*40*7(年)0.1*10*7(年)=259点7:1.0*10*7(年)=70点2:0.7*100*3(年)0.7*616 0.3*(-20)*3(年)+0.3*(-140)300(大厂投资)=281(万元)依同理可以计算点3:0.7*40*3(年)+0.7*259+0.3*10*3(年)+0.3*70 160(投资)=135(万元)通过比较,建大厂仍然是合理方案。,例10.12 就例10.11而言,再考虑一种情况。即先建设小工厂,如销路好,则三年以后考虑扩建。扩建投资需要140万元,扩建后可使用七年,每年的益损值与大厂相同。这个方案与建大厂方案比较,优劣如何?解:(1)画出决策树如图10-5所示。,(2)计算各点的益损期望值。点2:同图10-4一样,建大厂方案的益损期望值为281万元。点6:0.9*100*7(年)+0.1*(-20)*7(年)-140(扩建投资)=476 点7:0.9*40*7(年)+0.1*10*7(年)=259因476259,说明扩建方案较好。划掉不扩建方案,将点6的476转移到点4。点5:1.0*10*7(年)=70 点3:0.7*40*3(年)+0.7*476+0.3*10*3(年)+0.3*70-160(小厂投资)=287(万元)。将点2与点3比较,287281,所以,三年以后扩建比建大厂优越。,例10.13 某研究所考虑向某工厂提出开发新产品的建议,为提出此建议需进行一些初步的科研工作,需花费2万元。根据该所的经验及对该工厂和产品及竞争者的估计,建议提出后,估计有60%的可能可以得到合同,40%的可能得不到。如得不到合同则2万元的费用就得不到赔偿。该产品有两种生产方法,老方法要花费28万元,成功概率为80%,新方法只需要花费18万元,但成功率仅有50%。如果该研究所得到合同并研制成功,厂方将付给该所70万元技术转让费,若研制失败,该所需支付赔偿费15万元。试问该所是否应当提出研制建议?,解:这是一个多级(两级)决策问题,决策树如图10-6所示,在这个树的分支终端F,G,H,I,J,K处注上各种情况相应的益损值,这里是从后向前推算。整个决策过程也是从后向前。对于H端相应的情况是:如果研究所提出了开发建议,得到了合同,采用旧方法生产,获得了成功。在这种情况下,研究所得到了厂方70万元的报酬,要减去研制费28万元和提建议费用2万元,益损值(即净收入)为70-28-240(万元),将此值记在图的H点处。同理,可以算出其他各点的损益值,如图10-6所示。,计算D,E两处的期望值 D点:40*0.8-45*0.223(万元)E点:50*0.5 35*0.5=7.5(万元)即用旧方法生产的益损平均值为23万元,用新方法为7.5万元。如果采用益损值的大小作为决策准则,那么,在决策点C处应采取旧方法的行动方案,因此在C点的益损值便与D点相同,在C点上方注明23。接下去便可以计算B点的益损期望值 23*0.6 2*0.413(万元)这就是说,从决策点A出发,如提出建议可获益损值为13万元,如果不提出,益损值为0。结论:应提出建议。,10.6 灵敏度分析,现实中需要分析为决策所用的数据可在多大范围内变动,原最优决策方案继续有效,进行这种分析称为灵敏度分析。,例 假设有外表完全相同的木盒100只,将其分为两组,一组内装白球,有70盒,另一组内装黑球,有30盒。现从这100盒中任取一盒,请你猜,如这盒内装的是白球,猜对了得500分,猜错了罚200分;如这盒内装的是黑球,猜对了得1000分,猜错了罚150分。有关数据列于下表。(1)为使期望得分最多,应选哪一种方案?(2)试求出猜白和猜黑的转折概率。,解:(1)先画出决策树,见下图,计算各方案的期望值。“猜白”的期望值为 0.7*500+0.3*(-200)=290“猜黑”的期望值为 0.7*(-150)+0.3*1000=195经比较可知“猜白”方案是最优的。,(2)设p为出现白球的概率,(1-p)为出现黑球的概率。当这两个方案的期望值相等时,即p*500+(1-p)*(-200)=p*(-150)+(1-p)*1000求得p=0.6486,称它为转折概率。即当p0.6486,猜白是最优方案;当p0.6486,猜黑是最优方案。,若这些数据在某允许范围内变动,而最优方案保持不变,这方案就是比较稳定的。反之,这些数据在某允许范围内稍加变动,则最优方案就有变化,这方案就是不稳定的。由此可以得出那些非常敏感的变量,那些不太敏感的变量,以及最优方案不变条件下,这些变量允许变化的范围。,例10.14某公司计划通过它的销售网推销一种商品,计划零售价为每件10元。对该商品有三个设计方案:方案I需一次投资10万元,投产后每件成本5元;方案II需一次投资16万元,投产后每件成本4元;方案III需一次投资25万元,投产后每件成本3元。该种商品需求量不确切,但估计有三种可能,E13万件、E212万件、E320万件。该公司负责人预测三种需求量的概率分别为0.15、0.75、0.10。(1)用期望值法决定该公司应采用哪一个设计方案;(2)进行灵敏度分析,确定用期望值法决策时的转折概率。,解:先画出该问题的决策树,如图10-7所示。,(1)利用期望值法分别计算三种方案的期望收益:方案I:E(I)=(10-5)*(0.15*3+0.75*12+0.10*20)-10=47.25(万元)方案II:E(II)=(10-4)*(0.15*3+0.75*12+0.10*20)-16=52.7(万元)方案III:E(III)=(10-3)*(0.15*3+0.75*12+0.10*20)-25=55.15(万元)所以,按期望值法应该选方案III;,(2)当 E1 概率不变时,E(I)=5*0.15*3+P(E2)*12+(1-0.15-P(E2)*20-10=77.25-40P(E2)E(II)=6*0.15*3+P(E2)*12+(1-0.15-P(E2)*20-16=88.7-48P(E2)E(III)=7*0.15*3+P(E2)*12+(1-0.15-P(E2)*20-25=97.15-56P(E2)由于P(E2)0E(III)-E(I)=19.9-16P(E2)0因此不管 E2 和 E3 概率如何变化,最优决策仍为方案III;同理,通过计算可得,当 E2 概率不变时,不管 E1 和 E3 概率如何变化,最优决策仍为方案III;,当 E3 概率不变时,有经比较可知,当P(E1)0.756 时选方案I。所以,P(E1)=0.756 为选择方案I或II的转折概率,P(E1)=0.422 为选择方案II或III的转折概率。,E(I)=5*3*P(E1)+12*(0.9-P(E1)+0.1*20-10=54-45P(E1)E(II)=6*3*P(E1)+12*(0.9-P(E1)+0.1*20-16=60.8-54P(E1)E(III)=7*3*P(E1)+12*(0.9-P(E1)+0.1*20-25=64.6-63P(E1)令E(I)=E(II),得P(E1)=0.756令E(I)=E(III),得P(E1)=0.589令E(II)=E(III),得P(E1)=0.422,