运筹学第八章决策分析.ppt
1,第八章 决策分析,8-1 决策的基本概念与决策程序8-2 不确定型决策问题8-3 风险型决策问题8-4 效用理论,2,8-1 决策的基本概念与决策程序,决策的基本概念例11-1 某厂要确定下一计划期内产品的生产批量,根据统计资料预测,市场销售可能出现好、一般、差三种情况,概率分别为0.3、0.5和0.2。该厂有大批量生产和小批量生产两个方案,各方案在各种市场销售情况下的损益见表。试通过决策分析,确定合理批量,使工厂获利最大。,3,1、事件。例子中“销路好”、“一般”和“差”,是三个事件,这是决策者无法控制的因素我们用 表示第 个事件。2、策略。策略是决策者可以采取的行动方案,完全由决策者决定“大批量生产”、“小批量生产”,是两种可供选择的行动方案用 表示第 个策略。3、收益值。收益值即不同策略在不同事件下的效益值是策略和事件的函数。4、事件的概率。用 表示与事件 相对应的概率事件的概率,可分为客观概率和主观概率两种。5、决策的分类。决策按内容和层次,可分为战略决策和战术决策;按重复程度,可分为程序决策和非程序决策;按问题性质和条件,可分为确定型、不确定型、风险型和竞争型决策。,4,决策的程序,5,8-2 不确定型决策问题,不确定型决策问题应具有以下几个条件:具有决策者希望的一个明确目标具有两个以上不以决策者的意志为转移的自然状态具有两个以上的决策方案不同决策方案在不同自然状态下的损益值可以推算出来,6,乐观主义准则:乐观主义准则也叫最大最大准则,持这种准则思想的决策者对事物总抱有乐观和冒险的态度,他决不放弃任何获得最好结果的机会,争取以好中之好的态度来选择决策方案决策者在决策表中各个方案对各个状态的结果中选出最大者,记在表的最右列,再从该列中选出最大者,7,不确定型的决策问题,最大收益值的最大值为 max max aij=max(7,9,7,8,5)=9,i j结果选择方案A2,8,不确定型的决策问题,悲观主义准则悲观主义准则也叫做最大最小准则。这种决策方法的思想是对事物抱有悲观和保守的态度,在各种最坏的可能结果中选择最好的决策时从决策表中各方案对各个状态的结果选出最小者,记在表的最右列,再从该列中选出最大者,9,不确定型的决策问题,最小收益值的最大值为 max min aij=max(4,2,3,3,3)=4,i j结果选择方案A1。,10,不确定型的决策问题,折衷主义准则折衷主义准则也叫做赫尔威斯准则(Harwicz Decision Criterion),这种决策方法的特点是对事物既不乐观冒险,也不悲观保守,而是从中折衷平衡一下,用一个系数称为折衷系数来表示,并规定0,1,用以下算式计算结果 cvi=max aij+(1-)min aij j j即用每个决策方案在各个自然状态下的最大效益值乘以;再加上最小效益值乘以1-,然后比较cvi,从中选择最大者,11,不确定型的决策问题,12,不确定型的决策问题,其中 CV1=0.87+0.24=6.4 CV2=0.89+0.22=7.6 CV3=0.87+0.23=6.2 CV4=0.88+0.23=7.0 CV5=0.85+0.23=4.6 max CVi=max(6.4,7.6,6.2,7.0,4.6)=7.6 i 结果选择方案A2。很明显如果取值不同,可以得到不同的结果。当情况比较乐观时,应取得大一些,反之,应取得小一些。,13,不确定型的决策问题,等可能准则等可能准则也叫做 Laplace 准则,它是十九世纪数学家 Laplace 提出来的。他认为,当决策者无法事先确定每个自然状态出现的概率时,就可以把每个状态出现的概率定为1/n,n是自然状态数,然后按照最大期望值准则决策,14,不确定型的决策问题,15,不确定型的决策问题,其中E(A1)=(1/4)4+(1/4)5+(1/4)6+(1/4)7=5.5 E(A2)=(1/4)2+(1/4)4+(1/4)6+(1/4)9=5.25 E(A3)=(1/4)5+(1/4)7+(1/4)3+(1/4)5=5 E(A4)=(1/4)3+(1/4)5+(1/4)6+(1/4)8=5.5 E(A5)=(1/4)3+(1/4)5+(1/4)5+(1/4)5=4.5因为 E(A1)=E(A4),所以比较 D(A1)和 D(A4)的大小D(A1)=E(A1)min aij=5.5 4=1.5 jD(A4)=E(A4)min aij=5.5 3=2.5 j由于 D(A1)D(A4),所以选择方案A1。,16,不确定型的决策问题,后悔值准则后悔值准则也叫做Savage准则。决策者在制定决策之后,如果不能符合理想情况,必然有后悔的感觉。这种方法的特点是每个自然状态的最大收益值(损失矩阵取为最小值),作为该自然状态的理想目标,并将该状态的其它值与最大值相减所得的差作为未达到理想目标的后悔值。这样,从收益矩阵就可以计算出后悔值矩阵。,17,不确定型的决策问题,决 策 表,18,不确定型的决策问题,后 悔 矩 阵,19,不确定型的决策问题,从收益矩阵计算后悔矩阵的方法:在S1状态下,理想值是5,于是A1,A2,A5的后悔值分别是5-4=1,5-2=3,5-5=0,5-3=2。依此类推,可以得出S2,S3,S4自然状态下的后悔值。从后悔矩阵中把每一个决策方案A1,A2,A5的最大后悔值求出来,在求出这些最大值中的最小值 min(2,3,4,2,4)=2 因此,选择A1或者A4。,20,第5章 决策分析,决策概述确定型决策问题不确定型决策问题风险型决策问题效用理论在决策中的应用,21,风险型的决策问题,风险型的决策问题应具备以下几个条件:具有决策者希望的一个明确目标。具有两个以上不以决策者的意志为转移的自然状态。具有两个以上的决策方案可供决策者选择。不同决策方案在不同自然状态下的损益值可以计算出来。不同自然状态出现的概率(即可能性)决策者可以事先计算或者估计出来。,22,风险型决策问题,最大可能准则最大期望值准则决策树法灵敏度分析信息的作用(贝叶斯决策),23,最大可能准则,最大可能准则根据概率论的原理,一个事件的概率越大,其发生的可能性就越大。基于这种想法,我们在风险型决策问题中选择一个概率最大(即可能性最大)的自然状态进行决策,而不论其他的自然状态如何,这样就变成了确定型的决策问题,24,最大可能准则,例1:某工厂要制定下年度产品的生产批量计划,根据市场调查和市场预测的结果,得到产品市场销路好、中、差三种自然状态的概率分别为0.3、0.5、0.2,工厂采用大批、中批、小批生产可能得到收益值也可以计算出来(见表)。现在要求通过决策分析,合理地确定生产批量,使企业获得的收益最大。,25,最大可能准则,单位:万元,26,最大可能准则,解:从表中可以看出,自然状态的概率P2=0.5最大,因此产品的市场销路S2(中)的可能性也就最大。于是就考虑按照这种市场销路决策,通过比较可知,企业采取中批生产收益最大,所以A2是最优决策方案。,27,最大可能准则,最大可能准则有着十分广泛的应用范围。特别当自然状态中某个状态的概率非常突出,比其他状态的概率大许多的时候,这种准则的决策效果是比较理想的。但是当自然状态发生的概率互相都很接近,且变化不明显时,再采用这种准则,效果就不理想了,甚至会产生严重错误。,28,最大期望值准则,最大期望值准则 这里所指的期望值就是概率论中离散型随机变量的数学期望 n E=pi xi i=1 所谓最大期望值准则就是把每一个决策方案看作是离散型随机变量,然后把它的数学期望算出来,再加以比较。如果决策目标是收益最大,那么选择数学期望值最大的方案。反之,选择数学期望值最小的方案。以例1来说明,见下表。,29,最大期望值准则,单位:万元,30,最大期望值准则,计算出每一个决策方案的数学期望值:EA1=0.320+0.512+0.2 8=13.6 EA2=0.316+0.516+0.210=14.8 EA3=0.312+0.512+0.212=12 通过比较可知EA2=14.8最大,所以选择决策方案A2,采用中批生产,31,最大期望值准则,从风险型决策过程我们看到,利用了事件的概率和数学期望进行决策。概率是指一个事件发生可能性的大小,但不一定必然要发生。因此,这种决策准则是要承担一定的风险。那么是不是说我们要对这个决策准则产生怀疑了呢?答案是否定的。因为我们引用了概率统计的原理,也就是说在多次进行这种决策的前提下,成功还是占大多数的,比我们的直观感觉和主观想象要科学合理得多,因此它是一种科学有效的常用决策标准。,32,决策树法,决策树法 关于风险型决策问题除了采用最大期望值准则外,还可以采用决策树方法进行决策。这种方法的形态好似树形结构,故起名决策树方法。决策节点,从它引出的枝叫做方案支方案(状态)节点,从它引出的枝叫做概率支,每条概率支上注明自然状态和概率末梢,旁边的数字是每个方案在相应自然状态下的损益值。,33,决策树法,34,决策树法,决策树方法的步骤画决策树:画决策树的过程是从左向右,对未来可能情况进行周密思考和预测,对决策问题逐步进行深入探讨的过程预测事件发生的概率。概率值的确定,可以凭借决策人员的估计或者历史统计资料的推断。估计或推断的准确性十分重要,如果误差较大,就会引起决策失误,从而蒙受损失计算损益值。在决策树中由末梢开始从右向左顺序推算,根据损益值和相应的概率值算出每个决策方案的数学期望。如果决策目标是收益最大,那么取数学期望的最大值;反之,取最小值,35,决策树法,例1的结果,36,决策树法,在例1中只包括一级决策叫做单级决策问题。实际中的一些风险型决策问题包括两级以上的决策,叫做多级决策问题。,37,决策树法,例2:某工厂由于生产工艺落后产品成本偏高。在产品销售价格高时才能盈利,在产品价格中等时持平,企业无利可图。在产品价格低时,企业要亏损。现在工厂的高级管理人员准备将这项工艺加以改造,用新的生产工艺来代替。新工艺的取得有两条途径,一个时自行研制,成功的概率是0.6;另一个是购买专利技术,预计谈判成功的概率是0.8。但是不论研制还是谈判成功,企业的生产规模都有两种方案,一个是产量不变,另一个是增加产量。如果研制或者谈判均告失败,则按照原工艺进行生产,并保持产量不变。,38,决策树法,按照市场调查和预测的结果,预计今后几年内这种产品价格上涨的概率是0.4,价格中等的概率是0.5,价格下跌的概率是0.1。通过计算得到各种价格下的收益值,如表所示。要求通过决策分析,确定企业选择何种决策方案最为有利。,39,决策树法,单位:百万元,40,决策树法,解:(1)画决策树如图所示(2)计算各节点的收益期望值,如 节点4:0.1(-100)+0.50+0.4100=30 节点8:0.1(-200)+0.550+0.4150=65 节点9:0.1(-300)+0.550+0.4250=95 因为6595,所以节点5的产量不变是剪枝 方案(3)确定决策方案。由于节点2的期望值比节点3大,因此最优决策应是购买专利,42,灵敏度分析,灵敏度分析 在通常的决策模型中自然状态的损益值和概率往往是预测和估计得到的,一般不会十分准确。因此,根据实际情况的变化,有必要对这些数据在多大范围内变动,而原最优决策方案继续有效进行分析,这种分析就叫做灵敏度分析。,43,灵敏度分析,例3:有外壳完全相同的木盒100个,将其分为两组,一组内装白球,有70盒。另一组内装黑球,有30盒。现从这100个盒中任取一盒,让你猜,如果这个盒内装的是白球,猜对得500分,猜错罚150分。如果这个盒内装的是黑球,猜对得1000分,猜错罚200分。为了使希望得分最高,合理的决策方案是什么?有关数据如下表所示。,44,灵敏度分析,45,灵敏度分析,解:画决策树,如图所示。讨论数学期望:猜白:0.7500+0.3(-200)=290 猜黑:0.7(-150)+0.31000=195 显然,按照最大期望值准则,猜白是最优方案。,46,灵敏度分析,47,灵敏度分析,现在假设白球出现的概率变为0.8,这时,猜白:0.8500+0.2(-200)=360 猜黑:0.8(-500)+0.21000=80很明显,猜白仍是最优方案。再假设白球出现的概率变为0.6,这时:猜白:0.6500+0.4(-200)=220猜黑:0.6(-150)+0.41000=310 现在的结果发生了变化,猜黑是最优决策方案。,48,灵敏度分析,转折概率 设P是白球出现的概率,则1-P是黑球出现的概率.计算两个方案的数学期望,并使其相等,得到 P500+(1-P)(-200)=P(-150)+(1-P)1000 解方程后得P=0.65,将它称为转折概率。当 P 0.65,猜白是最优方案;当 P 0.65 猜黑是最优方案。,49,灵敏度分析,在实际的决策过程中,经常要将自然状态的概率和损益值等,在一定的范围内作几次变化,反复地进行计算,考察所得到的数学期望值是否变化很大,影响到最优方案的选择如果这些数据稍加变化,而最优方案不变,那么这个决策方案就是稳定的;否则,这个决策方案就是不稳定的,需要进行更深一步的讨论了。,50,信息的作用(贝叶斯决策),在处理风险型决策问题的期望值方法中,需要知道各种状态出现的概率P(Si),称为先验概率在决策的过程中,也会不断收集信息,并根据新信息对原有各种状态出现的概率进行修正收集到信息B,变化后的概率记为P(Si|B),是一个条件概率,称为后验概率追加信息一般有助于改进对决策问题的分析,需要解决两个问题如何根据信息对先验概率进行修正,并进行决策获取信息需要支付一定费用,是否值得信息本身能带来的新的收益称为信息的价值,51,信息的作用(贝叶斯决策),例4:某石油公司拥有一块可能有油的土地,可能出油量有4种:产油50万桶、20万桶、5万桶、无油。公司有3种方案可供选择:自行钻井;无条件出租;有条件出租。若自行钻井,打出有油井的费用是10万元,打出无油井的费用是7.5万元,每桶油的利润为1.5元;若无条件出租,公司收取固定租金4.5万元;若有条件出租,当产量达到20万桶时,公司收取0.5元/桶。根据以往经验,该土地4种出油量的可能性分别为10%、15%、25%、50%。该公司想在决策前进行一次地震实验,以进一步弄清该地区的地质结构,以便更好地进行决策。,52,信息的作用(贝叶斯决策),已知地震实验的费用为12000元,可能的结果是:构造很好(I1)、构造较好(I2)、构造一般(I3)、构造较差(I4)。根据过去的经验,可知地质结构和出油量的关系如下表所示。,53,信息的作用(贝叶斯决策),问题是:(1)是否需要做地震实验;(2)如何根据地震实验的结果进行决策?解:先把各种方案在各种状态下的利润情况计算出来,见下表:,56,信息的作用(贝叶斯决策),需要计算地震实验的各种可能的结果出现的可能性,以及在各种结果下各种出油量的可能性。先计算各种地震实验结果出现的可能性(概率)P(I1)=P(S1)P(I1|S1)+P(S2)P(I1|S2)+P(S3)P(I1|S3)+P(S4)P(I1|S4)=0.100.58+0.150.56+0.250.46+0.500.19=0.352P(I2)=P(S1)P(I2|S1)+P(S2)P(I2|S2)+P(S3)P(I2|S3)+P(S4)P(I2|S4)=0.100.33+0.150.19+0.250.25+0.500.27=0.259P(I3)=P(S1)P(I3|S1)+P(S2)P(I3|S2)+P(S3)P(I3|S3)+P(S4)P(I3|S4)=0.100.09+0.150.125+0.250.125+0.500.31=0.214P(I1)=P(S1)P(I4|S1)+P(S2)P(I4|S2)+P(S3)P(I4|S3)+P(S4)P(I4|S4)=0.100.0+0.150.125+0.250.165+0.500.23=0.175,57,信息的作用(贝叶斯决策),由条件概率公式 P(Si|Ij)=P(Ij|Si)P(Si)/P(Ij)可得到后验概率 P(Si|Ij),如下表所示,61,信息的作用(贝叶斯决策),从图中可以看出,公司应该进行地震实验,如果地质结构的构造很好或较好,则自行钻井;如果构造一般或较差则无条件出租。同时可以看出,不做地震实验时的期望收益为 51250 元,实验后的期望收益为 77543 元,增加了期望收益,即地震实验的信息价值为 77543 51250=26293元,大于地震实验的费用 12000 元,因此进行地震实验获得更多信息是合算的。,62,第5章 决策分析,决策概述确定型决策问题不确定型决策问题风险型决策问题效用理论在决策中的应用,63,效用理论在决策中的应用,效用的概念最初是由贝努利(Berneuli)提出来的。他认为,人们对金钱的真实价值的关注与他钱财的拥有量之间呈现着对数关系。这就是所谓的贝努利货币效用函数,如图所示。经济学家用效用作为指标,用它来衡量人们对某些事物的主观意识、态度、偏爱和倾向等。,64,效用理论在决策中的应用,65,效用理论在决策中的应用,例如,在风险型条件下决策,人们对待风险主观态度是不同的。如果用效用这个指标来量化人们对待风险的态度,那么就可以给每一个决策者测定他对待风险的态度的效用曲线。效用值是一个相对指标。一般规定,凡是决策者最喜爱,最偏向,最愿意的事物,效用值定为1。而最不喜爱,最不愿意的事物,效用值定为0。当然,也可以采用其他数值范围,比如0100,66,效用理论在决策中的应用,这样,通过效用指标就可以将一些难以量化的有本质差别的事物给以量化。例如,决策者在进行多方案选择时,需要考虑风险、利益、价值、性质、环境等多种因素。从而将这些因素都折合为效用值,求得各方案的综合效用值,从中选择最大效用值的方案,这就是最大效用值决策准则。在风险型决策条件下,如果只作一次决策,用最大期望值准则,有时就不一定合理了。例如下表所示的决策方案,三个方案的数学期望值基本相同,用最大期望值准则只实现一次时,就显得不恰当了。这时可以用最大效用值准则来解决。,67,效用理论在决策中的应用,决 策 表,68,效用理论在决策中的应用,效用曲线的作法通常的效用曲线的作法是采用心理测试法。设决策者有两种可以选择的收入方案:第一:以0.5的概率可以得到200元,0.5的概率损失100元第二:以概率为1得到25元。现在规定200元的效用值为1,这是因为200元他最希望得到的。-100元的效用值为0,这是因为他最不希望付出的。我们用提问的方式来测试决策者对不同方案的选择:,69,效用理论在决策中的应用,1.被测试者认为选择第二方案可以稳获25元,比第一方案稳妥。这就说明对他来说25元的效用值大于第一方案的效用值2.把第二方案的25元降为10元,问他如何选择?他认为稳获10元比第一方案稳妥,这仍说明10元的效用值大于第一方案的效用值3.把第二方案的25元降为-10元,问他如何选择?此时他不愿意付出10元,而宁愿选择第一方案,这就说明-10元的效用值小于第一方案的效用值,70,效用理论在决策中的应用,这样经过若干提问之后,被测试者认为当第二方案的25元降到0元时,选择第一方案和第二方案均可。这说明对他来说0元的效用值与第一方案的效用值是相同的,即0.51(效用值)+0.50(效用值)0.5(效用值)。于是收益值0就应于效用值0.5,这样,就得到效用曲线上的一点再次以0.5的概率得到收益200元,0.5的概率得到0元作为第一方案。重复类似的提问过程,假定经过若干次提问,最后判定80元的效用值与这个方案的效用值相等,80元的效用值为0.51+0.50.50.75,于是在0200之间又得到一点,71,效用理论在决策中的应用,再求-100元至0元之间的点,以0.5的概率得0元,0.5的概率得-100元作为第一方案。经过几次提问之间,最后判定-60元的效用与这个方案的效用值相等,-60元的效用值为0.50.5+0.500.25,于是又得到一点按照同样的提问方法,能够得到若干这样的点,把它们连起来,就成为效用曲线,如图所示从这条效用曲线上可以找出各收益值对应的效用值,72,效用理论在决策中的应用,73,效用理论在决策中的应用,效用曲线一般分为保守型、中间型、冒险 型三种类型。如图所示,74,效用理论在决策中的应用,曲线甲代表的是保守型决策者,特点是对肯定能够得到的某个收益值的效用大于具有风险的相同收益期望值的效用。这种类型的决策者对损失比较敏感,对利益比较迟缓,是一种避免风险,不求大利,小心谨慎的保守型决策人曲线乙代表的决策者的特点恰恰相反,对利益比较敏感,对损失反应迟钝,是一种谋求大利,敢于承担风险的冒险型决策人曲线丙代表的是一种中间型决策人,认为收益值的增长与效用值的增长成正比关系,是一种只会循规蹈矩,完全按照期望值的大小来选择决策方案的人现在通过大量的调查研究发现,大多数决策者属于保守型,属于另外两种类型的人只占少数,75,效用理论在决策中的应用,下面通过一个例子介绍效用曲线的应用方法。例5:某公司一项新产品的开发准备了两个建设方案,一个是建大厂,另一个是建小厂。建大厂预计投资是300万元,建小厂的预计投资160万元,两个工厂的寿命周期都是10年。根据市场调查和经济预测的结果,这项产品市场销路好的概率是0.7,销路差的概率是0.3,两个方案的年收益值如下表所示,要求作出合理的投资决策。,76,效用理论在决策中的应用,决策表,单位:万元,77,效用理论在决策中的应用,解:画决策树如图所示。由表可知,建大厂在10年寿命周期内产品销路好的条件下,其最大收益值为100万元10-300万元=700万元,销路差的条件下最大损失值为-20万元10-300万元=-500万元。建小厂在10年内产品销路好的条件下,最大收益值为40万元10-160万元=240万元,销路差的条件下最大损失值为10万元10-160万元=-60万元。,78,效用理论在决策中的应用,79,效用理论在决策中的应用,这项决策的最大收益是700万元,最大损失是-500万元下面作出这个公司高级决策者的效用曲线以700万元的效用值定为1,以-500万元的效用值定为0,采用心里测试法向被测试人提出一系列问题,同时求出对应于各个收益值的效用值,这样就作出被测试人的效用曲线,如图所示。,80,效用理论在决策中的应用,81,效用理论在决策中的应用,从这条曲线上,可以找出对应于各个收益的效用值,240万元的效用值是0.82,-60万元的效用值是0.58现在用最大效用值准则来进行决策,建大厂的效用期望值为0.71(效用值)+0.30(效用值)=0.7(效用值),建小厂的效用期望值为0.7 0.82+0.30.58=0.75这样就看出,如果用效用值作为标准,建小厂是最优方案,82,效用理论在决策中的应用,83,效用理论在决策中的应用,这是为什么呢?原因是这个高级决策人属于保守型的,他不敢冒太大的风险从效用曲线上不难看出,效用值0.7只相当于收益值80万元,远远小于原来的期望值340万元。效用值0.75相当于收益值130万元,也小于原来的150万元可以看出,利用效用理论可以把决策者的风险态度反映出来,84,本章作业,教材P257-2601(加后悔值准则)38,