欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    随机性决策问题的决策准则.ppt

    • 资源ID:6355614       资源大小:873KB        全文页数:89页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    随机性决策问题的决策准则.ppt

    4 随机性决策问题的决策准则,学习目标:熟练掌握贝叶斯分析方法,深刻了解贝叶斯法的核心思想-用历史数据或新信息来修正事先设定的主观概率,即用后验概率来修正先验概率。,4 随机性决策问题的决策准则,4.1 引言4.2 严格不确定型决策问题的决策准则4.3 风险型决策问题的决策准则4.4 贝叶斯定理4.5 贝叶斯分析4.6 一种具有部分先验信息的贝叶斯分析法,4.3 风险型决策问题的决策准则,风险型决策问题的特点:决策人虽然无法确知将来的真实自然状态,但他不仅能给出各种可能出现的自然状态,还可以给出各种状态出现的可能性,通过设定各种状态的(主观)概率 来量化不确定性。,4.3 风险型决策问题的决策准则,(1)最大可能值准则(2)贝叶斯准则(3)贝努利准则(4)E-V准则(5)不完全信息情况下的决策准则(6)优势原则与随机性决策规则,(1)最大可能值准则,采用众数原则,即最大可能值准则,以行动ai的后果变量的众数,即ai的各种可能的后果中出现的可能性最大的后果,作为评价ai优劣的数值指标vi。,例:最大可能值准则,例4.1 决策问题的损失矩阵如表所示。,(2)贝叶斯准则,(3)贝努利准则,按照贝努利(Bernoulli)准则,应该首先确定后果对决策人的实际价值即效用函数,若采用损失,也应该是效用函数的负值;然后再用Bayes原则求最优行动。本章随后所介绍的各种方法,所采用的决策准则实际上都是贝努利准则:使期望效用极大化或者使期望损失极小化。,(4)E-V准则(均值-方差准则),贝叶斯准则只根据后果均值的大小作决策,显然忽略了风险因素;,例:E-V准则,(5)不完全信息情况下的决策准则,(6)优势原则与随机性决策规则,优势原则 当很难准确设定自然状态的概率主观概率时,可采用优势原则。,优势原则,随机策略,随机策略,4.4 贝叶斯定理,第二章讨论了设定自然状态的(主观)概率分布的方法,由于种种原因,设定比较准确的状态的概率分布是很困难的事。一般情况下,决策分析的结果往往对状态的概率分布比较敏感,即自然状态概率分布的小的变化会显著地改变分析结果,因此要提高决策分析的精度就必须设法提高状态概率分布的估计精度。显然,仅仅依靠决策人的经验作主观的估计,所设定的自然状态的先验分布的精度不可能有很大的改进,因此需要通过随机试验去收集有关自然状态的信息,以便改进所设定的自然状态的概率分布的准确性,从而改善决策分析的质量。,4.4 贝叶斯定理,随机试验是广义的,它包括了获取有关信息的一切可能的手段,只要这些信息有助于提高状态概率分布的准确性。例如:出门是否带伞问题在事先听天气预报;医生看病时做各种检查、化验;生产厂家或经销商对商品的市场调查等等在决策分析中,如何设计随机试验去获取有效信息,如何利用新的信息改进状态概率分布,是非常实际而又重要的环节。利用新的信息,或者说通过信息处理修正原有的观点,是人类最重要的智力活动之一。,1)条件概率与全概率公式,2)贝叶斯定理,4.4 贝叶斯定理,例4.2 先验概率的修正,设有A和B两个外形相同、装有足够数量黑白小球的不透明坛子,A坛中装有白球30%,黑球70%;B坛中白球70%,黑球30%。从中任取一坛,作放回摸球12次,观察的记录是摸出白球4次,黑球8次。求所取为A坛的概率。用本例子说明,通过试验和观察,可以修正先验分布,获得关于自然状态的更准确的判断,由此理解贝叶斯定理在决策分析过程中的重要作用。,例题解答,例题扩展,先验概率决策,后验概率决策,例2:HP公司新医疗设备的键盘生产决策问题,例2:HP公司新医疗设备的键盘生产决策问题,先验概率(Prior probability)HP公司的类似产品的销售情况历史统计数据如下表:,HP公司估计该新医疗设备的销售情况先验概率如下:p(H)=0.2 p(M)=0.5 p(L)=0.3,例2:HP公司新医疗设备的键盘生产决策问题,新信息的获得(New information)HP公司准备委托一家市场调查公司对新医疗设备的市场销售情况进行预测。后验概率(Posterior probability)HP公司如何根据市场调查的结果修正其先验概率?p(H|预测结果)=?p(M|预测结果)=?p(L|预测结果)=?问题:市场调查公司有几种预测结果?,例2:HP公司新医疗设备的键盘生产决策问题,该市场调查公司过去预测的准确性如下表:,问题:如何求出市场调查公司的条件概率?,市场调查公司的条件概率,(1)实际销售为High时条件概率?p(预测h|H)=18/20=0.9p(预测m|H)=1/20=0.05p(预测 l|H)=1/20=0.05(2)实际销售为Medium时条件概率?p(预测h|M)=5/50=0.1p(预测m|M)=40/50=0.8p(预测 l|M)=5/50=0.1(3)实际销售为Low时条件概率?p(预测h|L)=3/30=0.1p(预测m|L)=3/30=0.1p(预测 l|L)=24/30=0.8,(1)如果市场调查公司预测该新产品的销售情况好(预测h),HP公司该如何修正其先验概率?已知的条件概率:p(预测h|H)=18/20=0.9p(预测h|M)=5/50=0.1p(预测h|L)=3/30=0.1求后验概率:p(H|预测h)=?p(M|预测h)=?p(L|预测h)=?,后验概率的求解原理:,假设:A1=high;A2=medium;A3=low;B=预测h则有:A1、A2、A3为互不相容事件,且:P(A1)+P(A2)+P(A3)=1,事件Ai(i=1,2,3)和事件B相关.,后验概率的求解原理:,条件概率(conditional probabilities):P(B|A1)=0.9P(B|A2)=0.1P(B|A3)=0.1如何求后验概率(posterior probability):P(A1|B)=?P(A2|B)=?P(A3|B)=?,后验概率的求解原理:,根据乘法原理有:P(A1|B)=P(A1 and B)/P(B)P(A2|B)=P(A2 and B)/P(B)P(A3|B)=P(A3 and B)/P(B)因此,求解后验概率需要知道:(1)联合概率:P(Ai and B),i=1,2,3,(2)边缘密度:P(B).,获得联合概率P(Ai and B):,根据乘法原理,有两种方法可以获得联合概率:(1)P(Ai and B)=P(Ai)P(B|Ai)(2)P(Ai and B)=P(B)P(Ai|B)我们选择 公式(1)来计算联合概率,理由是:我们已经知道了P(Ai)和P(B|Ai),但是不知道P(B)和P(Ai|B).P(A1 and B)=P(A1)P(B|A1)=0.20.9=0.18P(A2 and B)=P(A2)P(B|A2)=0.50.1=0.05P(A3 and B)=P(A3)P(B|A3)=0.3 0.1=0.03,获得边缘密度P(B):,根据全概率公式,如果:(1)A1,A2,An 为两两互不相容事件;(2)且它们构成了一个事件空间S的划分,即P(A1)+P(A2)+P(An)=1,则对于事件空间S中的任意事件B有:,获得后验概率P(Ai|B):,已知联合概率P(Ai and B),求后验概率,根据乘法原理:P(Ai|B)=P(Ai and B)/P(B)=P(Ai and B)/sum P(Ai and B),(1)如果市场调查公司预测该新产品的销售情况好(预测h),(2)如果市场调查公司预测该新产品的销售情况好(预测m),HP公司该如何修正其先验概率?已知的条件概率:p(预测m|H)=1/20=0.05p(预测m|M)=40/50=0.8p(预测m|L)=3/30=0.1求后验概率:p(H|预测m)=?p(M|预测m)=?p(L|预测m)=?,(2)如果市场调查公司预测该新产品的销售情况好(预测m),(3)如果市场调查公司预测该新产品的销售情况好(预测l),HP公司该如何修正其先验概率?已知的条件概率:p(预测l|H)=1/20=0.05p(预测l|M)=5/50=0.1p(预测l|L)=24/30=0.8求后验概率:p(H|预测l)=?p(M|预测l)=?p(L|预测l)=?,(3)如果市场调查公司预测该新产品的销售情况好(预测l),市场调查公司三种预测结果的概率等于边缘密度,p(预测h)=0.26,p(预测m)=0.44,p(预测l)=0.3,问题:HP公司在委托市场调查公司之前,是否知道其预测结果?如何估计市场调查公司的预测结果?,市场调查公司三种预测结果能否提高HP公司的期望收益?,比较不进行市场调查和委托进行市场调查,前后两种方案的期望收益差异。,HP公司不进行市场调查的期望收益:,The EMV for the decision of MU is:550.2+100.5-150.3=11.5The EMV for the decision of BD is:250.2+300.5+100.3=23The EMV for the decision of BA is:400.2+200.5+50.3=19.5,HP进行市场调查的期望收益:(1)预测h,The EMV for the decision of MU is:550.692+100.192-150.115=38.255The EMV for the decision of BD is:250.692+300.192+100.115=34.56The EMV for the decision of BA is:400.692+200.192+50.115+=32.095,HP进行市场调查的期望收益:(2)预测m,The EMV for the decision of MU is:550.022+10 0.909-150.068=9.28The EMV for the decision of BD is:25 0.022+300.909+10 0.068=28.5The EMV for the decision of BA is:40 0.022+200.909+5 0.068=19.4,HP进行市场调查的期望收益:(3)预测l,The EMV for the decision of MU is:550.033+100.167-150.80=-8.515The EMV for the decision of BD is:250.033+300.167+100.80=13.835The EMV for the decision of BA is:400.033+200.167+50.80=8.66,HP根据三种预测结果所获得的期望收益:,The EMV after forecast:38.2550.26+28.50.44+13.835 0.3=26.6368,采样信息的期望价值(EVSI),没有市场调查时的期望收益:The EMV for the decision of BD is:250.2+300.5+100.3=23进行市场调查时的期望收益:The EMV after forecast:38.2550.26+28.50.44+13.835 0.3=26.6368进行市场调查提高的期望收益:26.6368233.6368(EVSI),完全信息的期望价值(EVPI),The EMV with perfect information is:550.2+300.5+100.3=29完全信息提高的期望收益:29-23=6(EVPI),新信息的可靠性分析,假设,市场调查公司过去预测的准确性如下表:,例3:钻探实验的可靠性分析,假设,地质学家对某地的地质构造不清楚,他对该地方是否存在天然气的先验概率为0.5。为了进一步确认该地方是否存在天然气,地质学家决定进行钻探实验。钻探结果的结果显示:该地方存在天然气。如果钻探结果的准确性为95%,该地质学家如何根据钻探的结果修正其先验概率。,例3:钻探实验的可靠性分析,先验概率:p(gas exits)=0.5 p(gas not exits)=0.5随机试验:钻探实验(Test Drilling)条件概率(钻探结果的准确性95%):p(Drilling indicates gas|gas exits)=0.95 p(Drilling indicates gas|gas not exits)=0.05后验概率:p(gas exits|Drilling indicates gas)=?p(gas not exits|Drilling indicates gas)=?,后验概率的求解过程,问题:是否新信息的可靠性越高,先验概率修正的幅度越大?,4.5 贝叶斯分析,4.5.1 贝叶斯风险与贝叶斯规则4.5.2 正规型贝叶斯分析4.5.3 贝叶斯分析的扩展型4.5.4 信息的价值4.5.5 贝叶斯分析的例子4.5.6 序贯分析4.5.7 非正常先验与广义贝叶斯规则,4.5.1 贝叶斯风险与贝叶斯规则,为了使损失函数能够确切地反映后果对决策人的实际价值,令效用函数的负值为损失函数。基数效用在正线性变换下的惟一性使得损失函数在正线性变换下也是惟一的。为了运算的方便,可以采用下式使损失函数值非负:,无论上述哪一种方式定义损失函数,对分析的结果不会有任何影响。,定义:风险函数,例:策略空间,假设观察值X=(x1,x2,x3,x4),决策人的行动集A=(a1,a2,a3).决策人根据观察值采取的策略空间如下:,注:策略空间包含了(忽略了)观察值X和自然状态之间的所有对应关系.,定义:风险函数,由于在进行决策分析的时候并不知道真实的自然状态,只能对自然状态设定先验概率,因此要用风险函数关于自然状态的期望值来描述实际的损失。,定义:贝叶斯风险,定义:贝叶斯决策规则,4.5.2 正规型贝叶斯分析,贝叶斯分析正规型的实质:对所有策略下的贝叶斯风险的穷举,找出其中的最小的,在实际应用有很大的局限。,4.5.3 贝叶斯分析的扩展型,4.5.3 贝叶斯分析的扩展型,4.5.5 贝叶斯分析的例子,1无观察问题 例4.3 油井钻探问题。某公司拥有一块可能有油的土地,该公司可以自己钻井,也可以出租给其他公司开采;若出租土地,租约有两种形式:无条件出租,租金45万元。有条件出租,租金依产量而定:产量在20万桶或以上时,每桶提成5元;产量不足20万桶时不收租金。设钻井费用为75万元,有油时需另加采油设备费25万元,油价为15元/桶。为了简化问题,将油井产量离散化,分为4种状态:无油、产油5万桶、产油20万桶、产油50万桶。设各种状态的主观概率分布如下表,且决策人风险中立,分析决策人该选择什么行动?,决策表:效用,决策表:损失,问题的决策树,将决策人自己钻井a1,无条件出租记作a2,有条件出租为a3.又因为决策人风险中立,所以可以设uij=cij/万元,令l(y)=-u(y)。,2进行随机试验获取观察值,2进行随机试验获取观察值,扩展型分析,扩展型分析,正规型分析,扩展型分析得到的贝叶斯策略,4.5.4 信息的价值,首先考察理想的状况。假设通过试验能够获得自然状态的完全信息。如果能够获得自然状态的完全信息,即决策人事先知道状态的确切值,则决策人可以根据这种状态选择使损失最小的行动进而使期望损失极小化。这时的期望损失是:,例:完全信息下的期望损失计算,=-650*0.1-200*0.15-45*0.25-45*0.5=-128.75,4.5.4 信息的价值,当决策人不知道自然状态的确切情况时,只能在行动集中选择一个行动使期望损失极小化,这时的期望损失是:,例:不知道自然状态的期望损失计算(即无信息时的最小期望损失),完全信息的期望价值EVPI,上两式之差称为完全信息的期望价值(expected value of perfect information),简记为EVPI,即:,=-51.25-128.75=77.5,2采样信息的期望价值,4.5.6 序贯分析,4.5.7 非正常先验与广义贝叶斯规则,2.广义贝叶斯规则,需要注意的是:在许多重要场合,所有允许的决策规则都是广义贝叶斯规则;在无法得到正常先验时,除此别无良策;广义贝叶斯规则不一定是最好的决策规则。,作业5:,P97:八、某农民P97-P98:十、某公司,

    注意事项

    本文(随机性决策问题的决策准则.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开