第3讲随机决策理论与方法课件.ppt
《第3讲随机决策理论与方法课件.ppt》由会员分享,可在线阅读,更多相关《第3讲随机决策理论与方法课件.ppt(55页珍藏版)》请在三一办公上搜索。
1、决策理论与方法(3)随机决策理论与方法(1),合肥工业大学管理学院2023年3月18日,2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,随机性决策,风险性决策(随机性决策):指有多种未来状态和相应后果,但只能得到各种状态发生的概率而难以获得充分可靠信息的决策问题。特点:状态的随机性;决策结果的效用特性。决策的已知变量:状态空间的概率分布=,后果的效用函数(或损失函数):u(cij),cij表示采取方案ai时出现状态j的后果解决问题的主要理论方法:概率论与数理统计,2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,随机决策理论与方法,1、主观概率2、效用函数3、
2、决策准则4、贝叶斯决策分析,2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,主观概率概率的定义,古典概率的定义:在相同条件下进行了n次试验(随机试验),其中事件A发生的次数nA称为事件A发生的频数,比值nA/n称为事件A发生的频率,记为fn(A),则古典概率的定义为:p(A)=limnfn(A)Laplace的定义:p(A)=k/n;其中k为事件A所包含的基本事件数,n为基本事件ei的总数。(基本事件数有限,每个基本事件等概率)公理化定义:E是随机事件,S是E的样本空间,对E的每一事件A,对应有确定的实数p(A),若p(A)满足:非负性:p(A)0;规范性:p(S)=1;列可
3、加性:对两两不相容事件Ak,有p(kAk)=kp(Ak)。(AiAj=,ij),2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,主观概率概率的定义,客观(Objective)概率:上述三种定义的概率是在多次重复试验(随机试验)中,随机事件A发生的可能性的大小的度量,称为客观概率。主观(Subjective)概率:在实际管理决策中,许多事件的发生概率是无法通过随机试验获得的,或条件不允许,或事件本身不允许。因此需要一种方法来人为设定事件发生的概率,称为主观概率。主观概率是人们根据经验、各方面的知识以及了解到的客观情况进行分析、推理、综合判断,对特定事件发生的可能性的信念(或意见
4、、看法)的度量(Savage,1954)。,2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,主观概率先验分布与先验假设,先验分布(Prior Distribution):根据先验信息所确定的概率分布叫先验分布,获得先验分布是贝叶斯分析的基础。决策中先验分布的获得具有高度的主观性。先验假设:为使先验分布估计规范化,需要做一定的假设。连通性假设:指事件A和事件B发生的可能性是可比的,即p(A)p(B),p(A)p(B),p(A)p(B),p(B)p(C),则p(A)p(C)。(满足连通性和传递性的二元关系才能构成完全序)部分与全体关系假设:若事件A是事件B的一部分,则p(B)p(
5、A)。,2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,主观概率先验分布估计:比较法,比较法1-离散型(对事件发生的各种状态加以比较确定相对似然率)某气象专家对当年的气候状况进行评估,认为当年气候正常(1)与受灾的可能性之比约为3:2;如果受灾,则水灾(2)、旱灾(3)的可能性相当。据此,我们可推算出当年气候状况的先验分布:(1)+(2)+(3)=1;(1)/(2)+(3)=3/2;(2)=(3)解得:(1)=0.6,(2)=0.2,(3)=0.2思考:设某决策问题有n个状态,有m个专家对各状态发生的可能性进行了比较评估,我们如何综合利用所有专家的评估结果得到最终的先验分布?
6、,2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,主观概率先验分布估计:打赌法,打赌法(离散型)设打赌者(A)的个人财产为W。设事件E发生时A获得收入为p,(0p1;pW:保证打赌者的效用函数是线性的),不发生时A获得的收入为1-p。调整p值使A感觉无论事件E是否发生,其收入基本相同,即(E)p=(1-(E)(1-p)。则事件E发生的可能性(E)=1-p。,2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,主观概率先验分布估计:直方图法,直方图法(适合于自然状态在实轴某个区间连续取值)区间离散化:把的取值范围划分为若干子区间1n;赋值:估计每个区间的似然率(i
7、),据此作出直方图;变换:将直方图拟合为概率分布函数F(x)=x()。,不足之处:区间数n难以确定似然率(i)估计困难F(x)通常有较大的尾部误差,2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,主观概率先验分布估计:比较法,比较法2-连续型离散化:同直方图法比较赋值选择一个似然率最大的子区间k作为基准,设其相对似然率为Rk,然后给出其他各区间i相对于k的似然率Ri,则(i)=Ri/Ri由决策者给出每两个子区间似然率的比例关系:rij=(i)/(j),然后计算出每个状态i的似然率(i)。变换拟合:同直方图法思考:(1)如果决策者判断没有误差,即rij*rji=1,rij*rj
8、k=rik,如何求(i)?(2)如果决策者判断有误差,则又如何求(i)?,2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,主观概率先验分布估计:分位点法,区间对分法(分位点法)-连续型确定事件不可能发生的临界状态取值(如某地区人口出生率不可能低于9,但也不可能超过18);求中位数:当状态取值为此值时,大于或小于此值的状态出现的概率相等(如某地区人口出生率的中位数为12.5);确定上下四分位点;确定八分位点(一般仅取到八分位点)。,2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,主观概率先验分布
9、估计:分布函数法,与给定形式的分布函数相匹配(最常用也容易滥用)Matlab工具箱:Statistics Toolbox/Probability Distributions均匀分布(连续型):如果随机变量落在某个区间(a,b)中任意等长度的子区间内的可能性相等,则它服从均匀分布,均匀分布的概率密度函数为:Matlab函数:unifpdf(x,a,b),unifit(DATA),2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,主观概率先验分布估计:分布函数法,二项分布:(离散型)每次随机试验中事件A出现的概率为p,n次独立试验中事件A出现k次的概率服从二项分布:Matlab函数
10、:binopdf(k,n,p),binofit(k,n)泊松分布:(离散型)每次随机试验中事件A出现的概率为p,n次(n,但n*p=为常数)独立试验中事件A出现k次的概率服从泊松分布:Matlab函数:poisspdf(k,),poissfit(DATA),2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,主观概率先验分布估计:分布函数法,正态分布(高斯分布):(连续型)若连续型随机变量的概率密度函数为:则称随机变量服从参数为、2的正态分布Matlab函数:normpdf(x,),normfit(DATA)。参见
11、相关统计学书籍,看看还有哪些分布函数可供选择使用?,2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,随机决策理论与方法,1、主观概率2、效用函数3、决策准则4、贝叶斯决策分析,2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,效用函数问题的引入,复习信息集:为减少行动集、自然状态集、后果集的不确定性开展调查研究所获得的信息。自然状态集:事物所有可能的自然状态=1,n行动集:决策主体可能采用的所有行动集合A=a1,am后果集:决策问题各种可能的后果集合C=cij=c(ai,j),cij表示决策人采
12、取行动ai时出现自然状态j时的后果。主观概率是用来量化自然状态的随机性,那么我们如何度量一个后果的价值呢?面临两个难题:后果价值的量化存在困难(如降价促销对品牌的伤害);即使能够量化标度,但相同标度值的价值因人而异。,2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,效用函数问题的引入,在各类决策中,常常面临着这种选择:风险小但期望收益也小;期望收益大但风险也大!不同的决策人有不同的选择,相同的决策人在不同的情境下选择也不同。那么在决策中如何描述或表达后果对决策人的实际价值,以便反映决策人心目中对各种后果的偏好次序呢?,2023年3月18日8时1分,决策理论与方法-随机决策理论
13、与方法,效用函数效用的定义,效用就是偏好的量化值。决策的目标就是使期望效用极大化。基本概念及符号严格序:ab表示a优于b。满足传递性和非对称性。无差异:ab表示a与b无差异。满足自反性、对称性和传递性。弱序:ab表示a不劣于b。满足自反性、传递性和反对称性。展望(prospect)(事态体):各种后果(r种)及后果出现的概率的组合,记为:Pj=,(j=1,2,m;m为行动的可能种数),2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,效用函数效用的定义,复合展望:当无法确定采取某个行动时,可随机选择一种行动,设选择行动aj的概率为qj。则决策的展望就是一种复合展望,记为P=。所
14、有展望(包括简单展望和复合展望)构成展望空间。效用的定义若展望空间上的实值函数u对于展望空间的任意两个展望P1、P2,有P1P2 iff u(P1)u(P2),则称u为效用函数。,2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,效用函数效用的定义,效用存在性公理(理性行为公理)连通性:任意两个展望的优劣都是可比的传递性:展望的优劣满足传递性复合保序性:展望的优劣关系是可以复合的,且复合不会破坏原有的优劣关系展望的优劣是相对的,没有无限优的展望,也不存在无限劣的展望。理性行为公理认为合乎理性的决策人在进行价值判断时一定能满足这些公理。(实际决策中是否存在某种悖论呢?),2023
15、年3月18日8时1分,决策理论与方法-随机决策理论与方法,效用函数效用的定义,Allais悖论,实际上决策B是在决策A的基础上同时减去了89%的机会获得50万元,复合保序性没有得到满足,2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,效用函数效用的定义,思考:效用函数一定是连续的吗?是否存在某种临界点使得效用函数是一种分段函数,而在分段函数内满足效用存在公理?效用的公理化定义:在上述公理系统中,若展望空间上存在实值函数u,有:对展望空间中的任意展望P1、P2,P1P2 iff u(P1)u(P2)u(P1+(1-)P2)=u(P1)+(1-)u(P2)(复合展望的效用等于展望
16、效用的复合)对满足上述条件的u1,u2,必有u1(Pi)=bu2(Pi)+c,其中b,cR1,b0。(任意两个决策人的效用是线性相关的),2023年3月18日8时1分,决策理论与方法-随机决策理论与方法,效用函数基数性和序数性,前述定义的效用是一种基数效用,不仅能够反映决策者的偏好次序,还能够反映决策者的偏好强度。但在实际决策中,有时只需要偏好次序而不一定需要知道偏好强度就可以决策。此时只需要序数效用就可以了。有关序数效用的应用在多属性决策中介绍。Hicks对效用函数的基数性和序数性的比喻:如果知道两个人的身高,那么我们可以把高个儿排在第一位;如果不知道他俩的身高也没关系,让他们比一下就可以了
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 随机 决策 理论 方法 课件

链接地址:https://www.31ppt.com/p-3741600.html