第十六章 随机决策分析方法.docx
《第十六章 随机决策分析方法.docx》由会员分享,可在线阅读,更多相关《第十六章 随机决策分析方法.docx(34页珍藏版)》请在三一办公上搜索。
1、第十六章 随机性决策分析方法人们在日常生活和工作中经常会遇到一些与随机因素有关、后果不确定,而又必须做出判断和决定的问题.这类问题称为随机性决策问题.任何一个随机性决策问题都包含两个方面的内容,即决策人所采取的行动方案(简称决策)和问题的自然状态(简称状态),而且具有两个基本特点:后果的不确定性和后果的效用.所谓后果的不确定性,主要是由于问题的随机性,使得问会出现什么状态是不确定的,所以对策人做出的某种决策以后会出现什么后果也是不确定的.而效用是后果价值的量化,由于不确定性,无论决策人采用什么策略,都可能会遇到事先不能完全预料的后果,这要承担一定的风险,不同的决策人对待风险的态度会不同.因而,
2、同样的后果对不同的策略人产生的效用也会不同.即使在没有风险的情况下,不同的决策人对待各种后果也有不同的偏好,为此,在进行定量分析之前,就应该确定出所有后果的效用.只有这样,人们才能比较各种策略的优劣,根据自己的喜好来选择最佳的决策方案.在决策分析中,后果的不确定性和对于后果赋予的效用是两个关键性的问题.为此,对于状态的不确定性主要用主观概率来表示,而后果的效用则用效用理论来研究.16.1 随机性决策问题的基本概念16.1.1 主观概率随机性决策问题的后果的不确定性,主要是由状态的不确定性所引起的.状态的不确定性,往往不能通过在相同条件下的大量重复试验来确定其概率分布(此称客观概率)是有区别的.
3、主观概率是决策人进行决策分析的依据,虽然他与客观概率有本质的区别,但在定义概率方面有不同之处,同样遵循客观概率应该遵循的若干假设、公理和性质等,因此,适用于客观概率的所有的逻辑推理方法均适用于主观概率.这里仅给出主观概率所服从的基本假设(或称公理系统):(1)设为一非空集合,其元素可以是某种试验或观察的结果,也可以是自然的状态.将这些元素记作抽象的点,因而有(2)设F是中的一些子集A所构成的集合,F满足下列条件:1)2)如果,则;3)如果可列多个,则它们的并集.(3)设是定义在上的实值集函数,如果它满足下列条件,就称为上的(主观或客观)概率测度,或简称概率,这些条件是1)对于每个,有2)3)如
4、果可列多个,,则这里称点为基本事件, 中的集称为事件, 是全体事件的集合, 称为事件的(主观或客观)概率,三元总体称为(主观或客观)概率空间.设定主观概率的方法主要有:主观先验分布法、无信息先验分布法、极大熵(极大平均信息量)先验分布法和利用过去数据设定先验分布法等.16.1.2 效用函数在随机性决策问题中,后果的不确定性是有状态的不确定性引起的.所以,在研究后果的效用时要充分考虑后果的不确定性.设决策人在选择某一行动时,决策问题可能的个后果为后果可能发生的概率分别是且用表示所有后果的概率分布,并记则称为展望.所有展望构成的集合记为,可以验证关于凸线性组合是封闭的,即如果而且则有.对于任意两个
5、展望,都存在一定的优先关系,即对于决策人可以认为优于,或与无差异,或不优于三种情况,将这三种关系分别记为和.这种优先关系反映了决策人对各种后果的偏好程度.定义16.1 设是定义在展望上的实值函数,且满足(1)它和在上的优先关系一致,即如果对于所有,有当且仅当;(2)它在上是线性的,即如果,而且则那么称是定义在展望上的效用函数.如果,则就是表示以概率选择的期望效用.效用是决策人在有风险的情况下对后果的偏好的量化,因此,其中包含有决策人对于一个不确定事件可能冒风险的态度,又称这种效用为基数效用.如果所研究的事件是确定的事件,并不受自然状态的影响,类似地可以定义一个效用来表示决策人对确定事件的各种后
6、果的偏好程度.对于这类事件,决策人无需承担风险,相应的效用与基数效用有所不同,在此称之为序数效用.定义16.2 设为所有确定事件的后果的集合, 是定义在上的实值函数,如果对于任意的有,当且仅当,则称是定义在上的序数效用函数.基数效用和序数效用的主要区别是:基数效用在正线性变换下是唯一的,而序数效用在保序变换下是唯一的.正线性变换: .保序变换:,对任意为严格的单调增加函数. 16.2 效用函数理论16.2.1 效用与风险的关系 实际中很多的决策问题都涉及经济效益,对于这类问题,在后果不确定的情况下,决策人的决策往往是效益和风险并存,但对不同的决策人对待风险的态度一般是不同的,通常可分为三种态度
7、,即厌恶型、中立型和喜好型.假设决策人面对一种风险的情况有1/2的机会得不到任何盈利,也有1/2的机会盈利元,即他的期望盈利为元.如果决策人认为冒此风险的期望盈利只等价于比它低的不冒风险的盈利,则对待风险的态度为厌恶型的.否则对待风险的态度为喜好型的.如果决策人认为这和不冒任何风险的另一行为盈利元等价,则对待风险的态度是中立型的.这三种不同的态度可以反映在效用函数上就是凹(上凸)函数,线性函数和凸(下凸)函数.如图16-1.(a)(b)(c)图16-1 三种不同的效用函数曲线由图16-1(a)是风险厌恶型的效用函数,即有 ;由图16-1(b)是风险中立型的效用函数,即有 ;由图16-1(c)是
8、风险喜好型的效用函数,即有 ;实际中,很多的情况效用函数的曲线呈型,即在后果的范围内,决策人对待风险的态度往往会从厌恶风险改变为喜好风险.如图16-2.图16-2(a)反映了决策人的财产从小到大,对待风险的态度从喜好到厌恶的改变.图16-2(b)反映了决策人的财产随着从损失到盈利的增加,对待风险的态度会从喜好到厌恶的变化.这是最常用的效用函数.u(x)aoxoxu(x)(a)(b)图16-2 两类S型效用函数曲线16.2.2 损失函数与风险函数有的时候不要效用函数,而是用损失函数来做决策分析.记损失函数为,它表时示一个决策问题当状态为,决策人的行动为时所产生的后果使决策人所受的损失.损失函数可
9、以为正,也可以为负,它反映决策人获得的利益,后果效用越大,则损失越小.由此可以用效用函数来定义损失函数,即令 实际中,在有些问题上为了使损失函数总是为非负的,也可以定义损失函数为在效用理论中,我们说明了期望效用能够合理的表示在风险情况下决策人的偏好,因此,期望损失也必然是决策人在风险情况下遭受损失的一个正确测度.16.2.3 随机函数与效用函数随机决策分析是在一定的条件下,用期望效用来表示一个随机事件效用的一种方法.在有价证券问题的研究中,又提出另外一种在一定的风险情况下制定决策的方法,称为随机优势法.假设问题的效用函数为,其自变量表示财富(为一随机变量)。实际中的问题总是有,且在上有界,对于
10、这种效用函数可以分为以下几类:1 递增效用函数 实际中,一般要求财富的效用函数是的非递减函数,即意味着当财富增加时,它的效用总不会减少.通常是随着的增加是严格递增的,而且是有界的.为此,我们假设:(1) 对于任意,当时有;(2) 在上连续,且有界,即存在使;(3) 在上一次可微,且在内有. 记此类效用函数为,即 这中类型的效用函数仅能反映出财富与风险的关系,但不能反映出决策人对待风险的态度.因此中既可包含厌恶的效用函数,也可包含喜好风险和风险中立的效用函数.为此,还可以进一步分类.2 递增的凹效用函数这种效用函数是递增的,故设,而且是严格凹的,即在上具有二阶连续有界的导数.记为 实际中常用的类
11、函数有幂函数:对数函数:指数函数:根据风险和效用函数的关系,当存在,且时,定义对待风险态度的局部测度为 即是效用函数的曲率测度,可以证明:如果,则决策人的财产为时,他是厌恶风险的.如果,则决策人的财产时,他是风险中立的.如果,则决策人财产为时,他是追求风险的,而且愈大,他愈厌恶(或追求)风险.3 递增的厌恶风险的效用函数实际中,多数决策人对小额盈亏的态度是随着财富的积累而变化的,他们的财富积累愈多,对小额盈亏所冒风险的厌恶程度愈小.因此,我们假设是的非递增的函数,则可以得到一类效用函数,记为 即是的一个子类. 由于当时,是非递增的。要使,即 则故因此,类函数存在的必要条件是但不是充分条件.上面
12、给出了适应于不同情况的效用函数的基本形式,实际中需要依据具体问题的性质,来选用合适的效用函数,对问题进行研究.16.3 DVD在线租赁问题数学模型16.3.1 问题提出 随着信息时代的到来,电子商务已成为一个重要的商业途径.在线DVD租赁就是其中一种典型的经营方式,但在实际的经营过程中还是存在很多问题.下面我们从复杂的现实情况中考虑一个典型的情景. 鉴于业务量的考虑,网站有必要采用会员制度,顾客需缴纳一定数量的月费成为会员. 会员对哪些DVD有兴趣,只要在线提交订单,网站就能立即了解他们的需求,并通过快递的方式尽可能满足要求.会员提交的订单内容包括他对哪几张DVD感兴趣,对不同的DVD的偏爱度
13、,用数字表示.这些DVD是基于其偏爱程度排序的.网站会根据手头现有的DVD数量和会员的订单进行分发.每个会员每个月租赁次数不得超过2次,每次获得3张DVD.会员看完3张DVD之后,只需要将DVD放进网站提供的信封里寄回(邮费由网站承担),就可以继续下次租赁.1、由于DVD的更新速度很快,网站必须时常更新现有产品,因此在现有会员中随机抽取1000个会员进行调查,以得知愿意观看不同DVD的人数(表1.1给出了其中5种DVD的数据).虽然网站规定每位会员每月只能借两次DVD,但从历史数据显示,60%的会员每月租赁DVD两次,而另外的40%只租一次.现在我们假设网站现有10万个会员,并已经知道会员对D
14、VD的需求,以及会员每月订DVD的规律.问题是应该至少准备多少张,才能保证希望看到该DVD的会员中至少50%在一个月内能够看到?如果要求保证在三个月内至少95%的会员能够看到呢? 表1.1 对1000个会员调查的部分结果DVD名称DVD1DVD2DVD3DVD4DVD5愿意观看的人数200100502510 2、尽可能多的满足会员是经营中的一大目标,但每个会员对不同DVD的偏爱度是大相径庭的,虽然他们都对该DVD下了订单,但最后得到该张DVD收到的效果差别很大,所以还要考虑会员满意度的问题.表1.2列出了网站中20种DVD的现有张数和当前需要处理的100位会员的在线订单.如何对手中已有的DVD
15、进行分配,以使所有会员的满意度和达到最大?表1.2 现有DVD张数和当前需要处理的会员的在线订单(表格格式示例)DVD编号D001D002D003D004DVD现有数量812210会员在线订单C00010020C00021090C00030600C00040000C00055000D001D020表示20种DVD, C0001C0100表示100个会员,会员的在线订单用数字1,2,表示,数字越小表示会员的偏爱程度越高,数字0表示对应的DVD当前不在会员的在线订单中. 3、在实际的经营过程中,不可能像刚才讨论的两个问题这么简单,我们不可能将顾客的满意率与他们的满意度割裂开来分开研究,可以说这是两
16、个问题是相互牵制的关系.假设表1.2中DVD现有数量全部为0.作为网站经营管理人员,如何决定每种DVD的购买量,以及如何对这些DVD进行分配,才能使一个月内95%的会员得到他想看的DVD,并且满意度最大呢?只有弄清楚这个问题,我们才能初步的对DVD在线租赁问题有个认识. 16.3.2 问题分析 问题一类似于“货物存储问题(Inventory problem)”,基本思路是跟踪DVD在一个月(三个月)内的流动情况,目标是计算出DVD的流转次数,然后再结合满意率要求得出所需准备的DVD数量.问题二类似于“分配问题”或“指派问题(Assignment problem)”,我们可以对偏爱度进行适当的处
17、理以满足我们的要求.0-1规划是处理该问题的最佳方法,因此如何使用这一方法将是研究问题二的关键.问题三看似是问题一与问题二的结合(存贮+分配),但实际要复杂得多.它综合考虑一个月内DVD的购买、分配方案,是一个多目标线性规划.从经济效益看,在保证95%以上会员一个月内看到想看的DVD的情况下,希望购买尽量少的DVD,从社会效应看,则要尽可能多地考虑让总的满意度最大.这时,可以将多目标规划变为单目标规划,以求得一个经济与社会效益的综合最优.由于问题三牵涉到两次分配,而对会员满意率的理解又有多种解释,因此目标及约束函数会和问题一、问题二有很大差别.而问题三的模型又可从当前满意度最大和一段时间内满意
18、度最大两个角度来考虑.16.3.3 假设条件 1.对1000名会员的调查足以反映10万名会员对于各种DVD的需求及喜好;2.所有会员提交订单的时间是随机的;3.一个月的天数为30天;4.会员中有60%的会员每月租赁DVD两次,40%的会员每月租赁DVD一次;5.会员只有在需要再次租赁DVD时,才会将上次租赁的DVD归还;6.会员临近两次借的DVD种类不会重复;7.每位会员每月至少租赁1次;8.会员本次提交后没得到该DVD,则他下次仍要看该DVD,且偏爱度不变;9.每类租赁出的DVD有60%在每月租赁2次的会员中,40%在每月租赁1次的会员中;10.公司收到订单时不知道此会员在一个月内会借一次或
19、两次.在实际建模中还会遇到其他问题,比如问题一中可以淡化会员每次借三张的条件,即会员每次借的DVD数量不固定;问题二中不考虑多次分配的问题;问题三中对顾客满意率的不同理解.因此,我们将在以下讨论具体问题时再给出.16.3.4 模型建立与数值求解 参数与变量说明 :第时间节点上第种DVD的可分配量; :所有会员中愿意观看第种DVD的人的概率; :所有会员中每月借2次的人的概率; :需要满足的会员比例; :会员总数; :所考虑的时间跨度,即月份数; :第个会员对第种DVD的偏爱程度; :第个会员对第种DVD的满意度; :分配变量,表示第个会员得到第种DVD,否则为0; :网站第种DVD的现有数量.
20、其余特殊的变量将在后面的讨论中具体说明.问题一:悲观情况估计 一个月 假设DVD1其购买量为,从表1可以认为想看DVD1的有2万人,而会员一个月借1次或借2次是随机的,这就可能出现极端的情况,即第一次分配时正好所有1类会员都分配到了DVD1,我们把这种情况称为悲观情况.则的一部分首先被会员总数40%的1类会员借走了,而且在该月不会归还.那么,为了保证至少有50%的会员在一个月内能看到该DVD,则DVD1总的购买量应满足: 同理,设为愿意看第 种DVD的人的概率,可从表1中将愿意看该DVD的人数除以总人数可获,则5种DVD的购买量为:DVD名称DVD1DVD2DVD3DVD4DVD5购买量900
21、0450022501125450问题一:悲观情况估计三个月 从“一月情况”,我们可以推广到“三月情况”.如果,则每次分配都将只能由每月借一次的会员的到DVD,这样三个月中DVD1的流动量就仅为,为了保证至少有50%的会员在一个月内能看到该DVD,那么此时DVD1总的购买量应该满足 同理,对于其余4种DVD的购买量有, 为保证三个月内至少95%的会员看到他想看的DVD,每种DVD的购买量为:DVD名称DVD1DVD2DVD3DVD4DVD5购买量633431671584792317 问题一:均值情况估计现实中,每天都会有订单提交,也有DVD归还,而且都是服从参数为的普哇松分布.考虑平均情况,认为
22、:60%的会员15天归还DVD,40%的会员一个月归还,即对于每张DVD有60%的可能15天流通一次,40%的可能30天流动一次.假设所有会员在每个月的某天(不妨为1号)提交订单,那些2类会员也集中在15号归还并提交下一份订单,则可以发现上述的简化是普哇松分布的平均情况.因此,在处理时可以不考虑每个会员的具体租赁、归还的时间,而只考虑每个月两次的分配方案,即1号和15号的分配方案. 同时,在DVD租赁出去后,对于某种DVD,是均匀的分布在1类会员和2类会员中,即在15号,该DVD将有60%归还.我们用下图表示租赁情况,每块代表长度为15天的时段,上方的箭头表示该时刻借出的数量,下方表示归还的数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十六章 随机决策分析方法 第十六 随机 决策 分析 方法
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-1863622.html