运筹学第五章动态规划.ppt
《运筹学第五章动态规划.ppt》由会员分享,可在线阅读,更多相关《运筹学第五章动态规划.ppt(48页珍藏版)》请在三一办公上搜索。
1、第五章 动态规划,动态规划简介,动态规划所解决的问题:多阶段问题,动态规划的核心。,动态规划的应用。,动态规划的优缺点。,核心:在于将问题公式化,也可以说,动态规划是将多阶段决策问题进行公式化的一种技术。,应用:工程、军事和商业等领域,优缺点:适用范围广,模型算法一体化,方便编程。一方面是大量的中间计算结果要求记录,造成对内存的较大需求;另一方面是由于没有统一的标准模型,使得动态规划的应用难度增加。,在现实中,我们经常会碰到需要做前后相互关联的具有链状结构的多次决策才可以解决的问题,也经常会遇到一些经过巧妙设计后可以转化为具有上述多次决策特点而得以解决的问题,我们称这样的问题为多阶段决策问题。
2、,例如,许多工程项目都能根据工程进度或者空间位置等,被分解成相应于整个事件的多个阶段来进行计划;许多涉及到要求回报最大的资金投入问题,都能通过将不同的投资方案表示成不同阶段的方式进行规划;也有一些静态规划(如线性规划、非线性规划等)在人为引入“时间”因素后,可以转化为多阶段决策的问题,而解决这些问题的最常用的就是动态规划方法。,返回,图5.1 例5.1示图,5.1 动态规划的基本概念和模型,5.1.1 动态规划的基本概念 下面结合实例来介绍动态规划的基本概念:【例5.1】如图5.1所示,在处有一水库,现需从点铺设一条管道到点,弧上的数字表示与其相连的两个地点之间所需修建的渠道长度,请找出一条由
3、到的修建线路,使得所需修建的渠道长度最短。,【例5.2】未来四个月里,利用一个仓库经销某种商品。该仓库的最大容量为1000件,每月中旬定购商品,并于下月初取到订货。据估计:今后四个月这种商品的购价和售价,如表5-1所示。假定商品在第一个月初开始经销时仓库已经存有该种商品500件,每月市场不限,问:应如何计划每个月的订购与销售数量,使这四个月的总利润最大(不考虑仓库的存储费用)?,记作:,动态规划基本概念,1.阶段与阶段变量,2.状态与状态变量,3.决策与决策变量,5.状态转移方程,4.策略,记作:,记作:,记作:,记作:,记作:,,,允许决策集,6.指标函数与最优函数,阶段是针对所给的问题,依
4、据其若干个相互联系的不同部分,给出的对整个过程的自然划分。通常根据时间顺序或空间特征来划分阶段,以便按阶段的次序解决优化问题。从数学角度看,我们引入了一个变量来表示阶段,通常称为阶段变量,记作:。如果将整个问题分成了 个阶段,则。如例5.1中,在从 到 的过程中,依据按位置所作决策的次数及所作决策的先后次序,将问题分为4个阶段,记为;。例5.2中,在从第一个月到第四个月的整个经销过程中,依据按月所作决策的次数及所作决策的先后次序,将问题分为4个阶段,记为:。,返回,返回,后,作决策,就是在相应的允许决策集内确定一组,值,其结果是确定了下一阶段的状态,即仓库的库存量。,在例5.1中,作决策,就是
5、在所处位置选择下一步应遵循的路线,比如在状态 处作决策,就是从 中选取一条路线,此时如果再假设选取了路线,那么决策者在 处所作决策就是,即就是,而状态 处允许决策集就是,其结果是确定了下一阶段的状态。在例5.2中,作决策,就是在当前第 阶段库存量为 的情况下,决定当月的定购量和销售量,在依次引入决策变量,和与其相应的允许决策集,返回,后部子策略,简称为 子策略,记作,即,。,把从第一阶段 状态开始的子策略称为全策略,简称策略,记作,即,如例5.1中,为从起始状态 开始的一个全策略,为从第3阶段状态 开始的一个3子策略。在例5.2中,每个阶段既不订购也不销售,即,或 为从起始状态 开始的一个全策
6、略,为第2阶段 状态开始的一个2子策略。,在实际问题中,可供选择的策略有一定的范围,此范围称为允许策略集合,用 表示。而把允许策略集合中达到最优效果的策略称为最优策略。,返回,例5.2中,在第二阶段状态 下作了决策 和 后,则当转移到第三阶段时,状态便已确定为。,状态转移描述了相邻阶段的状态与状态之间的关联关系。我们称这一关联关系的数学描述为状态转移方程。通常我们把描述第 阶段状态 到第 阶段的状态 转移规律的函数记作:。,同时对第 阶段的状态,一旦前一阶段达到 的决策变量取定,则第 阶段状态 也可以反推出来。我们把这一状态转移的过程用函数描述,记作:,,它表示若在从第 阶段到达第 阶段状态
7、的过程中作的决策是,则第 阶段起始状态为。,通常在第 阶段某确定的状态 下,一旦决策变量 取定,则第 阶段的状态 也就确定,我们将这一过程称为状态转移。,如例5.1中,在第二阶段状态 下作决策 后,则当转移到第三阶段时,状态便已确定为;,返回,把衡量某一阶段决策效果的数量指标,称为阶段指标,记作:。指标可以是距离、利润、成本、产量和资源消耗等。通俗地讲,就是某一阶段决策对目标的贡献。,通俗地讲,就是 子策略对目标的贡献。通常指标函数与阶段指标应具有下述关系:其中 依具体情况而定,一般表示加法或乘法。指标函数的最优值,称为最优值函数,记为。即:,把衡量所实现的子策略优劣的数量指标称为指标函数,记
8、作,在例5.2中,,其中 依具体情况取 或。它表示在从第 阶段的状态 开始到第 阶段的终止状态 的允许策略集中,采用 最优子策略所得到的指标函数值。,如例5.1中,,(5-1),类似有前部 子策略的指标函数和最优函数与全策略的指标函数和最优值函数,依次如下:,,,;,,,。,返回,5.1.2 动态规划的模型,一般地,动态规划模型包括节(1)至(6)中所提到的诸要素。很显然,要建立动态规划问题的模型,一般可按以下步骤来进行:,(1)把问题的过程划分为恰当的个 阶段,引入阶段变量;,(2)正确选择状态变量,使它既能描述过程的演变,又能满足无后效性,同时给出状态可能集;,(3)确定决策变量 及每个阶
9、段的允许决策集;,(6)写出最优函数。,(4)写出状态转移方程;,(5)指出阶段指标及指标函数;,5.2 动态规划的原理与求解,5.2.1 动态规划的最优化原理,下面我们先研究一下例5.1这个特殊问题的求解。最短路线问题有一个重要特性:如图,有,在引入一个虚拟的第五阶段后,可将第五阶段到第五阶段的指标记为,上述过程则可以用一个带有初始条件 的递推公式来完全描述:,显然从 开始,有,当 时,当 时,;,;,;,(5-2),当 时,,当 时,,可以求得 的最短距离12,然后根据计算过程中的记录,反向追踪可求得最短路线,最短路线为,或,,,,,,,;,;,。,,,。,。,注:而事实上,从各点到 的最
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹学 第五 章动 规划
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5849625.html