运筹学课件-第七章动态规划.ppt
《运筹学课件-第七章动态规划.ppt》由会员分享,可在线阅读,更多相关《运筹学课件-第七章动态规划.ppt(81页珍藏版)》请在三一办公上搜索。
1、第七章 动态规划,动态决策问题:决策过程具有阶段性和时序性(与时间有关)的决策问题。即决策过程可划分为明显的阶段。动态规划(D.P.Dynamic Program):动态规划是解决多阶段决策过程最优化问题的一种方法。广泛应用于工业技术、生产管理、企业管理、经济、军事等领域。可用于解决最优路径问题、资源分配问题、生产计划与库存、投资、装载、排序等问题及生产过程的最优控制等。动态规划(D.P.)的起源:1951年,(美)数学家R.Bellman等提出最优化原理,从而建立动态规划,名著动态规划于1957年出版。动态决策问题分类:1、按数据给出的形式分为:离散型动态决策问题。连续型动态决策问题。2、按
2、决策过程演变的性质分为:确定型动态决策问题。随机型动态决策问题。其中离散确定型是最基本的,本章主要针对这种类型的问题,介绍动态规划的基本思想、原理和方法,这些对其它类型的问题也适用。,第七章 动态规划,一、多阶段决策过程的最优化二、基本概念和基本原理三、动态规划模型的建立与求解四、动态规划在经济管理中的应用,一、多阶段决策过程的最优化,多阶段决策过程:多阶段决策过程,本意是指这样一类特殊的活动过程,它们可以按时间顺序分解成若干相互联系的阶段,称为“时段”,在每一个时段都要做出决策,全部过程的决策是一个决策序列,所以多阶段决策问题属序贯决策问题。动态的含义:动态规划方法与“时间”关系很密切,随着
3、时间过程的发展而决定各时段的决策,产生一个决策序列,这就是“动态”的意思。多阶段决策过程最优化的目标:达到整个活动过程的总体效果最优。,例1 生产与存贮问题 某工厂每月需供应市场一定数量的产品,并将所余产品存入仓库。一般某月适当增加产量可降低生产成本,但超产部分存入仓库会增加库存费用。要求确定一个逐月的生产计划,在满足需求条件下,使一年的生产与存贮费用之和最小。显然,可以把每个月作为一个阶段,全年分为12个阶段逐次决策。例2 投资决策问题 某公司现有资金Q万元,在今后5年内考虑给A,B,C,D 4个项目投资,这些项目投资的回收期限、回报率均不相同,问该公司应如何确定这些项目每年的投资额,使到第
4、5年末拥有资金的本利总额最大。这是一个5阶段决策问题。例3 设备更新问题 企业在使用设备时都要考虑设备的更新问题,因为设备越陈旧所需的维修费用越多,但购买新设备则要一次性支出较大的费用;现某企业要决定一台设备未来8年的更新计划,已预测了第j年购买设备的价格为Kj,设Gj为设备经过j年后的残值,Cj为设备连续使用j-1年后在第j年的维修费(j1,2,8),问应在哪些年更新设备可使总费用最小。这是一个8阶段决策问题,每年年初要作出决策,是继续使用旧设备,还是购买新设备。,几个例子,几个例子,例4、(基建投资问题)一家公司有三个工厂,每个厂都需要进行扩建。公司用于扩建的资金总共为7万元。各个厂的投资
5、方案及扩建后预期可获得的利润如表所示(单位:万元)。,现在公司要确定时各厂投资多少才能使公司的总利润达到最大?解:在这个问题中,因为每个厂都有几种投资方案,所以要对每个厂作出一项决策,总共要作出三个决策。同时,这三个厂的总投资不能超过7万元。如果我们把每个厂看成是一个阶段,这就是一个多阶段的决策问题。,几个例子,例5、(货船装运问题)有四种货物准备装到一艘货船上。第i(i12,3,4)种货物的每一箱重量是wi(单位:吨),其价值是vi(单位:干元),如表所示。,假定这艘货船的总载重量是10吨,现在要确定这四种货物应各装几箱才能使装载货物的总价值达到最大。解:在这个问题中,因为对每一种货物要确定
6、装载的箱数,也就是要作出一项决策,所以总共要作出四个决策。同时,各种货物的总重量不能超过10吨。如果我们把每一种货物看成是一个阶段,这也是一个多阶段的决策问题。,几个例子,例6、(最短路程问题)假定从A地到E地要铺设一条管道,其中要经过若干个中间点(如图)。,图中两点之间连线上的数字表示两地间的距离,现在要选择一条铺设管道的路线使总长度最短。解:在问题中,从A到B1,B2,B3中的哪一个点要作出一项决策,从B1,B2,B3中的某点到C1,C2,C3中的哪一个点又要作出一项决策等。所以总共要作出四个决策。因此可以把整个路程分为A,B(包括B1,B2,B3),C(包括C1,C2,C3)和D(包括D
7、l,D2)四个阶段。这是个多阶段的决策问题。,二、动态规划的基本概念和基本原理,1、阶段:将所给问题的过程,按时间或空间特征分解成若干互相联系的阶段,以便按次序去求每阶段的解,常用字母k表示阶段变量。,动态规划模型要用到的概念:(1)阶段;(2)状态;(3)决策和策略;(4)状态转移;(5)指标函数。,2、状态:各阶段开始时的客观条件叫做状态。状态变量:描述各阶段状态的变量,用sk表示第k阶段的状态变量状态集合:状态变量的取值集合,用Sk表示。动态规划中的状态应具有如下性质:当某阶段状态给定以后,在这阶段以后过程的发展不受这段以前各段状态的影响。无后效性。,一阶段:S1A二阶段:S2B1,B2
8、,B3三阶段:S3C1,C2,C3四阶段:S4D1,D2,3、决策:当各段的状态取定以后,就可以作出不同的决策(或选择),从而确定下一阶段的状态,这种决定称为决策。决策变量:表示决策的变量,称为决策变量,常用uk(sk)表示第k阶段当状态为sk时的决策变量。允许决策集合:决策变量的取值往往限制在一定范围内,我们称此范围为允许决策集合,用Dk(sk)表示第k阶段从状态sk出发的允许决策集合。,D2(B1)=C1,C2D2(B2)=C1,C2,C3如状态为B1时选择C2,可表示为:u2(B1)=C2,策略:各段决策确定后,整个问题的决策序列就构成一个策略,用p1,nu1(s1),u2(s2),.u
9、n(sn)表示。对每个实际问题,可供选择的策略有一定范围,称为允许策略集合,记作P1,n,使整个问题达到最优效果的策略就是最优策略。,4、状态转移方程:动态规划中本阶段的状态往往是上一阶段状态和上一阶段的决策结果。第k段的状态sk,本阶段决策为uk(sk),则第k+1段的状态sk+1也就完全确定,它们的关系可用公式表示:sk+1=Tk(sk,uk),sk+1=uk(sk),5、指标函数:用于衡量所选定策略优劣的数量指标。它分为阶段指标函数和过程指标函数。阶段指标函数是指第k段,从状态sk出发,采取决策uk时的效益,用d(sk,uk)表示。d(B1,C2)一个n段决策过程,从1到n叫作问题的原过
10、程,对于任意一个给定的k(1k n),从第k段到第n段的过程称为原过程的一个后部子过程。V1,n(s1,p1,n)表示初始状态为s1采用策略p1,n时原过程的指标函数值;而Vk,n(sk,pk,n)表示在第k段,状态为sk采用策略pk,n时,后部子过程的指标函数值。最优指标函数记为fk(sk)表示从第k段状态sk采用最优策略到过程终止时的最佳效益值。,f2(B1),f1(A),动态规划的基本思想,最简单的方法穷举法。共有多少条路径,依次计算并比较。动态规划方法本方法是从过程的最后一段开始,用逆序递推方法求解,逐步求出各段各点到终点的最短路线,最后求得起始点到终点的最短路线。,动态规划的基本思想
11、,第一步:k=5状态s5:E1,E2,(4),(3),f5(E1)4,f5(E2)3,第二步:k=4 状态:D1 D2 D3,u4*(D1)=E1,u4*(D2)=E2,u4*(D3)=E1,(7),(5),(5),第三步:k=3 状态:C1 C2 C3 C4,u3*(C1)=D1,u3*(C2)=D2,u3*(C3)=D2,f3(C1)12,f3(C2)10,f3(C3)8,u3*(C4)=D3,f3(C4)9,(12),(10),(8),(9),第四步:k=2状态:B1 B2,u2*(B1)=C2,u2*(B2)=C3,f2(B1)13,f2(B2)15,(13),(15),第五步:k=1
12、状态:A,u1*(A)=B1,f1(A)17,(17),即从A到F的最短距离为17。最优路线为:AB1C2D2E2F,练习:,求从A到E的最短路径,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f5(E)=0,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D1)=5,f5(E)=0,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C
13、1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f4(D1)=5,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C1)=8,f4(D1)=5,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C2)=7,f4(D1)=5,f3(C1)=8,2,5,1,12,14,10,6
14、,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f3(C1)=8,f3(C2)=7,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f2(B1)=20,f3(C2)=7,f3(C1)=8,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,
15、2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f2(B2)=14,f3(C2)=7,f3(C1)=8,f2(B1)=21,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f2(B3)=19,f3(C2)=7,f3(C1)=8,f2(B1)=21,f2(B2)=14,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6
16、,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f2(B3)=19,f3(C2)=7,f3(C1)=8,f1(A)=19,f2(B2)=14,f2(B1)=21,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f2(B3)=19,f3(C2)=7,f3(C1)=8,f1(A)=19,f2(B2)=14,f2(B1)=2
17、1,状态 最优决策 状态 最优决策 状态 最优决策 状态 最优决策 状态,A(A,B2)B2,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f2(B3)=19,f3(C2)=7,f3(C1)=8,f1(A)=19,f2(B2)=14,f2(B1)=21,状态 最优决策 状态 最优决策 状态 最优决策 状态 最优决策 状态,A(A,B2)B2(B2,C1)C1,2,5,1,12,14,10,6,10,4,13,11,12
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹学 课件 第七 章动 规划

链接地址:https://www.31ppt.com/p-6434595.html