七章节动态规划.ppt
《七章节动态规划.ppt》由会员分享,可在线阅读,更多相关《七章节动态规划.ppt(70页珍藏版)》请在三一办公上搜索。
1、第七章 动态规划,一、多阶段决策过程的最优化二、基本概念和基本原理三、动态规划模型的建立与求解四、动态规划在经济管理中的应用,动态规划(D.P.Dynamic Program)是解决多阶段决策过程最优化问题的一种方法。广泛应用于工业技术、生产管理、企业管理、经济、军事等领域。可用于解决最优路径问题、资源分配问题、生产计划与库存、投资、装载、排序等问题及生产过程的最优控制等。动态的含义:动态规划方法与“时间”关系很密切,随着时间过程的发展而决定各时段的决策,产生一个决策序列,这就是“动态”的意思。,一、多阶段决策过程的最优化,动态规划的起源:1951年,(美)数学家R.Bellman等人,根据多
2、阶段序贯决策问题的特点,提出了著名的“最优性原理”。将多阶段决策问题转变为一系列的互相联系的单阶段决策问题,然后,逐个阶段予以解决,最后再形成总体解决。从而创建了求解优化问题的新方法动态规划。1957年,他的名著动态规划出版。最优性原理:作为整个过程的最优策略具有这样的性质:即无论过去的状态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优子策略。简言之,最优策略的子策略总是最优的。,一、多阶段决策过程的最优化,动态决策问题:决策过程具有阶段性和时序性(与时间有关)的决策问题。即决策过程可划分为明显的阶段。动态决策问题分类:1、按数据给出的形式分为:离散型动态决策问题。连续型动
3、态决策问题。2、按决策过程演变的性质分为:确定型动态决策问题。随机型动态决策问题。,一、多阶段决策过程的最优化,例1 生产与存贮问题要求确定一个逐月的生产计划,在满足需求条件下,使一年的生产与存贮费用之和最小?例2 投资决策问题某公司现有资金Q万元,在今后5年内考虑给A,B,C,D 4个项目投资?例3 设备更新问题现企业要决定一台设备未来8年的更新计划,问应在哪些年更新设备可使总费用最小?,一、多阶段决策过程的最优化,例4 基建投资问题 一家公司有三个工厂,每个厂都需要进行扩建。公司用于扩建的资金总共为7万元。各个厂的投资方案及扩建后预期可获得的利润如表所示(单位:万元)。,现在公司要确定时各
4、厂投资多少才能使公司的总利润达到最大?,一、多阶段决策过程的最优化,例5 货船装运问题 有四种货物准备装到一艘货船上。第i(i12,3,4)种货物的每一箱重量是wi(单位:吨),其价值是vi(单位:干元),如表所示。,假定这艘货船的总载重量是10吨,现在要确定这四种货物应各装几箱才能使装载货物的总价值达到最大?,一、多阶段决策过程的最优化,例6 最短路程问题 假定从A地到E地要铺设一条管道,其中要经过若干个中间点(如图)。,图中两点之间连线上的数字表示两地间的距离,现在要选择一条铺设管道的路线使总长度最短。,一、多阶段决策过程的最优化,二、基本概念和基本原理,1、阶段:将所给问题的过程,按时间
5、或空间特征分解成若干互相联系的阶段,以便按次序去求每阶段的解,常用字母k表示阶段变量。,动态规划模型要用到的概念:(1)阶段;(2)状态;(3)决策和策略;(4)状态转移;(5)指标函数。,2、状态:各阶段开始时的客观条件叫做状态。状态变量:描述各阶段状态的变量,用sk表示第k阶段的状态变量。状态集合:状态变量的取值集合,用Sk表示。,一阶段:S1A二阶段:S2B1,B2,B3三阶段:S3C1,C2,C3四阶段:S4D1,D2,二、基本概念和基本原理,3、决策:当各段的状态取定以后,就可以作出不同的决定(或选择),从而确定下一阶段的状态,这种决定称为决策。决策变量:表示决策的变量,称为决策变量
6、,常用uk(sk)表示第k阶段当状态为sk时的决策变量。允许决策集合:决策变量的取值往往限制在一定范围内,我们称此范围为允许决策集合,用Dk(sk)表示第k阶段从状态sk出发的允许决策集合。,D2(B1)=C1,C2 D2(B2)=C1,C2,C3如状态为B1时选择C2,可表示为:u2(B1)=C2,二、基本概念和基本原理,策略:各段决策确定后,整个问题的决策序列就构成一个策略,用p1,nu1(s1),u2(s2),.un(sn)表示。允许策略集合:对每个实际问题,可供选择的策略有一定范围,称为允许策略集合,记作P1,n,使整个问题达到最优效果的策略就是最优策略。,p1,4B1,C1,D1,E
7、,二、基本概念和基本原理,4、状态转移方程:动态规划中本阶段的状态往往是上一阶段状态和上一阶段的决策结果。第k段的状态sk,本阶段决策为uk(sk),则第k+1段的状态sk+1也就完全确定,它们的关系可用公式表示:sk+1=Tk(sk,uk),sk+1=uk(sk),二、基本概念和基本原理,5、指标函数:用于衡量所选定策略优劣的数量指标。它分为阶段指标函数和过程指标函数。阶段指标函数是指第k段,从状态sk出发,采取决策uk时的效益,用d(sk,uk)表示。d(B1,C2)一个n段决策过程,从1到n叫作问题的原过程,对于任意一个给定的k(1k n),从第k段到第n段的过程称为原过程的一个后部子过
8、程。V1,n(s1,p1,n)表示初始状态为s1采用策略p1,n时原过程的指标函数值;Vk,n(sk,pk,n)表示在第k段,状态为sk采用策略pk,n时,后部子过程的指标函数值。最优指标函数记为fk(sk):表示从第k段状态sk采用最优策略到过程终止时的最佳效益值。,二、基本概念和基本原理,最简单的方法穷举法。共有多少条路径,依次计算并比较。动态规划方法本方法是从过程的最后一段开始,用逆序递推方法求解,逐步求出各段各点到终点的最短路线,最后求得起始点到终点的最短路线。,二、基本概念和基本原理,练习:,求从A到E的最短路径。,二、基本概念和基本原理,2,5,1,12,14,10,6,10,4,
9、13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f5(E)=0,二、基本概念和基本原理,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D1)=5,f5(E)=0,二、基本概念和基本原理,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f4(D1)=5,二、基本概念和基本原理,2,5,1,1
10、2,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C1)=8,f4(D1)=5,二、基本概念和基本原理,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C2)=7,f4(D1)=5,f3(C1)=8,二、基本概念和基本原理,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C
11、3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f3(C1)=8,f3(C2)=7,二、基本概念和基本原理,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f2(B1)=20,f3(C2)=7,f3(C1)=8,二、基本概念和基本原理,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A
12、,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f2(B2)=14,f3(C2)=7,f3(C1)=8,f2(B1)=21,二、基本概念和基本原理,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f2(B3)=19,f3(C2)=7,f3(C1)=8,f2(B1)=21,f2(B2)=14,二、基本概念和基本原理,2,5,1,12,14,10,6,10,4,13
13、,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f2(B3)=19,f3(C2)=7,f3(C1)=8,f1(A)=19,f2(B2)=14,f2(B1)=21,二、基本概念和基本原理,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f2(B3)=19,f3(C2)=7,f3(C1)=8,f1(
14、A)=19,f2(B2)=14,f2(B1)=21,状态 最优决策 状态 最优决策 状态 最优决策 状态 最优决策 状态,A(A,B2)B2,二、基本概念和基本原理,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f2(B3)=19,f3(C2)=7,f3(C1)=8,f1(A)=19,f2(B2)=14,f2(B1)=21,状态 最优决策 状态 最优决策 状态 最优决策 状态 最优决策 状态,A(A,B2)B2(B2,
15、C1)C1,二、基本概念和基本原理,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,f4(D2)=2,f5(E)=0,f3(C3)=12,f4(D1)=5,f2(B3)=19,f3(C2)=7,f3(C1)=8,f1(A)=19,f2(B2)=14,f2(B1)=21,状态 最优决策 状态 最优决策 状态 最优决策 状态 最优决策 状态,A(A,B2)B2(B2,C1)C1(C1,D1)D1,二、基本概念和基本原理,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 章节 动态 规划
链接地址:https://www.31ppt.com/p-5354585.html