动态规划教学课件PPT.ppt
《动态规划教学课件PPT.ppt》由会员分享,可在线阅读,更多相关《动态规划教学课件PPT.ppt(49页珍藏版)》请在三一办公上搜索。
1、1,第六章 动态规划,1问题的提出2基本概念、基本方程与最优化原理3动态规划的应用,2,1问题的提出,一、引例 最短路径问题 下图表示从起点A到终点E之间各点的距离。求A到E的最短路径。,B,C,B,D,B,C,D,E,C,4,1,2,3,1,2,3,1,2,3,2,2,1,6,4,7,2,4,8,3,8,6,7,5,6,1,10,6,3,7,5,1,3,1问题的提出,用穷举法的计算量,非常大。讨论:1、以上求从A到E的最短路径问题,可以转化为四个性质完全相同,但规模较小的子问题,即分别从Di、Ci、Bi、A到E的最短路径问题。第四阶段:两个始点D1和D2,终点只有一个;表6-1分析得知:从D
2、1和D2到E的最短路径唯一。,4,第三阶段:有三个始点C1,C2,C3,终点有D1,D2,对始点和终点进行分析和讨论分别求C1,C2,C3到D1,D2 的最短路径问题:表6-2分析得知:如果经过C1,则最短路为C1-D2-E;如果经过C2,则最短路为C2-D2-E;如果经过C3,则最短路为C3-D1-E。,1问题的提出,5,第二阶段:有4个始点B1,B2,B3,B4,终点有C1,C2,C3。对始点和终点进行分析和讨论分别求B1,B2,B3,B4到C1,C2,C3 的最短路径问题:表6-3 分析得知:如果经过B1,则走B1-C2-D2-E;如果经过B2,则走B2-C3-D1-E;如果经过B3,则
3、走B3-C3-D1-E;如果经过B4,则走B4-C3-D1-E。,1问题的提出,6,第一阶段:只有1个始点A,终点有B1,B2,B3,B4。对始点和终点进行分析和讨论分别求A到B1,B2,B3,B4的最短路径问题:表6-4最后,可以得到:从A到E的最短路径为A B4 C3 D1 E,1问题的提出,7,以上计算过程及结果,可用图2表示,可以看到,以上方法不仅得到了从A到E的最短路径,同时,也得到了从图中任一点到E的最短路径。以上过程,仅用了22次加法,计算效率远高于穷举法。,B,C,B,D,B,C,D,E,C,4,1,2,3,1,2,3,1,2,3,3,2,1,6,4,7,2,4,8,3,8,6
4、,7,5,1,6,10,6,0,10,6,12,11,11,12,13,14,14,12,7,5,1,2,1问题的提出,8,1问题的提出,从引例的求解过程中可以得到以下启示:(1)对一个问题是否用上述方法求解,其关键在与能否将问题转化为相互联系的多个阶段的决策问题。(2)对问题的求解是从全局考虑解决局部(阶段)的问题。(3)各阶段选取的决策依赖于当前的状态,又随即引起状态的转移,整个决策序列就是在变化的状态中产生出来,故有“动态”含义。(4)决策过程是与阶段发展过程逆向而行。,9,1问题的提出,二、动态规划的含义及适用范围1.动态规划 动态规划是解决一类多阶段决策问题的优化方法,它是考察问题的
5、一种途径,而不是一种算法。多阶段决策问题:把一个问题看作是一个前后关联具有链状结构的多阶段过程,也称为序贯决策过程。2.适用范围 如果一个问题可将其过程划分为若干个相互联系的阶段问题,且它的每一阶段都需要进行决策,则这类问题均可用动态规划方法进行求解。,10,一、基本概念 1.阶段和阶段变量 用动态规划方法求解问题时,首先将问题的全过程适当地分成若干个互相联系的阶段,以便能按一定的次序去求解。阶段的划分,一般根据时序和空间的自然特征来划分。如引例可按照空间划分为4个阶段。阶段变量:描述阶段的变量称为阶段变量。用k表示,引例中,k=1,2,3,4.2.状态和状态变量sk 状态就是阶段的起始位置。
6、它既是该阶段某支路的起点,又是前一阶段某支路的终点。状态可以是数量,也可以是字符,数量状态可以是连续的,也可以是离散的。,2基本概念、基本方程与最优化原理,11,2基本概念、基本方程与最优化原理,状态变量:描述过程状态的变量称为状态变量。它可用一个数、一组数或一向量(多维情形)来描述,常用sk第k阶段的状态变量。通常一个阶段有若干个状态。第k阶段的状态就是该阶段所有始点的集合。3.决策与决策变量 决策:在某阶段对可供选择状态的决定(或选择)。决策变量:描述决策的变量。常用xk(sk)表示第k阶段处于状态sk时的决策变量,它是状态变量的函数。4.策略与子策略 策略是一个决策序列的集合。由所有各阶
7、段的决策组成的决策函数序列称为全过程策略,简称策略,记为:P1,n(s1)。子策略:从第k个阶段开始到最后阶段的决策组成的决策函数序列称为k子过程策略,简称子策略,记为:Pk,n(sk)最优策略:能够达到总体最优的策略。,12,2基本概念、基本方程与最优化原理,5.状态转移方程 它是确定过程由某一阶段的一个状态到下一阶段另一状态的演变过程,用sk+1=Tk(sk,xk)表示。该方程描述了第k阶段到第k+1阶段的状态转移规律。因此又称为状态转移函数。6.阶段指标函数rk(sk,xk)从状态sk出发,选择决策xk所产生的第k阶段指标。7.最优指标函数fk(sk)表示从第k阶段的状态sk开始采用最优
8、子策略,到第n 阶段的终止时所得到的最优指标函数值。,13,二、基本方程最优指标的递推方程(动态规划的基本方程):对于可加性指标函数,上式可以写为 上式中“opt”表示“max”或“min”。对于可乘性指标函数,上式可以写为 终端条件:为了使以上的递推方程有递推的起点,必须要设定最优指标的终端条件,一般最后一个状态n+1下最优指标fn+1(sn+1)=0。,2基本概念、基本方程与最优化原理,14,三、最优化原理 作为整个过程的最优策略具有如下性质:不管在此最优策略上的某个状态以前的状态和决策如何,对该状态来说,以后的所有决策必定构成最优子策略。就是说,最优策略的任意子策略都是最优的。,2基本概
9、念、基本方程与最优化原理,15,2基本概念、基本方程与最优化原理,四、动态规划求解过程(1)将问题的过程划分成恰当的阶段;(2)正确选择状态变量sk,使它能够恰当地描述过程的演变;(3)确定决策变量xk;(4)正确写出状态转移方程sk+1=Tk(sk,xk);(5)写出最优指标的递推方程:,fn+1(sn+1)=0 终点条件,16,一、资源分配问题 例2.某公司拟将某种设备5台,分配给所属的甲、乙、丙三个工厂。各工厂获得此设备后,预测可创造的利润如表10-5所示,问这5台设备应如何分配给这3个工厂,使得所创造的总利润为最大?表8-5,3 动态规划的应用,17,解:(1)划分阶段:将问题按工厂分
10、为三个阶段,甲、乙、丙三个厂分别编号为1、2、3厂。(2)确定状态变量:设sk=分配给第k个厂至第3个厂的设备台数(k=1、2、3)。(3)确定决策变量:设xk=分配给第k个设备台数。(4)写出状态转移方程。已知s1=5,并有,3 动态规划的应用,18,第三阶段:表66,3 动态规划的应用,19,第二阶段:表67,3 动态规划的应用,20,第一阶段:把台设备分配给第1,第2,第3厂时,最大盈利为其中可取值0,1,2,3,4,5.数值计算见表88 表6-8 然后按计算表格的顺序推算,可知最优分配方案有两个:1.由于,根据,查表67可知,再由,求得。即分配给甲厂0台,乙厂2台,丙厂3台。2.由于,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 动态 规划 教学 课件 PPT
链接地址:https://www.31ppt.com/p-2966015.html