第八章动态规划ppt课件.ppt
《第八章动态规划ppt课件.ppt》由会员分享,可在线阅读,更多相关《第八章动态规划ppt课件.ppt(64页珍藏版)》请在三一办公上搜索。
1、第八章 动态规划,第一节 动态规划原理和模型第二节 一维动态规划求解方法第三节 动态规划在经济和管理中的应用,第一节 动态规划原理和模型,一、引例与动态规划的基本概念二、动态规划的原理三、动态规划模型的建立,动态规划是50年初由美国数学家R.Bellman等人提出的解决多阶段决策过程优化问题的“最优化原理”基础上建立起来的。动态规划是将一个较复杂的多阶段决策问题分解为若干相互关联的较容易求解的子决策问题,而每一个子决策问题都有多种选择,并且当一个子决策问题确定以后,将影响另一个子决策问题,从而影响到整个问题的决策。,一、动态规划的基本概念,动态规划模型分为(1)离散模型;(2)连续模型。本章只
2、讨论与离散模型有关原理和方法。这对连续模型也适用。下面通过一个多阶段决策过程的例子引入动态规划的基本概念、原理和方法。,例8.1(最短路问题)某运输公司拟将一批货物从A地运往E地,其间的交通系统网络如图8-1所示。图上节点表示地点,边表示两地之间的道路,边上的数字表示两地间的运输费用,求运输费用最低的运输路线。,相关的概念:,A,B1,B2,B3,C1,C2,C3,D1,D2,E,第2阶段,第3阶段,第4阶段,第1阶段,5,4,12,3,3,11,3,6,4,4,4,1,6,5,7,9,8,(1) 阶段 将所给问题的过程,按时间或空间特征分解成若干互相联系的阶段,按次序去求每阶段的解,用字母k
3、表示阶段变量。,A,B1,B2,B3,C1,C2,C3,D1,D2,E,第2阶段,第3阶段,第4阶段,第1阶段的状态,第2阶段的状态,第1阶段,5,4,12,3,3,11,3,6,4,4,4,1,6,5,7,9,s1状态A ,s2?,S1=A,S2=B1、B2、B3,S3=C1、C2、C3,S4=D1、D2。,8,(2)状态 状态就是阶段的起始位置。通常一个阶段包含若干个状态。第k阶段的状态就是该阶段所有始点的集合。描述各阶段状态的变量称为状态变量。常用sk表示第k阶段的状态变量。状态变量的取值集合称为状态集合,用Sk表示。,3)决策决策是某阶段状态给定之后,从该状态演变到下一阶段某一状态的选
4、择。表示决策的变量称为决策变量,用uk(sk)表示第阶段,状态为sk时的决策变量,它是状态变量的函数。实际问题中,决策变量的选取往往受到某些条件的影响而限制于某一范围,此范围称为允许决策集合。,A,B1,B2,B3,C1,C2,C3,D1,D2,E,第2阶段,第3阶段,第4阶段,第1阶段的状态,第2阶段的状态,第1阶段,5,4,12,3,3,11,3,6,4,4,4,1,6,5,7,9,在例8.1中,u2(B1)就表示第2阶段状态为B1时的决策变量(它或等于C1或等于C3),即,从第2阶段的状态B1出发,可到达下一阶段的C1或者C3,所以这一阶段的允许决策集D2(B1)=C1,C3。,8,4)
5、策略各阶段决策确定后,组成的一个有序的决策序列就构成了一个策略。 称为全过程的一个策略,简称策略。 称为由第k阶段开始到最后阶段止的一个子策略,简称后部子策略。 使整个问题到达最优效果的策略称为最优策略。 动态规划方法就是要从允许策略集中找出最优策略。,A,B1,B2,B3,C1,C2,C3,D1,D2,E,第2阶段,第3阶段,第4阶段,第1阶段的状态,第2阶段的状态,第1阶段,5,4,12,3,3,11,3,6,4,4,4,1,6,5,7,9,A,EA,B2,C3,D2,E就是一个策略。,8,B2,EB2,C3,D2,E就是一个子策略。,A,B1,B2,B3,C1,C2,C3,D1,D2,E
6、,第2阶段,第3阶段,第4阶段,第1阶段的状态,第2阶段的状态,第1阶段,5,4,12,3,3,11,3,6,4,4,4,1,6,5,7,9,状态转移方程为 sk+1=uk(sk),8,5)状态转移方程 它是确定过程由某一阶段的一个状态到下一阶段另一状态的演变过程,用sk+1=Tk(sk,uk)表示。该方程描述了由第k阶段到第k+1阶段的状态转移规律。因此又称其为状态转移函数。,指标函数是用来衡量多阶段决策过程优劣的一种数量指标。 一个n 阶段决策过程,从1到n 称为问题的原过程,对于任意一个给定的k(1kn),从第k 阶段到第n 阶段的过程称为原过程的一个后部子过程。 用 V1,n(s1,p
7、1,n)表示初始状态为s1 采用策略p1,n 时,原过程的指标函数值。 Vk,n(sk,pk,n)表示在第k 阶段,状态为sk采用策略pk,n 时,后部子过程的指标函数值。 从第k 阶段状态 sk采用最优策略 p*k,n 到过程终止时的最佳效益值,称为最优指标函数。记为fk(sk)。,6)指标函数,A,B1,B2,B3,C1,C2,C3,D1,D2,E,第2阶段,第3阶段,第4阶段,第1阶段的状态,第2阶段的状态,第1阶段,5,4,12,3,3,11,3,6,4,4,4,1,6,5,7,9,V2,4(B1):表示在第2阶段,状态为B1时,从B1到E的距离。f2(B1)则表示从B1到E的最短距离
8、。,8,二、动态规划的原理,在例8.1中,整个运输路程分为四个阶段,见图8.2。下面给出求解的全过程。这里我们采用倒推的方法,即从终点(E)到起点(A)。,1第4阶段,即从E到D,从E出发倒推到下一站D,它可通过D1,也可通过D2,所需费用分别为5和3。如果现处于状态D1,到终点E的最佳路线费用:f4(D1)=5,最优策略:u4(D1)=E。如果现处于状态D2,到终点E的最佳路线费用:f4(D2)=3,最优策略:u4(D2)=E。,第3阶段,当从E到达D后,有两个状态D1和D2; 若处于状态D1,则可到达C1或C2,则费用分别为9或7。 若处于状态D2,则可到达C1或C2或C3,费用分别为8或
9、12或5。从E经D1到达C1或C2 的费用,应加上E到达D1这段的费用,所以费用分别为5+9=14、5+7=12;从E经D2到达C2或C2或C3 的费用,应加上E到达D2这段的费用,所以费用分别为3+8=11、3+12=15、3+5=8。,如果现在处于C1,则到达终点E的最小费用为:最小费用路线为 相应的最优决策u3(C1)=D2。如果现在处于C2,则到达终点E的最小费用为:最小费用路线为 。相应的最优决策:,如果现在处于C3,到达终点E的最小费用为:最小费用路线为 相应的最优决策,3第2阶段,同上。如果现处于B1,到达终点E的最小费用为:最小费用路线为 相应的最优决策如果现处于B2,则到达终
10、点E的最小费用为:最小费用路线为 相应的最优决策如果现处于B3,则到达终点E的最小费用为:最小费用路线为 相应的最优决策,4在第1阶段A处,则到达终点E的最小费用为:最小费用路线为: 相应的最优决策:所以,整个问题的最小费用路线为:最优策略为: , , , 。,在每一阶段的求解,都利用了第k阶段和第k+1 阶段的如下关系:,这种关系称为动态规划的基本方程。,所谓最优化原理是:一个过程的最优决策具有这样的性质:无论初始状态及初始决策如何,对于先前决策所形成的状态而言,其以后的所有决策应构成最优策略。,三、动态规划模型的建立,用动态规划解决实际问题,就要建立动态规划模型,为此需要解决如下问题:1.
11、 划分阶段2. 确定状态变量和决策变量以及相应的取值范围3. 建立状态转移方程4. 确定指标函数,建立动态规划的基本方程5. 确定边界条件,1. 划分阶段 按照时间、空间、变量划分为若干阶段。 建立动态规划模型要求每个阶段问题具有同一模式。2. 确定状态变量和决策变量以及相应的取值范围 决策过程可用状态演变描述。状态必须包含表示系统情况和确定决策所需要的全部信息,反映过程的演变特征。无后效性。找出状态变量在各阶段的取值范围。决策变量由系统最优化的目的所决定。3. 建立状态转移方程 根据状态变量和决策变量的含义,写出状态转移方程。4. 确定指标函数,建立动态规划的基本方程 选取指标函数,根据指标
12、函数建立最优指标函数递推关系,即基本方程5. 确定边界条件,例8.2. 有一工厂研制甲、乙、丙三种新产品,估计这三种新产品研制成功的概率分别为:0.6、0.4、0.3。由于工厂急于推出新产品,决定再加拨2万元研制费,以提高新产品研制成功的概率。据估计,把增加的研制费用于各种新产品研制时,研制成功的概率见下表。现把这批研制费分配给各新产品(不分配、分配给1万元或分配给2万元),使这三种新产品都研制成功的概率最大。应怎样分配。,划分阶段 把对某一种新产品增加研制费用作为一个阶段,将整个过程分为三个阶段。对甲产品增加研制费用记为第1阶段、对乙产品增加研制费用记为第2阶段、对丙产品增加研制费用记为第3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 章动 规划 ppt 课件
链接地址:https://www.31ppt.com/p-1355760.html