运筹学动态规划ppt课件.ppt
《运筹学动态规划ppt课件.ppt》由会员分享,可在线阅读,更多相关《运筹学动态规划ppt课件.ppt(79页珍藏版)》请在三一办公上搜索。
1、第八章 动态规划,多阶段决策过程:是指这样一类决策过程,它可以按时间分为若干阶段(称为时段),每一个阶段都需要做出决策,以便在过程的最终阶段得到最优结局。动态规划的一个重要特点是利用所谓的“最优化原理”,将问题用函数方程来表示(即递推方程),然后利用方程递推地进行计算、求解。,一、最短路线问题,最短路线问题:是指给定始点和终点,并且已知由始点到终点的各种可能的途径,需要找出由始点到终点的最短路线。这里的最短路线可以是通常意义下的距离,也可以是运输的时间或运输费用等等。,例,由A到D地要铺设一条煤气管道。其中须经过两级中间站,第一级中间站分别为B1和B2,第二级中间站分别为C1、C2、C3。两站
2、之间有连线的就表示可铺设管道,没有连线的就表示不能铺设管道。连线中间的数字表示两点间铺设管道的长度,试确定一条由A点到D点的铺设管道的最短路线。,A,B2,B1,C3,C2,C1,D,2,1,2,3,3,1,3,4,3,4,1,符号和概念,A,B2,B1,C3,C2,C1,D,2,1,2,3,3,1,3,4,3,4,1,n:表示由当前的状态到终点之间的阶段数。如由A点到D点n=3;由B2到D点n=2等等。,n=3,n=2,n=1,符号和概念,A,B2,B1,C3,C2,C1,D,2,1,2,3,3,1,3,4,3,4,1,s:表示当前所处的位置,称为状态变量。如s可以是A、B1、B2、C1、C
3、2等等。,符号和概念,A,B2,B1,C3,C2,C1,D,2,1,2,3,3,1,3,4,3,4,1,Xn(s):称为决策变量,它表示由阶段数为n的某个状态s演变到下一个阶段的某个状态,决策者做出的一种选择。如,X2(B1)表示已处于B1状态,还有2个阶段就到达D点了,此时决策者可选择的地点;X2(B1)可取C1,C2或C3。,符号和概念,A,B2,B1,C3,C2,C1,D,2,1,2,3,3,1,3,4,3,4,1,fn(s):表示由阶段数为n的某个状态s至终点的最短距离。例如,f2(B1)表示由阶段数为2的状态B1沿最优路线到达终点的距离,即B1到D点的最短距离。显然本例就是要求f3(
4、A)及f3(A)所确定的最短路线。,符号和概念,A,B2,B1,C3,C2,C1,D,2,1,2,3,3,1,3,4,3,4,1,d(s,Xn(s):表示当前处于状态s时,选取决策变量Xn(s)后,由点s到点Xn(s)的距离。例如,d(B1,C3)=1,d(C2,D)=3,分析,要求出f3(A)的值及相应的策略从起点A开始分析,A,B2,B1,C3,C2,C1,D,2,1,2,3,3,1,3,4,3,4,1,当处于状态A时,有几种可供选择的路线,A,B2,B1,C3,C2,C1,D,2,1,2,3,3,1,3,4,3,4,1,当处于状态A时,有两种可供选择的路线,AB1:表明由A点所选择的下一
5、点是B1由B1状态到终点D的最短距离为f2(B1)若选此条路线,则由A出发到达终点的最短距离可表示为 d(A,B1)+ f2(B1)AB2:表明由A点所选择的下一点是B2由B2状态到终点D的最短距离为f2(B2)若选此条路线,则由A出发到达终点的最短距离可表示为 d(A,B2)+ f2(B2),综合考虑两种情况可知,由状态A出发,到终点D的最优路线应是上述两种最短距离中的最小值,即 可见,要计算f3(A)就得先计算f2(B1)和f2(B2)。,由B1、B2点出发分别有几种可供选择的路线?,A,B2,B1,C3,C2,C1,D,2,1,2,3,3,1,3,4,3,4,1,由B1点出发有三种可供选
6、择的路线,B1C1最短距离为 d(B1,C1)+ f1(C1)B1C2最短距离为 d(B1,C2)+ f1(C2)B1C3最短距离为 d(B1,C3)+ f1(C3),综合考虑三种情况可知,由状态B1出发,到终点D的最优路线应是上述三种最短距离中的最小值,即可见,要计算f2(B1)就得先计算和f1(C1)、f1(C2)、f1(C3)。,由B2点出发有三种可供选择的路线,B2C1最短距离为 d(B2,C1)+ f1(C1)B2C2最短距离为 d(B2,C2)+ f1(C2)B2C3最短距离为 d(B2,C3)+ f1(C3),综合考虑三种情况可知,由状态B2出发,到终点D的最优路线应是上述三种最
7、短距离中的最小值,即可见,要计算f2(B2)就得先计算和f1(C1)、f1(C2)、f1(C3)。,由于由状态C1、C2、C3出发到达终点D只需经过一个阶段,所以,由以上分析可以看出,计算f3(A)的过程实际是一个倒推的过程,即由最后的阶段向前逐级进行计算。,A,B2,B1,C3,C2,C1,D,2,1,2,3,3,1,3,4,3,4,1,当n=1时,图示,A,B2,B1,C3,C2,C1,D,2,1,2,3,3,1,3,4,3,4,1,当n=2时,图示,A,B2,B1,C3,C2,C1,D,2,1,2,3,3,1,3,4,3,4,1,当n=3时,图示,A,B2,B1,C3,C2,C1,D,2
8、,1,2,3,3,1,3,4,3,4,1,所以,铺设管道的最短路线应是AB1C1D。,总结,对于最短路线问题,一般地有如下的递推关系式: 这个递推公式是根据最优化原理得到的,最优化原理,一个过程的最优策略具有这样的性质,即无论其初始状态和初始决策如何,其今后诸决策对第一个决策所形成的状态作为初始状态和过程而言,必须构成最优策略。,二、动态规划的应用,1、“背包”问题/最优装载问题,假设有一个徒步旅行者,它所能承受的旅行背包的总重量式A公斤,今有n种旅行物品供它选择装入背包中,已知,aj:第j种物品的单位重量(公斤)cj:第j种物品的单位使用价值(表明给该旅行者所带来的好处的一种数量指标)我们的
9、问题是:如何确定这n种物品的数量x1、x2、xn,使得该旅行者的背包重量不超过A公斤,而且对旅行者来说总的使用价值最大?,例,假设有以下“背包”问题 (总重量不超过5),数学模型,思路分析,给待装物品编号:1、2、n分n步装载物品。为与阶段数同一,假设从编号为n的物品开始倒序装载。即先装第n号物品,再装n-1号物品,最后装1号物品。如本例,先装3号物品,再装2号物品,最后装1号物品。,思路分析,当装n号物品时,若决定装xn件, xn 应满足以下条件( xn为决策变量、A为总重量限制),递推公式,n种物品的最大价值量= 第n种物品的价值量 + 剩余n-1种物品的最大价值量即:,状态变量的确定,“
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹学 动态 规划 ppt 课件

链接地址:https://www.31ppt.com/p-1450118.html