动态规划基础部分教学PPT.ppt
《动态规划基础部分教学PPT.ppt》由会员分享,可在线阅读,更多相关《动态规划基础部分教学PPT.ppt(31页珍藏版)》请在三一办公上搜索。
1、动态规划-基础部分,动态规划的重要性:,涉及动态规划的各种竞赛题越来越多,每一年的NOI几乎都至少有一道题目需要用动态规划的方法来解决。,什么是动态规划?,动态规划是解决多阶段决策问题的一种方法。,多阶段决策问题,如果一类活动过程可以分为若干个互相联系的阶段,在每一个阶段都需作出决策(采取措施),一个阶段的决策确定以后,常常影响到下一个阶段的决策,从而就完全确定了一个过程的活动路线,则称它为多阶段决策问题。,例 下图表示城市之间的交通路网,线段上的数字表示费用,单向通行由A-E。求A-E的最省费用。,如图从A到E共分为4个阶段:第一阶段从A到B第二阶段从B到C第三阶段从C到D第四阶段从D到E。
2、除起点A和终点E外,其它各点既是上一阶段的终点又是下一阶段的起点。,概念状态(State):表示事物的性质,是描述“动态规划”中的“单元”的量。亦是每一阶段求解过程的出发点。阶段(Stage):阶段是一些性质相近,可以同时处理的状态集合,或者说,阶段只是标识那些处理方法相同、处理顺序无关的状态。决策(Decision):每个阶段做出的某种选择性的行动,是程序所需要完成的选择。状态转移方程:用数学公式描述与阶段相关的状态间的演变规律。,上一阶段的状态,决策,下一阶段的状态,(1)D1,D2是第一次输入的结点。他们到E都只有一种费用,在D1框上面标5,D2框上面标2。目前无法定下,那一个点将在全程
3、最优策略的路径上。第二阶段计算中,5,2都应分别参加计算。(2)C1,C2,C3是第二次输入结点,他们到D1,D2各有两种费用。此时应计算C1,C2,C3分别到E的最少费用。C1的决策路径是 min(C1D1),(C1D2)。计算结果是C1+D1+E,在C1框上面标为8。同理C2的决策路径计算结果是C2+D2+E,在C2框上面标为7。同理C3的决策路径计算结果是C3+D2+E,在C3框上面标为12。此时也无法定下第一,二阶段的城市那二个将在整体的最优决策路径上。,实现过程:,实现过程:,(3)第三次输入结点为B1,B2,B3,而决策输出结点可能为C1,C2,C3。仿前计算可得Bl,B2,B3的
4、决策路径为如下情况。Bl:B1C1费用 12+8=20,路径:B1+C1+D1+EB2:B2C1费用 6+8=14,路径:B2+C1+D1+EB3:B2C2费用 12+7=19,路径:B3+C2+D2+E此时也无法定下第一,二,三阶段的城市那三个将在整体的最优决策路径上。,实现过程:,(4)第四次输入结点为A,决策输出结点可能为B1,B2,B3。同理可得决策路径为A:AB2,费用5+14=19,路径 A+B2+C1+D1+E。,在上例的多阶段决策问题中,各个阶段采取的决策,一般来说是与时间有关的,决策依赖于当前状态,又随即引起状态的转移,一个决策序列就是在变化的状态中产生出来的,故有“动态”的
5、含义,称这种解决多阶段决策最优化问题的方法为动态规划方法。,应用动态规划要注意阶段的划分是关键,必须依据题意分析,寻求合理的划分阶段(子问题)方法。而每个子问题是一个比原问题简单得多的优化问题。而且每个子问题的求解中,均利用它的一个后部子问题的最优化结果,直到最后一个子问题所得最优解,它就是原问题的最优解。,记忆化算法在求解的时候还是按着自顶向下的顺序,但是每求解一个状态,就将它的解保存下来,以后再次遇到这个状态的时候,就不必重新求解了。这种方法综合了搜索和动态规划两方面的优点,因而还是很有实用价值的。,动态规划的适用条件:,必须满足以下两个条件(1)状态必须满足最优化原理;动态规划的最优化原
6、理是无论过去的状态和决策如何,对前面的决策所形成的当前状态而言,余下的诸决策必须构成最优策略。可以通俗地理解为子问题的局部最优将导致整个问题的全局最优。在上例中例题1最短路径问题中,A到E的最优路径上的任一点到终点E的路径也必然是该点到终点E的一条最优路径,满足最优化原理。即:问题的最优解包含了其中一个子问题的最优解。,如图,已知一个有向图,求一条从最左边的点走到最右边点的方案(只能从左往右走),使得所经过的权值和除以4的余数最小。,MOD 4余数最小问题,设所有点从左至右编号为14,MIN(i)表示前i个点的最优值,很容易得出一个方程:Min(i)=min(Min(i-1)+numi-1,1
7、)mod 4,Min(I-1)+numi-1,2)mod 4 通过这个方程可以求出一条路径为(2+3+1)MOD 4=2但最优值实际上是(2+1+1)MOD 4=0。为什么会出错呢?,分析,(2).无后效性 动态规划的某阶段的状态一旦确定,则此后过程的演变不再受此前各状态及决策的影响。也就是说,“未来与过去无关”,当前的状态是此前历史的一个完整总结,此前的历史只能通过当前的状态去影响过程未来的演变。具体地说,如果一个问题被划分各个阶段之后,阶段 i 中的状态只能由阶段 i+1 中的状态通过状态转移方程得来,与其他状态没有关系,特别是与未发生的状态。,动态规划的适用条件:,题目分析:请问“拔河比
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 动态 规划 基础 部分 教学 PPT
链接地址:https://www.31ppt.com/p-2309658.html