《动态规划模型》PPT课件.ppt
《《动态规划模型》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《动态规划模型》PPT课件.ppt(27页珍藏版)》请在三一办公上搜索。
1、动态规划模型,例1:最短线路问题,问题:现选择一条从 到 的铺管线路,使总距离最短?,若用穷举法要算23222148种不同线路,比较这48种结果即可得出,但当段数增加,且各段选择也增加时,穷举法将变得非常庞大,以至利用计算机都十分困难。,下面用动态规划的方法计算,最短线路问题的特性:,如果最短线路在第k站通过点,则这一线路在由 出发到达终点的那一部分线路,对于从 点到达终点的所有可能选择的不同线路来说,必定也是距离最短的。(反正法),最短线路问题的这一特性启示我们,从最后一段 开始,用从后向前逐步递推的方法,求出各点到 的最短线路,最后求得从 到 的最短线路。,k6时:,设 表示由 到 的最短
2、距离;,设 表示由 到 的最短距离;,显然,k5时:,如果 表示由 到 的最短距离。,最短线路是,最短线路是,最短线路是,k4时:,最短线路是,最短线路是,最短线路是,k3时:,最短线路是,最短线路是,最短线路是,最短线路是,k2时:,最短线路是,最短线路是,出发点只有,最短线路是,最短距离为18。,说明,1)此例揭示了动态规划的基本思想。,2)动态规划方法比穷举法(48种)大大节省了计算量。,3)计算结果不仅得到了 到 的最短线路和最短距离,而且得到了其它各点到 的最短线路和最短距离,这对于很多实际问题来说是很有用处的。,动态规划法求解的数学描述,讨论动态规划中最优目标函数的建立,一般有下列
3、术语和步骤:,、阶段,用动态规划求解多阶段决策系统时,要根据具体情况,将系统适当地分成若干个阶段,以便分若干个阶段求解,描述阶段的变量称为阶段变量。,上例分六个阶段,是一个六阶段的决策过程。例中由系统的最后阶段向初始阶段求最优解的过程称为动态规划的逆推解法。,、状态,状态表示系统在某一阶段所处的位置或状态。,上例中第一阶段有一个状态,,第二阶段有两个状态,,过程的状态可用状态变量 来描述,某个阶段所有可能状态的全体可用状态集合来描述,,、决策,某一阶段的状态确定之后,从该状态演变到下一阶段某一状态所作的选择称为决策。描述决策的变量称为决策变量,如上例中在第k阶段用 表示处于 状态时的决策变量。
4、,决策变量限制的范围称为允许决策集合。,用 表示第k阶段从 出发的决策集合。,、策略,由每阶段的决策(i1,2,n)组成的决策函数序列称为全过程策略或简称策略,用p表示,,由系统的第k个阶段开始到终点的决策过程称为全过程的后部子过程,相应的策略称为后部子过程策略。,用 表示k子过程策略,,对于每一个实际的多阶段决策过程,可供选择的策略有一定的范围限制,这个范围称为允许策略集合。,允许策略集合中达到最优效果的策略称为最优策略。,、状态转移,某一阶段的状态变量及决策变量取定后,下一阶段的状态就随之而定。,设第k个阶段的状态变量为,决策变量为,则第k+1个阶段的状态 用 表示从k阶段到k+1阶段的状
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 动态规划模型 动态 规划 模型 PPT 课件

链接地址:https://www.31ppt.com/p-5472801.html