最优化原理与动态规划的数学模型ppt课件.ppt
《最优化原理与动态规划的数学模型ppt课件.ppt》由会员分享,可在线阅读,更多相关《最优化原理与动态规划的数学模型ppt课件.ppt(20页珍藏版)》请在三一办公上搜索。
1、1,2 最优化原理与动态规划的数学模型,一、动态规划问题的解题思路动态规划方法的基本思路就是将一个n阶段的决策问题转化为依次求解n 个具有递推关系的单阶段决策问题,从而简化计算过程。在例8-1中,这种转化的实现是从终点E出发一步步反推,这种算法称为逆序算法。具体步骤如下:(1)考虑一个阶段的最优选择,旅行者到达E点前,上一站必然到达D1或D2,若上一站的起点为D1,则该阶段的最优决策必然是D1E,距离d(D1,E)=3,记f(D1)=3,f(D1)表示从D1出发到终点的最短距离,若旅行者上一站的起点为D2,则该阶段最优选择为D2E,f(D2)=4.,2,3,(2)综合考虑两个阶段的最优选择,当
2、旅行者离终点还有两站时,他必然位于C1,C2,C3中的某一点。若他位于C1,则他有两条路线可以选择:C1D1E或C1D2E,若将从C1到E的最短距离记为f(C1),则f(C1)=mind(C1,D1)+f(D1),d(C1,D2)+f(D2)=min1+3,4+4=4;类似的:f(C2)=mind(C2,D1)+f(D1),d(C2,D2)+f(D2)=min6+3,3+4=7;f(C3)=mind(C3,D1)+f(D1),d(C3,D2)+f(D2)=min3+3,3+4=6;,4,(3)综合考虑三个阶段的最优选择,当旅行者离终点还有三站时,他必然位于B1,B2,B3中的某一点。若他位于B
3、1,则他有三条路线可以选择:B1C1E或B1C2E,或B1C3E,若将从B1到E的最短距离记为f(B1),则f(B1)=mind(B1,C1)+f(C1),d(B1,C2)+f(C2),d(B1,C3)+f(C3)=min7+4,5+7,6+6=11;类似的:f(B2)=mind(B2,C1)+f(C1),d(B2,C2)+f(C2),d(B2,C3)+f(C3)=min3+4,2+7,4+6=7;f(B3)=mind(B3,C1)+f(C1),d(B3,C2)+f(C2),d(B3,C3)+f(C3)=min5+4,1+7,5+6=8;,5,(4)四个阶段综合考察,设旅行者从A到E的最短距离
4、为f(A),则f(A)=mind(A,B1)+f(B1),d(A,B2)+f(B2),d(A,B3)+f(B3)=min2+11,5+7,3+8=11.因此,从到的最短路线为:AB3C2D2E,最短路线长为:11。,6,二、动态规划的基本概念1.阶段(stage)是指一个问题需要作出决策的步数,通常用k表示阶段数,称为阶段变量。2.状态(state)各阶段开始时的客观条件,是动态规划问题中最关键的参数,它既反映前面各阶段决策的结局,又是本阶段决策的出发点和依据。描述各阶段状态的变量称为状态变量,通常用 表示第k阶段的状态变量。状态集合 状态变量 的取值集合。状态的性质无后效性。,7,所谓无后效
5、性是指:一旦到达某一状态,那么今后的选择只与这一状态有关,而与先前是如何到达这一状态是无关的。3.决策(decision)某阶段状态取定,可以作出不同的决定,从而决定这一阶段所收到的效果以及下一阶段的状态,这种决定称为“决策”。表示决策的变量 称决策变量。决策变量取值范围构成允许决策集合:。,8,4.策略(policy)和子策略(subpolicy)各阶段决策组成的决策序列的总体称为一个策略,含n个阶段的动态规划问题的策略可写成:从某一阶段开始到过程最终的决策序列称为子过程策略或子策略。从第k阶段起的子策略可写成:,9,5.状态转移律 从sk的某一状态值出发,当决策变量 的取值决定后,下一阶段
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 优化 原理 动态 规划 数学模型 ppt 课件
链接地址:https://www.31ppt.com/p-2082864.html