运筹学课件-动态规划.ppt
《运筹学课件-动态规划.ppt》由会员分享,可在线阅读,更多相关《运筹学课件-动态规划.ppt(68页珍藏版)》请在三一办公上搜索。
1、2023/5/29,运筹学课件,动态规划,8.1 多阶段决策问题与动态规划 8.2 动态规划的基本概念 8.3 动态规划的步骤 8.4 动态规划的应用 1 求解静态规划问题 2 资源分配问题 3 不确定性采购问题 4 排序问题,2023/5/29,运筹学课件,动态规划所研究的对象是多阶段决策问题。所谓多阶段决策问题是指一类活动过程,它可以分为若干个相互联系的阶段,在每个阶段都需要作出决策。这个决策不仅决定这一阶段的效益,而且决定下一阶段的初始状态。每个阶段的决策确定以后,就得到一个决策序列,称为策略。多阶段决策问题就是求一个策略,使各阶段的效益的总和达到最优。,8.1 多阶段决策问题与动态规划
2、,2023/5/29,运筹学课件,安全过河问题,古代有3位商人各自带了一个仆人外出来到了一个渡口,渡口只有一条小船每次只能乘2人,仆人私下约定只要岸上的仆人人数超过商人人数,就可杀人越货.但是过河的决策由商人制定.问商人如何安全的渡过河去?,2023/5/29,运筹学课件,2023/5/29,运筹学课件,一、多阶段决策问题1.时间阶段的例子(机器负荷问题)某厂有1000台机器,现需作一个五年计划,以决定每年安排多少台机器投入高负荷生产(产量大但损耗也大)可使五年的总产量最大。,8.1 多阶段决策问题与动态规划,2023/5/29,运筹学课件,2.空间阶段的例子(最短路问题)如图为一线路网络。现
3、要从A点铺设一条管道到E点,图中两点间连线上数字表示两点间距离。现需选一条由A到E的铺管线路,使总距离最短。,2023/5/29,运筹学课件,动态规划,解决问题的基本特征,1.动态规划一般解决最值(最优,最大,最小,最长)问题;,2.动态规划解决的问题一般是离散的,可以分解(划分阶段)的;,3.动态规划解决的问题必须包含最优子结构,即可以由(n1)的最优推导出n的最优,2023/5/29,运筹学课件,动态规划模型的分类:以“时间”角度可分成:离散型和连续型。从信息确定与否可分成:确定型和随机型。从目标函数的个数可分成:单目标型和多目标型。,2023/5/29,运筹学课件,1.基本概念,阶段(S
4、tage)分步求解的过程,用阶段变量k表示,k=1,n,状态(State)每阶段初可能的情形或位置,用状态变量Sk表示。按状态的取值是离散或连续,将动态规划问题分为 离散型和连续型。,决策(Decision)每阶段状态确定后的抉择,即从该状态演变到下阶段某状态的选择,用决策变量xk表示。,状态转移由Sk转变为Sk+1的规律,记Sk+1=T(Sk,xk)。,策略(Policy)由各阶段决策组成的序列,记P1n=x1,xn,称Pkn=xk,xn为阶段k至n的后部子策略。,8.2基本概念与方程,2023/5/29,运筹学课件,当前状态,以前状态,决策,显然,从上图可以看出,当前状态通过决策,回到了以
5、前状态.可见决策其实就是状态之间的桥梁。而以前状态也就决定了当前状态的情况。,K,Sk,Sk+1,Xk,Vk,2023/5/29,运筹学课件,过河:决策向量xk(I,J)初始状态s1是T(3,3)结束状态sn是 T(0,0)可达状态有哪些?(3,J)(2,2)(1,1)(0,J),0,3,2,1,1,2,3,A,J,I,I 表示留在左岸的商人人数J 表示留在左岸的仆人人数,2023/5/29,运筹学课件,阶段指标每阶段选定决策xk后所产生的效益,记 vk=vk(Sk,xk)。,指标函数各阶段的总效益,记相应于Pkn的指标函数 为vkn=vkn(Sk,Pkn)。其中最优的称最优 指标函数,记 f
6、k=fk(Sk)=opt vkn。,问题:动态规划的最优解和最优值各是什么?,最优解:最优策略P1n,最优值:最优指标f1。,2023/5/29,运筹学课件,多阶段决策过程,2023/5/29,运筹学课件,2.基本原理与基本方程,(1)基本原理,以最短路为例说明,2023/5/29,运筹学课件,(2)基本方程,根据最优性原理,可建立从后向前逆推求解的递推公式基本方程:,通常动态规划问题的最优值函数满足递推关系式.。,边界条件,2023/5/29,运筹学课件,动态规划求解的一般步骤:-确定过程的分段,构造状态变量;-设置决策变量,写出状态转移;-列出阶段指标和指标函数;-写出基本方程,由此逐段递
7、推求解。,K,Sk,Sk+1,Xk,Vk,8.3 动态规划的求解方法,2023/5/29,运筹学课件,例1 用动态规划方法求解前面的最短路问题。,1.离散型,求解方法,2023/5/29,运筹学课件,标号法求解在每个节点上标出从该节点到终点的最短距离,始端,终端,0,5,2,8,7,12,20,14,19,19,1,2,3,4,逆序解法,2023/5/29,运筹学课件,请在每个节点上标出从该节点到始点的最短距离,顺序解法,2023/5/29,运筹学课件,解:设阶段k=1,2,3,4依次表示4个阶段选路的过程;,状态sk表示k阶段初可能处的位置;,决策xk表示k阶段初可能选择的路;,阶段指标vk
8、表示k阶段与所选择的路段相应的路长;,指标函数 vk4=表示k至4阶段的总路长;,用表格方式求解,逆推,2023/5/29,运筹学课件,4,3,8,7,12,C1D1E,C2D2E,C3D2E,2023/5/29,运筹学课件,2,2023/5/29,运筹学课件,1,A,19,AB2C1D1E,f1=19,(最短路)(最短距),2023/5/29,运筹学课件,作业:用表格方式法求解8.2,并给出阶段,状态变量,决策变量.状态转移方程和指标函数;最优值函数,2023/5/29,运筹学课件,2023/5/29,运筹学课件,2.连续型(用公式递推求解),例2 用动态规划方法求解前面的机器负荷问题。某种
9、机器可以在高、低两种负荷下进行生产。高负荷年产量8,年完好率0.7;低负荷年产量5,年完好率0.9。现有完好机器1000台,需制定一个5年计划,以决定每年安排多少台机器投入高、低负荷生产,使5年的总产量最大。,2023/5/29,运筹学课件,阶段指标vk=8xk+5(sk-xk)表示第k年的产量;指标函数vkn=表示第k至5年的总产量;,解:设阶段k=1,5表示第k年安排机器的过程;状态sk表示第k年初的完好机器台数;决策xk表示第k年投入高负荷的机器台数;则投入低负荷的台数为sk-xk;状态转移sk+1=0.7xk+0.9(sk-xk);,2023/5/29,运筹学课件,f5(S5)是关于x
10、5的单调增函数 x5*=S5 f5(S5)=8S5,2023/5/29,运筹学课件,5年的最大总产量为23.721000=23720。,2023/5/29,运筹学课件,逆推解法的特点:,始端已知,终端边界值取0或1,1.已知初始状态s12.最优值函数fk(sk)表示第k阶段的初始状态为sk,从k阶段到n阶段的最优值.该问题的最优值f1(s1)3.边界条件是fn+1=0或者14.递推关系是 fk(sk)=opt(vk+fk+1),2023/5/29,运筹学课件,第四节 动态规划应用举例 本节将通过动态规划的四种应用类型静态规划问题的动态规划求解、资源分配问题、复合系统可靠性问题、设备更新问题,进
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹学 课件 动态 规划

链接地址:https://www.31ppt.com/p-5009586.html