《运筹学动态规划》PPT课件.ppt
《《运筹学动态规划》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《运筹学动态规划》PPT课件.ppt(64页珍藏版)》请在三一办公上搜索。
1、第四章 动态规划,Dynamic Programming(DP),动态规划是运筹学的一个重要分支,是解决多阶段决策过程最优化问题的一种非常有效的方法。1951年,美国数学家贝尔曼(R.Bellman)等人,根据一类多阶段决策问题的特点,把多阶段决策问题变换为一系列相互联系的单阶段决策问题,然后分阶段逐个加以解决。,动态规划是分析某一类问题的一种途径。它不像LP那样有一个标准的数学表达式和明确定义的一组规则,而必须对具体问题进行具体分析处理。因此,在学习动态规划时,除了对基本概念和方法正确地理解外,应以丰富的想象力去建立模型,用创造性的技巧去求解。,本章主要研究离散决策过程,介绍动态规划的基本概
2、念、理论和方法,并通过一些典型的应用问题说明它的应用。,4.1 多阶段决策过程的最优化,4.2 动态规划的基本概念及原理,4.3 动态规划模型的建立和求解,4.1 多阶段决策过程的最优化,一、多阶段决策过程,整个决策过程可按时间或空间顺序分解成若干相互联系的阶段(“时段”),在每一阶段都要作出决策,全部过程的决策是一个决策的序列。,某厂有1000台机器,现需作一个五年计划,以决定每年安排多少台机器投入高负荷生产(产量大但损耗也大)可使五年的总产量最大,如图4-1所示。,例4-1 时间阶段示例(机器负荷问题),图4-1 机器负荷问题,例4-2 空间阶段示例(最短路线问题),给定线路网络图如下,各
3、点间连线上的数字表示距离,现要从A地向G地铺设一条输油管道,问应选择什么路线,使总距离最短?,图4-2,二、多阶段决策过程最优化的目标,生产存储问题投资决策问题设备更新问题,三、示 例,达到整个活动过程的总体效果的最优,而非各单个阶段最优的简单总和。,4.2 动态规划的基本概念和基本原理,一、基本概念,1、阶段2、状态3、决策和策略4、状态转移方程5、指标函数,例4-2 最短路线问题,给定线路网络图如下,各点间连线上的数字表示距离,现要从A地向G地铺设一条输油管道,问应选择什么路线,使总距离最短?,图4-2,1、阶段(stage),将所给问题的过程,按时间或空间特征分解成若干互相联系的阶段,用
4、k表示。如例4-2中,问题分为AB、BC共6个阶段,k=6。,2、状态(state),指各阶段开始时过程所处的自然状况或客观条件。状态应具有“无后效性”,即当前阶段状态给定时,这个阶段以后过程的演变与该阶段以前各阶段的状态无关。,如:S1=A,S2=B1,B2,,3、决策(decision)与策略(policy),当某一阶段的状态确定后,可以作出不同的决定或选择,从而确定下一阶段的状态,这种决定或选择称为决策。,如:从第二阶段的状态B1出发,可以选择下一阶段 的C1C3,即 D2(B1)=C1,C2,C3 若决定选择C3,则 d2(B1)=C3,一组有序的决策序列构成一个策略,从第k 阶段至第
5、n 阶段的一个策略称为后部子策略,记为 Pkn(dk,dk+1,dn)。,例4-2,4、状态转移方程,系统由一个阶段的一个状态转变到下一个阶段的另一个状态称为状态转移。其对应状态和决策的关系称为状态转移方程。记为,5、阶段指标,衡量在一个阶段某个状态下各决策所对应的某种数量指标或效果,记为,6、指标函数,衡量所选策略优劣的数量指标或效果。最优指标函数表示从第k 个阶段采用最优策略 到过程终止时的最佳效益值,记为,例4-2 最短路线问题,穷举法动态规划法,得最优线路为:,该点到G点的最短距离,图4-3,上述最短路线的计算过程可用图直观表示(标号法),如图4-3所示,结点上方矩形内的数字表示该点到
6、终点的最短距离。,标号法过程,B1,A,C3,F2,F1,E3,E2,E1,D3,D2,D1,C4,C2,C1,B2,G,5,3,1,3,6,8,7,6,6,8,3,5,3,4,2,1,3,8,2,2,3,3,3,5,5,2,6,6,4,3,4,3,7,5,9,7,6,8,13,10,9,12,13,16,18,图4-4,二、最优化原理,Bellman 最优化原理:“一个过程的最优策略具有这样的性质,即无论开始的状态及初始的决策如何,对先前决策所形成的状态而言,其以后所有的决策必构成最优决策后部子过程最优”,三、动态规划基本思路,1、将问题划分多个阶段。恰当选择状态变量、决策变量 及定义最优指
7、标函数2、从边界条件开始,逆向或正向逐段递推求解。3、各个阶段的最优决策是从全局考虑的,并非仅考虑本阶段。,其基本方程为,建立动态规划的模型,就是分析问题并建立问题的动态规划基本方程,成功地应用动态规划方法的关键,在于识别问题本身的多阶段特征,将问题分解成为可用递推关系式联系起来的若干子问题。而正确建立基本递推关系方程的关键又在于正确选择状态变量。,4.3 DP模型的建立与求解,一、DP模型的建立,1、正确、明确地划分阶段 k,k=1,2,3,n。2、正确选择并确定状态变量 sk 及状态集合 Sk。,3、确定决策变量 dk 及决策集合 Dk(sk)。4、写出状态转移方程 sk+1=Tk(sk,
8、dk)。5、定义阶段指标值(函数)vk(sk,dk)。,6、定义第 k至 n 阶段的最优指标函数 fk(sk);7、建立动态规划基本方程(逆序递推方程),例4-3 分配投资问题,问题的一般描述如下:设有某种资源,总数量为a,用于生产n种产品;若分配数量 xi 用于生产第i种产品,其收益为gi(xi)。问应如何分配,使得使总收益最大?,该类问题可用动态规划进行求解:,例如:,某公司有资金10万元,若投资于项目 k(k=1,2,3)的投资额为 xk 时,收益分别为 g1(x1)=4x1,g2(x2)=9x2,g3(x3)=2x32,问应该如何分配投资数额才能使总收益最大?该问题表面上看与时间无明显
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运筹学动态规划 运筹学 动态 规划 PPT 课件

链接地址:https://www.31ppt.com/p-5611029.html