管理运筹学课件第9章动态规划.ppt
《管理运筹学课件第9章动态规划.ppt》由会员分享,可在线阅读,更多相关《管理运筹学课件第9章动态规划.ppt(25页珍藏版)》请在三一办公上搜索。
1、第9章 动态规划,课件,2,2023/11/4,教学目标与要求,【教学目标】1.理解下列基本概念:状态变量,决策变量,策略,状态转移方程,指标函数和最优值函数2.理解动态规划的基本方程和最优化原理3.理解动态规划模型建立过程5.掌握顺序算法与逆序算法解题方法【知识结构】,课件,3,2023/11/4,引例 马车驿站问题,E,E,D1D2,D1D2,D1D2,D1D2,C2C3C4,C1C2C3,1,D1E,1,D2E,2,C4D1 C4D2,2,C3D1 C3D2,2,C2D1 C2D2,2,C1D1C1D2,3,B2C2B2C3B2C4,3,B1C1B1C2B1C3,B1B2,2,AB1AB
2、2,A,一共有2321=12条不同的路线,f(E)=0,f(D1)=2,f(D2)=1,f(C1)=8,f(C2)=5,f(C3)=4,f(C1)=5,f(B1)=8,f(B2)=11,f(A)=13,回顾分析过程:1.将分析对象划分成4阶段;2.每阶段始点状态与终点状态有关,而不考虑始终点状态如何形成(无记忆性);3.每阶段各始点状态为终点状态与始点至终点距离之和的最小值(状态转移)这种最优化方法称为动态规划,由美国数学家贝尔曼等人于20世纪50年代创立.,课件,4,2023/11/4,本章主要内容,9.1 动态规划的概念和原理9.1.1 动态规划的基本概念9.1.2 动态规划的最优化原理9
3、.2 动态规划的模型和求解9.2.1 动态规划模型的建立9.2.2 动态规划问题的解法9.3 应用举例案例1 资源分配问题案例2 设备负荷问题案例3 生产库存问题案例4 背包问题本章小结,课件,5,2023/11/4,9.1.1 动态规划的基本概念,1.阶段:把所给问题的过程,恰当地分为若干个相互联系的阶段,以便能按一定的次序去求解。描述阶段的变量称为阶段变量,常用k表示。导入案例中k=1,2,3,4,2.状态变量:每个阶段开始所处的自然状况或客观条件(用点集表示).如引例:第1阶段的状态就是起点A,记为s1=A;第2阶段有2个状态B1,B2,记为s2=B1,B2;第3阶段有4个状态C1,C2
4、,C3,C4,记为s3=C1,C2,C3,C4;第4阶段有2个状态D1,D2,记为s4=D1,D2;,3.决策变量:在某一阶段的某个状态时的不同选择,如引例中B1状态下有3种选择:B1C1,B1C2,B1C3这3种选择构成了允许决策的集合。不同状态下允许决策的集合也不同,故决策变量是状态变量的函数,即xk(sk)D(sk),4.策略按顺序排列的决策组成的集合,由过程的第k阶段开始到终止状态为止的过程(或k子过程),k子过程的策略称子策略,记为Pk,n(sk),即 Pk,n(sk)=xk(sk),xk+1(sk+1),xn(sn)当k=1时,即为全过程的一个策略。如引例中:DE,即4到5过程起始
5、有2个状态,D1和D2,因此有P4,5=D1E,D2E,5.状态转移方程确定过程是由一个状态到另一个状态的演变过程。第k阶段状态变量值给定后,如果确定决策变量,第k+1阶段状态变量值就完全确定。即:sk+1=T(sk,xk)如引例中:若对AB1,AB2选择了AB1,则s2=5,B1到C有3种选择:B1C1、B1C2、B1C3,若选择了B1C2,则s3=s2+d(B1,C2)=8,6.指标函数用来衡量所实现过程优劣的一种数量指标。其基本方程有加法和乘法两种形式,通常加法形式用的较多,其公式为:,7.边界条件起始或终止条件。,课件,6,2023/11/4,5.1.2 动态规划的基本原理,最优化原理
6、(Optimality principle):最优策略具备这样的性质:无论初始状态与初始决策如何,以后诸决策对以第一个决策所形成的状态作为初始状态的过程而言,必然构成最优策策略.通俗地说:最优策略的子策略也是最优的.例如,在导入案例中,最优策略是AB1C2D1E,最短距离为13,其子策略:B1C2D1E,C2D1E,D1E也是最优的。依据这一原理,从后往前推各阶段最优子过程,从而得到全程最优过程。,设f(i)表示从点i到终点E的最短距离,d(i,j)表示点i,j之间的距离.显然f(E)=0,为该问题的边界条件.,k=4,决策:D1E,k=3,决策:D2E,决策:C1D1,决策:C2D1,k=2
7、,决策:C3D2,决策:C4D2,决策:B1C2,决策:B2C3,k=1,决策:AB1,最短路线:AB1C2D1E最短路长:13,课件,7,2023/11/4,5.1.2 动态规划的最优化原理,课件,8,2023/11/4,9.2.1 动态规划模型的建立,解 把生产第k种产品看成是第k阶段,划分为n个阶段.设 sk表示第k阶段初资源可用量(状态变量)xk表示分配给第k阶段资源的数量(决策变量),显然有:允许决策集合 sk+1=sk-xk(状态转移方程)s1=a(边界条件)指标函数:若fk(sk)表示数量为sk资源分配给第k种产品时,从第k阶段到第n阶段总收益,则有:,课件,9,2023/11/
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 管理 运筹学 课件 章动 规划
链接地址:https://www.31ppt.com/p-6485777.html