第十章动态规划ppt课件.ppt
《第十章动态规划ppt课件.ppt》由会员分享,可在线阅读,更多相关《第十章动态规划ppt课件.ppt(114页珍藏版)》请在三一办公上搜索。
1、-4-2-3-3,行变换,列变换,-1,-1-1,+1,-1-1,+1,+1,-1,X*=,Z*=7+2+3+3=15,复习指派问题的匈牙利解法:,第十章,Dynamic Programming,概 述,动态规划是解决多阶段决策过程最优化问题的一种方法,该方法是由美国数学家贝尔曼(R Bellman)等人20世纪50年代初提出的。他们针对多阶段决策问题的特点,提出了解决这类问题的最优化原理,并成功地解决了生产管理、工程技术等方面的许多实际问题,从而建立了运筹学的一个新分支,即动态规划。,例1、最短路径问题,求从A到E的最短距离和最短路径,例2 多阶段资源分配问题,设有数量为x的某种资源,将它投
2、入两种生产方式A和B中:以数量y投入生产方式A,剩下的量投入生产方式B,则可得到收入g(y)+h(x-y),其中g(y)和h(x-y)是已知函数,并且g(0)=h(0)=0;同时假设以y与x-y分别投入两种生产方式A,B后可以回收再生产,回收率分别为a与b。试求进行n个阶段后的最大总收入?,若以y与x-y分别投入生产方式A与B,在第一阶段生产后回收的总资源为x1=ay+b(x-y),再将x1投入生产方式A和B,则可得到收入:g(y1)+h(x1-y1)继续回收资源x2=ay1+b(x1-y1),若上面的过程进行n个阶段,我们希望选择n个变量y,y1,y2,yn-1,使这n个阶段的总收入最大。,
3、分 析,因此,我们的问题就变成:求y,y1,y2,yn-1,以使g(y)+h(x-y)+g(y1)+h(x1-y1)+g(yn-1)+h(xn-1-yn-1)达到最大,且满足条件 x1=ay+b(x-y)x2=ay1+b(x1-y1)xn-1=ayn-2+b(xn-2-yn-2)yi与xi均非负(i=1,2,n-1),分 析,多阶段决策问题 所谓多阶段决策问题是指一类活动过程,它可以分为若干个相互联系的阶段,在每个阶段都需要作出决策。这个决策不仅决定这一阶段的效益,而且决定下一阶段的初始状态。,动态规划的研究对象,动态规划是现代企业管理中的一种重要决策方法:,资源分配问题生产计划与库存问题装载
4、问题生产过程的最优控制问题,独特的解题思路,离散决策过程,连续决策过程,确定性决策过程,随机性决策过程,离散确定性决策过程,离散随机性决策过程,连续确定性决策过程,连续随机性决策过程,动态规划模型的分类:,第十章 动态规划,第一节 动态规划基本概念第二节 动态规划基本原理第三节 动态规划模型的建立与求解第四节 动态规划在经济管理中的应用,(1)阶段:将所给问题的全过程按照时间或空间特征分解成若干相互联系的部分,以便按次序去求解每部分的解,称为阶段,一般用n表示阶段总数,用k表示阶段变量,k=1,2,n。,第一节 动态规划基本概念,k=1,k=2,k=3,k=4,(2)状态:每个阶段开始时所处的
5、自然状况或客观条件称为该阶段的状态。描述各阶段状态的变量称为状态变量,常用sk表示;状态变量的取值集合称为状态集合,用Sk表示,第一节 动态规划基本概念,k=1,k=2,k=3,k=4,当k=1时,s1=A S1=A当k=2时,s2=B1或B2或B3 S2=B1,B2,B3 当k=3时,s3=C1或C2或C3 S3=C1,C2,C3 当k=4时,s4=D1或D2 S4=D1,D2,第一节 动态规划基本概念,第一节 动态规划基本概念,(3)决策:某一阶段内的选择。当各阶段的状态取定以后,就可以作出不同的决策(或选择),从而确定下一阶段的状态,这种决定称为决策。表示决策的变量称为决策变量,常用xk
6、(sk)表示第k阶段当状态为sk时的决策变量;在实际问题中,决策变量的取值往往限制在一定范围内,称此范围为允许决策集合,常用Dk(sk)表示第k阶段从状态sk出发的允许决策集合,显然有:xk(sk)Dk(sk),k=1,k=2,k=3,k=4,x1(s1):x1(A)=B1或B2或B3 D1(A)=B1,B2,B3 x2(s2):x2(B1)=C1或C2或C3 D2(B1)=C1,C2,C3 x2(B2)=C1或C2或C3 D2(B2)=C1,C2,C3 x2(B3)=C1或C2或C3 D2(B3)=C1,C2,C3.,(4)状态转移函数:动态规划中本阶段的状态往往是由上一阶段状态和上一阶段的
7、决策决定的。如果给定了第k阶段的状态sk,本阶段的决策xk(sk),则第k+1阶段的状态sk+1也就完全确定了,它们关系可用方程表示为:sk+1=Tk(sk xk)由于它表示了由k段到k+1段的状态转移规律,所以称为状态转移方程。,第一节 动态规划基本概念,k=1,k=2,k=3,k=4,s1=A x1(A)=B1或B2或B3s2=B1或B2或B3 x2(B1)=C1或C2或C3 x2(B2)=C1或C2或C3 x2(B3)=C1或C2或C3所以状态转移方程为:sk+1=xk(sk),(5)策略:每个阶段的决策确定以后,就得到一个决策序列,称为策略。由所有各阶段的决策组成的决策函数序列称为全过
8、程策略,简称策略,记为p1,n(s1);对每个实际问题,可供选择的策略有一定的范围,称为允许策略集合,记作P1,n,使整个问题能够达到最优效果的策略就是最优策略;从第k阶段开始到最后阶段的决策组成的决策函数序列称为k子过程策略,简称k子策略,记为pk,n(sk)。,第一节 动态规划基本概念,k=1,k=2,k=3,k=4,p1.4(A)=A,B1,C1,D1,E,是一条全过程策略p2.4(B1)=B1,C1,D1,E,是一条2子策略,(6)指标函数:衡量全过程策略或k子过程策略优劣的数量指标称为指标函数。它分为阶段指标函数和过程指标函数两种。阶段指标函数是指第k段,从sk状态出发,采取决策xk
9、时的效益,用dk(sk,xk)表示。对于一个n段的过程,从1到n叫做问题的原过程,对于任意一个给定的k(1kn),从第k段到第n段的过程称为原过程的一个后部子过程。V1,n(s1,p1,n)表示初始状态为s1采用策略p1,n时原过程的指标函数值;Vk,n(sk,pk,n)表示在第k阶段,初始状态为sk采用策略pk,n时,后部子过程的指标函数值;,(7)最优指标函数:最优指标函数记为fk(sk),它表示从第k阶段初始状态sk采用最优策略p*k,n到过程终止时的最佳效益值。fk(sk)与Vk,n(sk,pk,n)间的关系为:fk(sk)=Vk,n(sk,p*k,n)=opt Vk,n(sk,pk,
10、n)pk,n Pk,n当k=1时,f1(s1)就是从初始状态s1到全过程结束的整体最优函数。,动态规划的研究对象是多阶段决策问题,而多阶段决策问题就是求一个策略,使各阶段的效益的总和达到最优。,p*k,n,f1(s1),温馨提示,动态规划方法基于贝尔曼(R Bellman)等人提出的最优化原理:“一个过程的最优策略具有这样的性质:即无论其初始状态及其初始决策如何,对于先前决策所形成的状态而言,其以后的所有决策应构成最优策略。”,第二节 动态规划基本原理,最优化原理,最优化原理的理解,对于多阶段决策问题的最优策略,任一子策略都是最优的。如:最短路径上,从路径上任一点到终点的部分路径(最短路上的子
11、路)也一定是从该点到终点的最短路径(最短子路),2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,D2,E,C2,利用这个原理,可以把多阶段决策问题求解过程表示成一个连续的递推过程,由后向前逐步计算。在求解时,前面的各状态与决策,对后面的子过程来说,只相当于初始条件,并不影响后面子过程的最优决策。一般动态规划基本方程可以表示为:,动态规划基本方程,边界条件,将多阶段决策过程划分阶段,恰当地选取状态变量、决策变量及定义最优指标函数,从而把问题化成一族同类型的子问题,然后逐个求解。求解时从边界条件开始,逆过程行进
12、方向,逐段递推寻优。在每一个子问题求解时,都要使用它前面已经求出的子问题的最优结果,最后一个子问题的最优解,就是整个问题的最优解。,动态规划基本思想,第三节 动态规划模型的建立与求解,建立动态规划的模型,就是分析问题并建立问题的动态规划基本方程。成功地应用动态规划方法的关键,在于识别问题的多阶段特征,将问题分解成为可用递推关系式联系起来的若干子问题,而正确建立基本递推关系方程的关键又在于正确选择状态变量,保证各阶段的状态变量具有递推的状态转移关系sk+1=Tk(sk,xk),第三节 动态规划模型的建立与求解,求解动态规划的基本步骤:(一)建立动态规划逆序递推基本方程1、划分阶段:n k2、定义
13、状态变量及其状态集合:sk Sk3、定义决策变量及其允许决策集合:xk*(sk)Dk*(sk)4、确定状态转移关系:sk+1=Tk(sk,xk)5、定义最优指标函数:阶段指标dk(sk,xk)、最优指标函数fk(sk)及其f1(s1)6、建立动态规划逆序递推基本方程,(二)求解f1(s1):k=n,n-1,1,注意标出最优决策xk*(sk)(三)确定最优策略:结合状态转移方程顺推最优决策,例1:最短路径问题,求从A到E的最短路径和最短距离,第三节 动态规划模型的建立与求解,k=1,k=2,k=3,k=4,解(一)建立动态规划逆序递推基本方程1、划分阶段:将原问题按照空间划分为四个阶段,即n=4
14、,阶段变量 k=1,2,3,4,k=1,k=2,k=3,k=4,当k=1时,s1=A S1=A当k=2时,s2=B1或B2或B3 S2=B1,B2,B3 当k=3时,s3=C1或C2或C3 S3=C1,C2,C3 当k=4时,s4=D1或D2 S4=D1,D2,2、定义状态变量sk:令sk表示各阶段的起始位置,则各阶段的状态变量sk及其状态集合Sk为:,k=1,k=2,k=3,k=4,3、定义决策变量xk(sk):令xk(sk)表示从阶段k的sk出发所做的选择。,x1(s1):x1(A)=B1或B2或B3 D1(A)=B1,B2,B3 x2(s2):x2(B1)=C1或C2或C3 D2(B1)
15、=C1,C2,C3 x2(B2)=C1或C2或C3 D2(B2)=C1,C2,C3 x2(B3)=C1或C2或C3 D2(B3)=C1,C2,C3 x3(s3):x3(C1)=D1或D2 D3(C1)=D1,D2 x3(C2)=D1或D2 D3(C2)=D1,D2 x3(C3)=D1或D2 D3(C3)=D1,D2x4(s4):x4(D1)=E D4(D1)=E x4(D2)=E D4(D2)=E,各阶段的决策变量xk(sk)及其允许决策集合Dk(sk)为:,4、确定状态转移方程:,k=1,k=2,k=3,k=4,状态转移方程:sk+1=xk,5、定义指标函数:,阶段指标:令 dk(sk,xk
16、)-表示相邻两个城市之间的距离最优指标函数:fk(sk)-表示从第k阶段的sk到终点E的最短距离;f1(s1)即f1(A)-表示从A到终点E的最短距离;,k=1,k=2,k=3,k=4,F4(s4),F3(s3),F2(s2),F1(s1),6、建立逆序递推基本方程:,动态规划的逆序递推算法的基本方程为:fk(sk)=min dk(sk,xk)+fk+1(sk+1)k=4,3,2,1 xk Dk(sk)f5(s5)=0,下面从边界条件出发逐段求得原问题的最短距离,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B
17、2,D2,E,C2,f5(E)=0,边界条件:f5(E)=0,(二)计算f1(A),D1,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,C2,f4(D1)=5,f5(E)=0,s4=D1或D2,f4(D1)=mind4(D1,E)+f5(E)=min5+0=5 x4*(D1)=E,f4(D2)=mind4(D2,E)+f5(E)=min2+0=2 x4*(D2)=E,f4(D2)=2,D1,E,D2,E,当k=4时 f4(s4)=min d4(s4,x4)+f5(s5)x4 D4(s4),f3(C1)=8
18、,s3=C1或C2或C3,最优决策x3*(C1)=D1,D1,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,C2,f4(D1)=5,f5(E)=0,f4(D2)=2,D1,E,D2,E,C1,当k=3时 f3(s3)=min d3(s3,x3)+f4(s4)=min d3(s3,x3)+f4(x3)x3 D3(s3)x3 D3(s3),f3(C2)=7,最优决策x3*(C2)=D2,f3(C1)=8,D1,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1
19、,C3,D1,A,B1,B3,B2,C2,f4(D1)=5,f5(E)=0,f4(D2)=2,D1,E,D2,E,C1,C2,当k=3时 f3(s3)=min d3(s3,x3)+f4(s4)=min d3(s3,x3)+f4(x3)x3 D3(s3)x3 D3(s3),f3(C3)=12,f3(C2)=7,f3(C1)=8,D1,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,C2,f4(D1)=5,f5(E)=0,f4(D2)=2,D1,E,D2,E,C1,C2,C3,最优决策x3*(C3)=D2,当k
20、=3时 f3(s3)=min d3(s3,x3)+f4(s4)=min d3(s3,x3)+f4(x3)x3 D3(s3)x3 D3(s3),f2(B1)=20,f3(C3)=12,f3(C2)=7,f3(C1)=8,D1,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,C2,f4(D1)=5,f5(E)=0,f4(D2)=2,D1,E,D2,E,C1,C2,C3,B1,最优决策x2*(B1)=C1,s2=B1或B2或B3,当k=2时 f2(s2)=min d2(s2,x2)+f3(s3)=min d2(s
21、2,x2)+f3(x2)x2 D2(s2)x2 D2(s2),f2(B2)=14,最优决策x2*(B2)=C1,f2(B1)=20,f3(C3)=12,f3(C2)=7,f3(C1)=8,D1,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,C2,f4(D1)=5,f5(E)=0,f4(D2)=2,D1,E,D2,E,C1,C2,C3,B1,B2,当k=2时 f2(s2)=min d2(s2,x2)+f3(s3)=min d2(s2,x2)+f3(x2)x2 D2(s2)x2 D2(s2),f2(B3)=1
22、9,f2(B2)=14,f2(B1)=20,f3(C3)=12,f3(C2)=7,f3(C1)=8,D1,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,C2,f4(D1)=5,f5(E)=0,f4(D2)=2,D1,E,D2,E,C1,C2,C3,B1,B2,最优决策x2*(B3)=C2,B3,当k=2时 f2(s2)=min d2(s2,x2)+f3(s3)=min d2(s2,x2)+f3(x2)x2 D2(s2)x2 D2(s2),f1(A)=19,f2(B3)=19,f2(B2)=14,f2(B1
23、)=20,f3(C3)=12,f3(C2)=7,f3(C1)=8,D1,2,5,1,12,14,10,6,10,4,13,11,12,3,9,6,5,8,10,5,2,C1,C3,D1,A,B1,B3,B2,C2,f4(D1)=5,f5(E)=0,f4(D2)=2,D1,E,D2,E,C1,C2,C3,B1,B2,B3,最优决策x1*(A)=B2,A,s3=A,当k=1时 f1(s1)=min d1(s1,x1)+f2(s2)=min d1(s1,x1)+f2(x1)x1 D1(s1)x1 D1(s1),顺推最优决策:状态 最优决策 状态 最优决策 状态 最优决策 状态 最优决策 状态,f1(
24、A)=19,f2(B3)=19,f2(B2)=14,f2(B1)=20,f3(C3)=12,f3(C2)=7,f3(C1)=8,D1,5,10,6,10,12,3,5,10,5,2,C1,C3,D1,A,B1,B3,B2,C2,f4(D1)=5,f5(E)=0,f4(D2)=2,D1,E,D2,E,C1,C2,C3,B1,B2,B3,A,12,A x1*(A)=B2 B2 x2*(B2)=C1 C1 x3*(C1)=D1 D1 x4*(D1)=E E从A到E的最短路径为19,路径为AB 2C1 D1 E,(三)推导最优策略,第三节 动态规划模型的建立与求解,求解动态规划的基本步骤:(一)建立动
25、态规划逆序递推基本方程1、划分阶段:n k2、定义状态变量及其状态集合:sk Sk3、定义决策变量及其允许决策集合:xk(sk)Dk(sk)4、确定状态转移关系:sk+1=Tk(sk,xk)5、定义最优指标函数:阶段指标dk(sk,xk)、最优指标函数fk(sk)及其f1(s1)6、建立动态规划逆序递推基本方程,(二)求解f1(s1):k=n,n-1,1,注意标出最优决策xk*(sk)(三)确定最优策略:结合状态转移方程顺推最优决策,最短路径问题资源分配问题背包问题生产计划与库存问题,第四节 动态规划在经济管理中的应用,生产过程的最优控制问题机器负荷分配问题装载问题系统可靠性问题,例2、资源分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十 章动 规划 ppt 课件
链接地址:https://www.31ppt.com/p-2106836.html