现代优化计算方法课件.ppt
1,什么是人工智能算法,随着计算机技术的飞速发展,智能计算方法的应用领域也越来越广泛,当前存在的一些智能算法有人工神经网络遗传算法模拟退火算法群集智能蚁群算法粒子群算等等。蚁群算法只是其中的一种。人工智能计算也有人称之为“软计算”,是们受自然(生物界)规律的启迪,根据其原理,模仿求解问题的算法。从自然界得到启迪,模仿其结构进行发明创造,这就是仿生学。这是我们向自然界学习的一个方面。另一方面,我们还可以利用仿生原理进行设计(包括设计算法),这就是智能计算的思想。,2,蚁群算法,起源应用领域研究背景基本原理,3,蚁群优化算法起源,蚁群算法最开始的提出是在90年代有人受了蚂蚁觅食时的通讯机制的启发用来解决计算机算法学中经典的“旅行商问题(Traveling Salesman Problem,TSP)”。TSP问题属于易于描述但难于解决的著名难题之一,至今世界上还有不少人在研究它。该问题的基本描述是:某售货员要到若干个村庄售货,各村庄之间的路程是已知的,为了提高效率,售货员决定从所在商店出发,到每个村庄都售货一次后再返回商店,问他应选择一条什么路线才能使所走的总路程最短?其实有很多实际问题可归结为TSP问题。,4,蚁群优化算法起源,例如邮路问题就是一个TSP问题。假定有一辆邮车要到n个不同的地点收集邮件,这种情况可以用n十1个结点的图来表示。一个结点表示此邮车出发并要返回的那个邮局,其余的n个结点表示要收集邮件的n个地点。邮车所行经的路线是一条周游路线,希望求出具有最小长度的周游路线。再举一个例子在一条装配线上用一个机械手去紧固待装配部件上的螺帽问题。机械手由其初始位置(该位置在第一个要紧固的螺帽的上方)开始,依次移动到其余的每一个螺帽,最后返回到初始位置。一条最小成本周游路线将使这机械手完成其工作所用的时间取最小值。所以TSP问题的研究也是具有很多实际价值。,5,蚁群算法应用领域,这种方法能够被用于解决大多数优化问题或者能够转化为优化求解的问题。现在其应用领域已扩展到多目标优化、数据分类、数据聚类、模式识别、电信QoS管理、生物系统建模、流程规划、信号处理、机器人控制、决策支持以及仿真和系统辩识等方面,群智能理论和方法为解决这类应用问题提供了新的途径。,6,蚁群优化算法研究背景 1/3,蚁群算法属于群智理论。群智能理论研究领域有两种主要的算法:蚁群算法(Ant Colony Optimization,ACO)和微粒群算法(Particle Swarm Optimization,PSO)。前者是对蚂蚁群落食物采集过程的模拟,已成功应用于许多离散优化问题。微粒群算法也是起源于对简单社会系统的模拟,最初是模拟鸟群觅食的过程,但后来发现它是一种很好的优化工具。,7,蚁群优化算法研究背景 2/3,与大多数基于梯度的应用优化算法不同,群智能依靠的是概率搜索算法。虽然概率搜索算法通常要采用较多的评价函数,但是与梯度方法及传统的演化算法相比,其优点还是显著的,主要表现在以下几个方面:1 无集中控制约束,不会因个别个体的故障影响整个问题 的求解,确保了系统具备更强的可靠性 2 以非直接的信息交流方式确保了系统的扩展性 3 并行分布式算法模型,可充分利用多处理器 4 对问题定义的连续性无特殊要求 5 算法实现简单,8,蚁群优化算法研究背景 3/3,群智能方法易于实现,算法中仅涉及各种基本的数学操作,其数据处理过程对CPU和内存的要求也不高。而且,这种方法只需目标函数的输出值,而无需其梯度信息。已完成的群智能理论和应用方法研究证明群智能方法是一种能够有效解决大多数全局优化问题的新方法。更为重要是,群智能潜在的并行性和分布式特点为处理大量的以数据库形式存在的数据提供了技术保证。无论是从理论研究还是应用研究的角度分析,群智能理论及其应用研究都是具有重要学术意义和现实价值的。,9,蚁群算法原理,蚁群算法是对自然界蚂蚁的寻径方式进行模似而得出的一种仿生算法。蚂蚁在运动过程中,能够在它所经过的路径上留下一种称之为外激素(pheromone)的物质进行信息传递,而且蚂蚁在运动过程中能够感知这种物质,并以此指导自己的运动方向,因此由大量蚂蚁组成的蚁群集体行为便表现出一种信息正反馈现象:某一路径上走过的蚂蚁越多,则后来者选择该路径的概率就越大。为了说明蚁群算法的原理,先简要介绍一下蚂蚁搜寻食物的具体过程。在蚁群寻找食物时,它们总能找到一条从食物到巢穴之间的最优路径。这是因为蚂蚁在寻找路径时会在路径上释放出一种特殊的信息素。当它们碰到一个还没有走过的路口时就随机地挑选一条路径前行。与此同时释放出与路径长度有关的信息素。路径越长,释放的激素浓度会越低.当后来的蚂蚁再次碰到这个路口的时候选择激素浓度较高路径概率就会相对较大。这样形成一个正反馈。最优路径上的激索浓度越来越大而其它的路径上激素浓度却会随着时间的流逝而消减。最终整个蚁群会找出最优路径。,10,简化的蚂蚁寻食过程 1/3,蚂蚁从A点出发,速度相同,食物在D点,可能随机选择路线ABD或ACD。假设初始时每条分配路线一只蚂蚁,每个时间单位行走一步,本图为经过9个时间单位时的情形:走ABD的蚂蚁到达终点,而走ACD的蚂蚁刚好走到C点,为一半路程。,11,简化的蚂蚁寻食过程 2/3,本图为从开始算起,经过18个时间单位时的情形:走ABD的蚂蚁到达终点后得到食物又返回了起点A,而走ACD的蚂蚁刚好走到D点。,12,简化的蚂蚁寻食过程 3/3,假设蚂蚁每经过一处所留下的信息素为一个单位,则经过36个时间单位后,所有开始一起出发的蚂蚁都经过不同路径从D点取得了食物,此时ABD的路线往返了2趟,每一处的信息素为4个单位,而 ACD的路线往返了一趟,每一处的信息素为2个单位,其比值为2:1。寻找食物的过程继续进行,则按信息素的指导,蚁群在ABD路线上增派一只蚂蚁(共2只),而ACD路线上仍然为一只蚂蚁。再经过36个时间单位后,两条线路上的信息素单位积累为12和4,比值为3:1。若按以上规则继续,蚁群在ABD路线上再增派一只蚂蚁(共3只),而ACD路线上仍然为一只蚂蚁。再经过36个时间单位后,两条线路上的信息素单位积累为24和6,比值为4:1。若继续进行,则按信息素的指导,最终所有的蚂蚁会放弃ACD路线,而都选择ABD路线。这也就是前面所提到的正反馈效应。,13,自然蚁群与人工蚁群算法,基于以上蚁群寻找食物时的最优路径选择问题,可以构造人工蚁群,来解决最优化问题,如TSP问题。人工蚁群中把具有简单功能的工作单元看作蚂蚁。二者的相似之处在于都是优先选择信息素浓度大的路径。较短路径的信息素浓度高,所以能够最终被所有蚂蚁选择,也就是最终的优化结果。两者的区别在于人工蚁群有一定的记忆能力,能够记忆已经访问过的节点。同时,人工蚁群再选择下一条路径的时候是按一定算法规律有意识地寻找最短路径,而不是盲目的。例如在TSP问题中,可以预先知道当前城市到下一个目的地的距离。,14,蚁群算法与TSP问题 1/3,TSP问题表示为一个N个城市的有向图G=(N,A),其中城市之间距离目标函数为,其中 为城市1,2,n的一个排列,。,15,蚁群算法与TSP问题 2/3,TSP问题的人工蚁群算法中,假设m只蚂蚁在图的相邻节点间移动,从而协作异步地得到问题的解。每只蚂蚁的一步转移概率由图中的每条边上的两类参数决定:1 信息素值 也称信息素痕迹。2 可见度,即先验值。信息素的更新方式有2种,一是挥发,也就是所有路径上的信息素以一定的比率进行减少,模拟自然蚁群的信息素随时间挥发的过程;二是增强,给评价值“好”(有蚂蚁走过)的边增加信息素。,16,蚁群算法与TSP问题 3/3,蚂蚁向下一个目标的运动是通过一个随机原则来实现的,也就是运用当前所在节点存储的信息,计算出下一步可达节点的概率,并按此概率实现一步移动,逐此往复,越来越接近最优解。蚂蚁在寻找过程中,或者找到一个解后,会评估该解或解的一部分的优化程度,并把评价信息保存在相关连接的信息素中。,17,初始的蚁群优化算法基于图的蚁群系统(GBAS)1/12,初始的蚁群算法是基于图的蚁群算法,graph-based ant system,简称为GBAS,是由Gutjahr W J在2000年的Future Generation Computing Systems提出的,算法步骤如下:STEP 0 对n个城市的TSP问题,城市间的距离矩阵为,给TSP图中的每一条弧 赋信息素初值,假设m只蚂蚁在工作,所有蚂蚁都从同一城市 出发。当前最好解是。,18,初始的蚁群优化算法基于图的蚁群系统(GBAS)2/12,STEP 1(外循环)如果满足算法的停止规则,则停止计算并输出计算得到的最好解。否则使蚂蚁s从起点 出发,用 表示蚂蚁s行走的城市集合,初始 为空集,。STEP 2(内循环)按蚂蚁 的顺序分别计算。当蚂蚁在城市i,若 完成第s只蚂蚁的计算。否则,若,则以概率,到达j,;若则到达重复STEP 2。,19,初始的蚁群优化算法基于图的蚁群系统(GBAS)3/12,STRP 3 对,若,按 中城市的顺序计算路径程度;若,路径长度置为一个无穷大值(即不可达)。比较m只蚂蚁中的路径长度,记走最短路径的蚂蚁为t。若,则。用如下公式对W路径上的信息素痕迹加强,对其他路径上的信息素进行挥发。得到新的,重复步骤STEP 1。,20,初始的蚁群优化算法基于图的蚁群系统(GBAS)4/12,在STEP 3 中,挥发因子 对于一个固定的,满足并且 经过k次挥发,非最优路径的信息素逐渐减少至消失。,21,初始的蚁群优化算法基于图的蚁群系统(GBAS)5/12,以上算法中,在蚂蚁的搜寻过程中,以信息素的概率分布来决定从城市i到城市j的转移。算法中包括信息素更新的过程 1 信息素挥发(evaporation)信息素痕迹的挥发过程是每个连接上的信息素痕迹的浓度自动逐渐减弱的过程,由 表示,这个挥发过程主要用于避免算法过快地向局部最优区域集中,有助于搜索区域的扩展。2 信息素增强(reinforcement)增强过程是蚁群优化算法中可选的部分,称为离线更新方式(还有在线更新方式)。这种方式可以实现由单个蚂蚁无法实现的集中行动。也就是说,增强过程体现在观察蚁群(m只蚂蚁)中每只蚂蚁所找到的路径,并选择其中最优路径上的弧进行信息素的增强,挥发过程是所有弧都进行的,不于蚂蚁数量相关。这种增强过程中进行的信息素更新称为离线的信息素更新。在STEP 3中,蚁群永远记忆到目前为止的最优解。,22,图的蚁群系统(GBAS)6/12,可以验证,下式满足:即 是一个随机矩阵。,四个城市的非对称TSP问题,距离矩阵和城市图示如下:,23,初始的蚁群优化算法基于图的蚁群系统(GBAS)7/12,假设共4只蚂蚁,所有蚂蚁都从城市A出发,挥发因子。此时,观察GBAS的计算过程。矩阵共有12条弧,初始信息素记忆矩阵为:,24,初始的蚁群优化算法基于图的蚁群系统(GBAS)8/12,执行GBAS算法的步骤2,假设蚂蚁的行走路线分别为:当前最优解为,这个解是截止到当前的最优解,碰巧是实际最优解,25,初始的蚁群优化算法基于图的蚁群系统(GBAS)9/12,按算法步骤3的信息素更新规则,得到更新矩阵这是第一次外循环结束的状态。,26,初始的蚁群优化算法基于图的蚁群系统(GBAS)10/12,重复外循环,由于上一次得到的W2已经是全局最优解,因此按算法步骤3的信息素更新规则,无论蚂蚁如何行走,都只是对W2路线上的城市信息素进行增强,其他的城市信息素进行挥发。得到更新矩阵这是第一次外循环结束的状态。,27,初始的蚁群优化算法基于图的蚁群系统(GBAS)11/12,重复外循环,由于W2全局最优解,GBAS只记录第一个最优解,因此一但得到了全局最优解,信息素的更新将不再依赖于以群的行走路线,而只是不断增强最优路线的信息素,同时进行挥发。第三次外循环后得到的信息素矩阵为:,28,初始的蚁群优化算法基于图的蚁群系统(GBAS)12/12,蚂蚁以一定的概率从城市i到城市j进行转移,信息素的更新在STEP 3 完成,并随K而变化。假设第K次外循环后得到信息素矩阵,得到当前最优解。第K次循环前的信息素和最优解为,经过第K次外循环后,得到。由于蚂蚁的一步转移概率是随机的,从 到 也是随机的,是一个马尔可夫过程。,29,一般蚁群算法的框架,一般蚁群算法的框架和GBAS基本相同,有三个组成部分:蚁群的活动;信息素的挥发;信息素的增强;主要体现在前面的算法中步骤2和步骤3中的转移概率公式和信息素更新公式。,30,蚁群优化算法算法模型和收敛性分析,马氏过程的收敛定义GBAS算法的收敛性分析其他算法及收敛性分析,31,马氏过程的收敛定义,蚁群优化算法的每步迭代对应随机变量 其中 为信息素痕迹;为n城市的一个排列,最多有 个状态。第s只蚂蚁在第k轮转移只由 决定,这个蚂蚁行走的路径和 一起,共同决定了,再通过信息素的更新原则可以进一步得到。的变化仅由 决定,而与先前的状态无关,这是一个典型的马尔可夫过程。定义:若一个马尔可夫过程,对任意给定的 满足 则称马尔可夫过程 依概率1收敛到。,32,GBAS算法的收敛性分析 1/8,定理 满足指定条件的马尔可夫过程 依概率1收敛到,其中 为一条最优路径,定义为:证明分析:蚁群算法中,一但达到全局最优,由 只记录第一个最优解.证明分三部分:证明以概率1达到一个最优路径 证明(1)上式成立 证明以概率1收敛到一个最优路径,33,GBAS算法的收敛性分析 2/8,证明以概率1到达一个最优路径 对于最优路径,令 为蚁群中的一个蚂蚁在第k次外循环后第一次走到最优路径 的事件.表示仅第k次外循环没有走到 的事件,但前k-1次可能走到过这条最优路径.永远不会被走到的事件为,其概率为:,34,GBAS算法的收敛性分析 3/8,任意给定的固定弧(i,j),在第k次循环后,其信息素值的下界可以计算出.,35,GBAS算法的收敛性分析 4/8,令,任何一个固定节点最多有(n-1)后续节点,并且其弧上的信息素值都小于1或者等于1.得:蚁群中的一只蚂蚁在第 次循环走到路径 W*的概率为一个蚁群中至少有一只蚂蚁,因此这是一个蚁群到达最优路径的一个下界.上式右侧与k无关,36,GBAS算法的收敛性分析 5/8,则取对数有从而得到,37,GBAS算法的收敛性分析 6/8,证明右式成立 随机过程 以概率1达到一条最优路径.当某条最优路径Z在第k次循环被首次走到后,在第k+1轮循环按信息素的更新原则,可以用归纳法证明,对于任意,38,GBAS算法的收敛性分析 7/8,由于级数 是发散的,可知.因此,当 时,在第K轮迭代之后,该弧永远不再被加强,从而有 也既 弧上的信息素之和将趋于0.对于信息素的更新公式(2),可以归纳证明(6)式的第二项与(i,j)弧无关,结合(7)式可得 的极限存在,且所有的极限之和为1.对于所有的,39,GBAS算法的收敛性分析 8/8,结合前两部分讨论,当Xn首次到达最优路径后,对于任何最优路径上的弧,(1)式的转移概率,即 依概率1收敛到.,40,其他算法及收敛性分析 1/4,MAX-MIN蚁群优化算法指定挥发系数不随时间变化,这是和GBAS算法不同的一点,改变了信息素挥发和增强的规则(9式),同时给出一个下界 控制信息素的挥发.定理 在MAX-MIN算法中,41,其他算法及收敛性分析 2/4,42,其他算法及收敛性分析 3/4,43,其他算法及收敛性分析 4/4,44,蚁群优化算法技术问题,解的表达形式与算法的实现每一节点的记忆信息和系数的确定蚁群的规模和停止规则信息素的更改,45,解的表达形式与算法的实现 1/4-解的表达形式,解的表达形式 基于TSP问题的蚁群优化算法,其解的形式是所有城市的一个排列(闭圈,这种情况下谁在第一并不重要),信息素痕迹按每个弧记录。而对于一般以顺序作为解的优化问题,谁在第一是很重要的。蚁群算法在解决这类问题时,只需要建立一个虚拟的始终点,就可以把TSP问题的解法推广,用于诸多的优化问题。诸如车间作业及下料等问题,他们的共同特点是解以一个顺序表示。TSP问题寻找的是最短回路,而一般优化问题中,STEP 3 中的判断条件 需要根据实际问题进行修改。,46,解的表达形式与算法的实现 2/4-算法的实现,例:0-1背包问题的解顺序表达形式与算法实现。设有一个容积为b的背包,n个尺寸分别为,价值分别为 的物品,0-1背包问题的数学模型为:假设其解的顺序表达形式为,其中为的一个排列。,47,解的表达形式与算法的实现 3/4-算法的实现,建立有向图,其中 A中共有 条弧。初始信息素痕迹定义为。设第s只蚂蚁第k步所走的路线为,表示蚂蚁从0点出发,顺序到达。第 步按TSP算法的转移概率公式行走选择。若 则,否则,此蚂蚁不再继续行走,退回起点。,48,解的表达形式与算法的实现4/4-算法的实现,对蚁群重复以上过程,比较m只蚂蚁的装包值 并记忆具有最大装包值的蚂蚁为t。把GBAS算法中步骤3中的改为,若满足此条件则替换当前最好解为,对W上的弧进行信息素的加强,其他弧进行信息素的挥发。算法中记录了三个信息:信息素痕迹;行走路线;和问题的约束条件,以确定是否将 加入。,49,每一节点的记忆信息和系数的确定-需要记忆的信息 1/3,算法中需要记忆的信息有三部分。第一部分信息是存在每个节点的路由表数据结构,由此决定的的转移概率为其中T可以看成节点i的邻域。,50,每一节点的记忆信息和系数的确定-需要记忆的信息 2/3,第二部分需要记忆的信息是每个蚂蚁的记忆表中存储着的自身的历史信息,这一部分主要由算法的中的 记忆,表示蚂蚁已经行走过的节点。第三部分为问题的约束条件。在GBAS中,T集合表示满足约束条件的候选集,在背包问题的蚁群算法中由判别条件,来实现记 忆功能。,51,每一节点的记忆信息和系数的确定-系数的确定 3/3,残留信息的相对重要程度 和预见值的相对重要程度 体现了相关信息痕迹和预见度对蚂蚁决策的相对影响。Dorigo在求解TSP问题时,推荐参数的最佳设置为:。,52,蚁群的规模和停止规则,一、蚁群大小 一般情况下蚁群中蚂蚁的个数不超过TSP图中节点的个数。二、终止条件 1 给定一个外循环的最大数目,表明已经有足够的蚂蚁工作;2 当前最优解连续K次相同而停止,其中K是一个给定的整数,表示算法已经收敛,不再需要继续;3 目标值控制规则,给定优化问题(目标最小化)的一个下界和一个误差值,当算法得到的目标值同下界之差小于给定的误差值时,算法终止。,53,信息素的更改 1/6,信息素的更新分为离线和在线两种方式。离线方式(同步更新方式)的主要思想是在若干只蚂蚁完成n个城市的访问后,统一对残留信息进行更新处理。信息素的在线更新(异步更新方式)即蚂蚁每行走一步,立即回溯并且更新行走路径上的信息素。,54,信息素的更改 2/6,离线方式的信息素更新可以进一步分为单蚂蚁离线更新和蚁群离线更新。蚁群离线更新方式是在蚁群中的m只蚂蚁全部完成n城市的访问(第k-1次蚁群循环)后,统一对残留信息进行更新处理。其中,为第k-1次循环后的的信息素的痕迹值。单蚂蚁离线更新是在第s只蚂蚁完成对所有n个城市的访问后,进行路径回溯,更新行走路径上的信息素,同时释放分配给它的资源。更新公式为 第s+1只蚂蚁根据 重新计算路由表。,55,信息素的更改 3/6,TSP问题中,蚁群优化算法根据信息素痕迹更新方式不同可以分为不同的算法,采用离线方式,并且时,其中W为t循环中m只蚂蚁所行走的最佳路线或第t只蚂蚁所行走的一条路径。Q为一个常数,该算法名为蚁环算法(ant-cycle algotithm),特点是行走的路径越短对应保存的信息素的值就越大。,56,信息素的更改 4/6,GBAS算法是典型的离线信息素更新方式。该算法中,蚁群中蚂蚁的先后出行顺序没有相关性,但是每次循环需要记忆m只蚂蚁的行走路径,以进行比较选择最优路径。相对而言,单蚂蚁离线更新方式记忆信息少,只需要记忆第s只蚂蚁的路径,并通过信息素更新后,释放该蚂蚁的所有记录信息。实际上这种方式等价于蚁群离线方式中只有一只蚂蚁。,57,信息素的更改 5/6,与单蚂蚁离线更新方式相比,信息量记忆更小的是信息素在线更新方式,即蚂蚁每走一步,马上回溯并且更新刚刚走过的路径上的信息素,其规则为 其中,k为蚂蚁行走的第k步。,58,信息素的更改 6/6,蚁量算法(ant-quantity algorithm)的信息素更新为,Q为常量,表示i到j的距离,这样信息浓度会随城市距离的减小而加大。蚁密算法(ant-density algorithm)信息素更新为。以上三种算法中,蚁环算法效果最好,因为他用的是全局信息,而其余两种算法用的是局部信息。蚁环离线更新方法很好地保证了残留信息不至于无限积累,非最优路径会逐渐随时间推移被忘记。,59,应用 1/5,光网络的智能管理 分布式动态选路及波长分配(RWA,Routing and Wavelength Assignment)是指在实时业务情况下光通路的路由选择和波长分配的优化问题,是实现自动交换光网络(ASON,Automatically Switched Optical Network)的关键技术之一。研究RWA 问题的目的是尽可能减少所需要的波长数和降低光路连接请求的阻塞率。由于RWA 问题是NP-C 问题,文献中大多将RWA 问题拆分成路由和波长分配两个子问题分别加以解决。但是,由于RWA 问题本身是一个不可分割的整体,把RWA 分开考虑必然造成难以得到全局最优解的后果。,60,应用 2/5,同时,分布式的计算方式则克服了传统集中式算法可扩展性差的缺点,更适应现代频繁变化的大型光网络。因此,近年来国内外对RWA 并行的分布式算法表现出极大的兴趣,此类算法建立的基础是分层图模型。用蚁群算法在分层图模型的基础上求解动态RWA 问题。基于蚂蚁“信息素表”来完成局部信息的刷新计算。以分布的形式做少量的计算来刷新全局路由选择信息。参考文献:基于蚁群系统的分布式RWA 算法研究 孙海金,朱娜,周乃富 2005 年第2 期 光通信研究,61,应用 3/5,蚁群算法用于计算机网络路由参考文献:计算机网络中的组播路由算法 谢银祥,62,应用 4/5,63,应用 5/5,蚁群算法用于聚类(蚁群蚁卵分类)思想:把待聚类的数据随机散布在一个平面上,放置若干只虚拟蚂蚁使其在平面上随机运动。当一只蚂蚁遇到一个数据时即拾起并继续行走,在行走过程中,如果遇到附近的数据与背负的数据相似性高于设置的标准时则将数据放置在该位置,继续移动。重复以上过程即可实现数据聚类。,64,智能算法前景,目前的智能计算研究水平暂时还很难使“智能机器”真正具备人类的常识,但智能计算将在21世纪蓬勃发展。不仅仅只是功能模仿要持有信息机理一致的观点。即人工脑与生物脑将不只是功能模仿,而是具有相同的特性。这两者的结合将开辟一个全新的领域,开辟很多新的研究方向。智能计算将探索智能的新概念,新理论,新方法和新技术,而这一切将在以后的发展中取得重大成就。,65,END,Thanks,