随机生成数算法.ppt

上传人：小飞机

文档编号：6355637

上传时间：2023-10-20

格式：PPT

页数：24

大小：289.32KB

《随机生成数算法.ppt》由会员分享，可在线阅读，更多相关《随机生成数算法.ppt（24页珍藏版）》请在三一办公上搜索。

1、算法设计与分析,山东师范大学信息科学与工程学院软件工程研究所徐连诚 E-Mail：2006年12月4日,2,第七章概率算法,学习要点理解产生伪随机数的算法掌握数值概率算法的设计思想掌握蒙特卡罗算法的设计思想掌握拉斯维加斯算法的设计思想掌握舍伍德算法的设计思想,3,引言,前面几张所讨论的分治、动态规划、贪心法、回溯和分支限界等算法的每一计算步骤都是确定的，本章所讨论的概率算法允许执行过程中随机选择下一计算步骤。在多数情况下，当算法在执行过程中面临一个选择是，随机性选择常比最优选择省时，因此概率算法可在很大程度上降低算法复杂性。概率算法的一个基本特征是对所求解问题的同一实例用同一概率算法求解两

2、次可能得到完全不同的效果(所需时间或计算结果)。本章将要介绍的概率算法包括：数值概率算法求解数值问题的近似解，精度随计算时间增加而不断提高舍伍德算法消除算法最坏情形行为与特定势力之间的关联性，并不提高平均性能，也不是刻意避免算法的最坏情况行为拉斯维加斯算法求解问题的正确解，但可能找不到解蒙特卡罗算法求解问题的准确解，但这个解未必正确，且一般情况下无法有效判定正确性,4,7.1 随机数,随机数在概率算法设计中扮演着十分重要的角色。在现实计算机上无法产生真正的随机数，因此在概率算法中使用的随机数都是一定程度上随机的，即伪随机数。线性同余法是产生伪随机数的最常用的方法。由线性同余法产生的随机

3、序列a0,a1,an满足其中b0，c0，dm。d称为该随机序列的种子。如何选取该方法中的常数b、c和m直接关系到所产生的随机序列的随机性能。这是随机性理论研究的内容，已超出本书讨论的范围。从直观上看，m应取得充分大，因此可取m为机器大数，另外应取gcd(m,b)=1，因此可取b为一素数。,5,7.2 数值概率算法,一、用随机投点法计算值二、计算定积分三、解非线性方程组,6,一、用随机投点法计算值,设有一半径为r的圆及其外切四边形。向该正方形随机地投掷n个点。设落入圆内的点数为k。由于所投入的点在正方形上均匀分布，因而所投入的点落入圆内的概率为。所以当n足够大double Darts(int n

4、)/用随机投点法计算值static RandomNumber dart;int k=0;for(int i=1;i=n;i+)double x=dart.fRandom();double y=dart.fRandom();if(x*x+y*y)=1)k+;return 4*k/double(n);,7,二、计算定积分,设f(x)是0，1上的连续函数，且0f(x)1。需要计算的积分为,积分I等于图中的面积G。在图所示单位正方形内均匀地作投点试验，则随机点落在曲线下面的概率为假设向单位正方形内随机地投入 n个点(xi,yi)。如果有m个点落入G内，则随机点落入G内的概率,8,三、解非线性方程组,求

5、解下面的非线性方程组其中，x1,x2,xn是实变量，fi是未知量x1,x2,xn的非线性实函数。要求确定上述方程组在指定求根范围内的一组解x1*,x2*,xn*。在指定求根区域D内，选定一个随机点x0作为随机搜索的出发点。在算法的搜索过程中，假设第j步随机搜索得到的随机搜索点为xj。在第j+1步，计算出下一步的随机搜索增量xj。从当前点xj依xj得到第j+1步的随机搜索点。当x时，取为所求非线性方程组的近似解。否则进行下一步新的随机搜索过程。,9,7.3 舍伍德(Sherwood)算法,设A是一个确定性算法，当它的输入实例为x时所需的计算时间记为tA(x)。设Xn是算法A的输入规模为n的实例的

6、全体，则当问题的输入规模为n时，算法A所需的平均时间为这显然不能排除存在xXn使得的可能性。希望获得一个概率算法B，使得对问题的输入规模为n的每一个实例均有这就是舍伍德算法设计的基本思想。当s(n)与tA(n)相比可忽略时，舍伍德算法可获得很好的平均性能。,10,一、线性时间选择算法,快速排序算法、线性时间选择算法 P206有时也会遇到这样的情况，即所给的确定性算法无法直接改造成舍伍德型算法。此时可借助于随机预处理技术，不改变原有的确定性算法，仅对其输入进行随机洗牌，同样可收到舍伍德算法的效果。例如，对于确定性选择算法，可以用下面的洗牌算法Shuffle将数组a中元素随机排列，然后用确定性选择

7、算法求解。这样做所收到的效果与舍伍德型算法的效果是一样的。templatevoid Shuffle(Type a,int n)/随机洗牌算法static RandomNumber rnd;for(int i=0;in;i+)int j=rnd.Random(n-i)+i;Swap(ai,aj);,11,二、搜索有序表,有序字典是表示有序集很有用的抽象数据类型，它支持对有序集的搜索、插入、删除、前驱、后继等运算；有许多基本数据结构可用于实现有序字典。下面讨论用数组表示有序集。P208,12,三、跳跃表,舍伍德型算法的设计思想还可用于设计高效的数据结构。如果用有序链表来表示一个含有n个元素的有序集

8、S，则在最坏情况下，搜索S中一个元素需要(n)计算时间。提高有序链表效率的一个技巧是在有序链表的部分结点处增设附加指针以提高其搜索性能。在增设附加指针的有序链表中搜索一个元素时，可借助于附加指针跳过链表中若干结点，加快搜索速度。这种增加了向前附加指针的有序链表称为跳跃表。应在跳跃表的哪些结点增加附加指针以及在该结点处应增加多少指针完全采用随机化方法来确定。这使得跳跃表可在O(logn)平均时间内支持关于有序集的搜索、插入和删除等运算。,13,在一般情况下，给定一个含有n个元素的有序链表，可以将它改造成一个完全跳跃表，使得每一个k级结点含有k+1个指针，分别跳过2k-1，2k-1-1，20-1个

9、中间结点。第i个k级结点安排在跳跃表的位置i2k处，i0。这样就可以在时间O(logn)内完成集合成员的搜索运算。在一个完全跳跃表中，最高级的结点是 logn 级结点。完全跳跃表与完全二叉搜索树的情形非常类似。它虽然可以有效地支持成员搜索运算，但不适应于集合动态变化的情况。集合元素的插入和删除运算会破坏完全跳跃表原有的平衡状态，影响后继元素搜索的效率。,14,为了在动态变化中维持跳跃表中附加指针的平衡性，必须使跳跃表中k级结点数维持在总结点数的一定比例范围内。注意到在一个完全跳跃表中，50%的指针是0级指针；25%的指针是1级指针；(100/2k+1)%的指针是k级指针。因此，在插入一个元素时

10、，以概率1/2引入一个0级结点，以概率1/4引入一个1级结点，以概率1/2k+1引入一个k级结点。另一方面，一个i级结点指向下一个同级或更高级的结点，它所跳过的结点数不再准确地维持在2i-1。经过这样的修改，就可以在插入或删除一个元素时，通过对跳跃表的局部修改来维持其平衡性。,15,注意到，在一个完全跳跃表中，具有i级指针的结点中有一半同时具有i+1级指针。为了维持跳跃表的平衡性，可以事先确定一个实数0p1，并要求在跳跃表中维持在具有i级指针的结点中同时具有i+1级指针的结点所占比例约为p。为此目的，在插入一个新结点时，先将其结点级别初始化为0，然后用随机数生成器反复地产生一个0，1间的随机实

11、数q。如果qp，则使新结点级别增加1，直至qp。由此产生新结点级别的过程可知，所产生的新结点的级别为0的概率为1-p，级别为1的概率为p(1-p)，级别为i的概率为pi(1-p)。如此产生的新结点的级别有可能是一个很大的数，甚至远远超过表中元素的个数。为了避免这种情况，用 log1/pn 作为新结点级别的上界。其中n是当前跳跃表中结点个数。当前跳跃表中任一结点的级别不超过 log1/pn,16,7.4 拉斯维加斯(Las Vegas)算法,拉斯维加斯算法的一个显著特征是它所作的随机性决策有可能导致算法找不到所需的解。void obstinate(Object x,Object y)/反复调用拉

12、斯维加斯算法LV(x,y)，直到找到问题的一个解ybool success=false;while(!success)success=lv(x,y);设p(x)是对输入x调用拉斯维加斯算法获得问题的一个解的概率。一个正确的拉斯维加斯算法应该对所有输入x均有p(x)0。设t(x)是算法obstinate找到具体实例x的一个解所需的平均时间,s(x)和e(x)分别是算法对于具体实例x求解成功或求解失败所需的平均时间，则有：解此方程可得：,17,一、n后问题,对于n后问题的任何一个解而言，每一个皇后在棋盘上的位置无任何规律，不具有系统性，而更象是随机放置的。由此容易想到下面的拉斯维加斯算法。在棋盘上

13、相继的各行中随机地放置皇后，并注意使新放置的皇后与已放置的皇后互不攻击，直至n个皇后均已相容地放置好，或已没有下一个皇后的可放置位置时为止。如果将上述随机放置策略与回溯法相结合，可能会获得更好的效果。可以先在棋盘的若干行中随机地放置皇后，然后在后继行中用回溯法继续放置，直至找到一个解或宣告失败。随机放置的皇后越多，后继回溯搜索所需的时间就越少，但失败的概率也就越大。,18,二、整数因子分解,设n1是一个整数。关于整数n的因子分解问题是找出n的如下形式的唯一分解式：其中，p1p2pk是k个素数，m1,m2,mk是k个正整数。如果n是一个合数，则n必有一个非平凡因子x，1xn，使得x可以整除n。给

14、定一个合数n，求n的一个非平凡因子的问题称为整数n的因子分割问题。int Split(int n)int m=floor(sqrt(double(n);for(int i=2;i=m;i+)if(n%i=0)return i;return 1;事实上，算法split(n)是对范围在1x的所有整数进行了试除而得到范围在1x2的任一整数的因子分割。,19,Pollard算法,在开始时选取0n-1范围内的随机数，然后递归地由xi=(xi-12-1)mod n产生无穷序列x1,x2,xk,对于i=2k，以及2kj2k+1，算法计算出xj-xi与n的最大公因子d=gcd(xj-xi，n)。如果d是n的非

15、平凡因子，则实现对n的一次分割，算法输出n的因子d。对Pollard算法更深入的分析可知，执行算法的while循环约次后，Pollard算法会输出n的一个因子p。由于n的最小素因子p，故Pollard算法可在O(n1/4)时间内找到n的一个素因子。,void Pollard(int n)/求因子分割的拉斯维加斯算法RandomNumber rnd;int i=1;int x=rnd.Random(n);/随机整数int y=x,k=2;while(true)i+;x=(x*x-1)%n;/int d=gcd(y-x,n);/求n的非平凡因子if(d1),20,7.5 蒙特卡罗(Monte C

16、arlo)算法,在实际应用中常会遇到一些问题，不论采用确定性算法或概率算法都无法保证每次都能得到正确的解答。蒙特卡罗算法则在一般情况下可以保证对问题的所有实例都以高概率给出正确解，但是通常无法判定一个具体解是否正确。设p是一个实数，且1/2p1。如果一个蒙特卡罗算法对于问题的任一实例得到正确解的概率不小于p，则称该蒙特卡罗算法是p正确的，且称p-1/2是该算法的优势。如果对于同一实例，蒙特卡罗算法不会给出2个不同的正确解答，则称该蒙特卡罗算法是一致的。有些蒙特卡罗算法除了具有描述问题实例的输入参数外，还具有描述错误解可接受概率的参数。这类算法的计算时间复杂性通常由问题的实例规模以及错误解可接受

17、概率的函数来描述。,21,一、基本思想,对于一个一致的p正确蒙特卡罗算法，要提高获得正确解的概率，只要执行该算法若干次，并选择出现频次最高的解即可。如果重复调用一个一致的(1/2+)正确的蒙特卡罗算法2m-1次，得到正确解的概率至少为1-，其中，对于一个解所给问题的蒙特卡罗算法MC(x)，如果存在问题实例的子集X使得：1)当xX时，MC(x)返回的解是正确的；2)当xX时，正确解是y0，但MC(x)返回的解未必是y0。称上述算法MC(x)是偏y0的算法。重复调用一个一致的，p正确偏y0蒙特卡罗算法k次，可得到一个O(1-(1-p)k)正确的蒙特卡罗算法，且所得算法仍是一个一致的偏y0蒙特卡罗算

18、法。,22,二、主元素问题,设T1:n是一个含有n个元素的数组。当|I|Ti=x|n/2时，称元素x是数组T的主元素。对于任何给定的0，MajorityMC算法重复调用log(1/)次算法Majority。它是一个偏真蒙特卡罗算法，且其错误概率小于。MajorityMC算法所需的计算时间显然是O(nlog(1/)。,templatebool Majority(Type*T,int n)/判定主元素的蒙特卡罗算法int i=rnd.Random(n)+1;Type x=Ti;/随机选择数组元素int k=0;for(int j=1;jn/2);/kn/2 时T含有主元素templatebool

19、MajorityMC(Type*T,int n,double e)/重复调用算法Majorityint k=ceil(log(1/e)/log(2);for(int i=1;i=k;i+)if(Majority(T,n)return true;return false;,23,三、素数测试,Wilson定理：对于给定的正整数n，判定n是一个素数的充要条件是(n-1)!-1(mod n)。费尔马小定理：如果p是一个素数，且0ap，则ap-11(mod p)。二次探测定理：如果p是一个素数，且0 xp，则方程x21(mod p)的解为x=1，p-1。算法prime是一个偏假3/4正确的蒙特卡罗算法。通过多次重复调用错误概率不超过(1/4)k。这是一个很保守的估计，实际使用的效果要好得多。,void power(unsigned int a,unsigned int p,unsigned int n,unsigned int,24,本章小结,略,