复杂网络入门必读.ppt
复 杂 网 络 2010年度讨论班,王 淑 栋山东科技大学办公室:J13-409电话:88032786(H),Email:,2023/9/25,2,报告内容,第一讲.引言 王淑栋第二讲.复杂网络的基本模型 李凯凯第三讲.复杂网络中的搜索 杨梅茜第四讲.网络同步 许秀竹第五讲.复杂网络的相继故障 孙龙霄第六讲.复杂网络控制 张玉林第七讲.网络演化动力学王淑栋第八讲.加权网络 李凯凯第九讲.复杂网络的社团结构 杨梅茜第十讲.网络传播动力学 张玉林,复杂网络研究的著作与综述,汪小帆,李翔,陈关荣.复杂网络理论及其应用.清华大学出版社,2006年.许晓鸣,郭雷.复杂网络.上海科技教育出版社,2006年11月.S.H.Strogatz.Nature,410,(2001)268.R.Albert,A.-L.Barabasi.Rev.Mod.Phys.,51(2002)1079.M.E.J.Newman.SIAM Rev.,45(2003),167.S.N.Dorogovtesev,J.Mendes.Evolving of Networks,Oxford Un.Press,2003.E.Ben-Naim,et al.Complex Networks,Springer,2004.S.Boccaletti,et al.Complex Networks:Structure and dynamics,Phys.Rep.424(2006)175-308.Newman,Barabasi,Watts.The Structure and Dynamics of Networks.Princeton University Press,2006.,3,4,第一讲、引 言,5,1.二十一世纪涌现的新现象,万 维 网,万维网是怎样“链”接的?从一个页面到另一个页面平均需要点击多少次鼠标?,一、为什么研究复杂网络?,6,美国航空网,城市公共交通网,为什么两者结构差异如此之大?这种差异是必然还是偶然的?城市交通涌堵的原因是什么?,7,非典发现在广州,为什么却 在北京爆发呢?传染病是怎样扩散和消失的?,计算机病毒是怎样传播的?,为什么“好事不出门,坏事行千里”呢?,互联网,8,2.二十一世纪科学研究的特点,二十世纪,科学研究的特点是分析的方法,还原论的方法:物理学(牛顿力学、量子力学、电子论、半导体),化学(量子分子论),生物(双螺旋结构);建筑工程(应力应变分析),。,二十一世纪(二十世纪末),系统成为主要的研究对象,整合成为主要方法。普列高津的耗散结构理论,哈肯的协同学,混沌和复杂系统理论,系统生物学。,9,美国Science周刊:“如果对当前流行的、时髦的关键词进行一番分析,那么人们会发现,“系统”高居在排行榜上。”,当分析为主要的研究方法时,人类关注如何将系统“分析”、“分解”,揭开系统的细部,了解是什么元素或部件组成了系统,却忽视或破坏了这些元素是如何组合成系统的。而整合的方法在于了解细部以后,研究“如何组合”的问题。这种方法导致复杂网络结构的研究。,二、复杂系统与复杂网络,10,1.复杂系统与复杂网络的概念,(1)什么是系统?系统:集合(具体元素)+结构+功能。(例:不同角度分析系统,人)(2)系统的结构是什么?一切系统的基础结构都是网络;一切系统的核心结构都是逻辑网络;复杂系统的结构就是复杂网络。,11,复杂网络是构成复杂系统的基本结构,每个复杂系统都可以看作是单元或个体之间的相互作用网络;复杂网络在刻画复杂性方面的重要性是由于结构决定功能的。复杂网络是研究复杂系统的一种角度和方法,它关注系统中因子相互关联作用的拓扑结构,是理解复杂系统性质和功能的基础。,我认为,下个世纪将是复杂性的世纪(I think the next century will be the century of complexity)斯蒂芬.霍金(StephenHaking)(2000)英国剑桥大学应用数学及理论物理学系教授,当代最重要的广义相对论和宇宙论家,是当今享有国际盛誉的伟人之一,被称为在世的最伟大的科学家,还被称为“宇宙之王”。,网络与复杂网络成为二十一世纪的新科学领域!,1)开放性。即与环境和其它系统进行相互作用,交换物质、能量、信息,保持和发展系统内部的有序性与结构稳定性。在这种交换中,系统经历着从低级向高级、从简单到复杂、从无序向有序的不断优化的动态发展过程。虽然开放性是所有真实系统的基本属性,但这里的开放非指一般意义上的相互作用与交流,而开放的度量、性质、强度对复杂系统的性态、演化具有决定性的意义。例子,人,城市网络簇。)涌现性。即内部元素通过非线性相互作用,在宏观层次上产生出新的、元素不具有的整体属性,表现为整体斑图、模式等。虽然涌现同样是所有系统都具有的,但这里涌现意味着新的整体属性的产生。例子,“整体大于部分之和”,大脑的神经网络系统,13,2.复杂系统与复杂网络的主要特性:,14,)演化性(不可逆性)。即通过与所在环境中的其它系统的相互作用和内部的自组织,使系统发展到新的阶段,表现出阶段性、临界性,完成系统演化的生命周期。例:社会网络中的人,生物群体的自组织系统(鸟群),)复杂性。包括系统的结构、行为、功能等多个方面同时具有的复杂性。结构复杂性表现为多元性,非对称性,非均匀性,非线性(分岔(Bifurcation),混沌(Chaos),分形Fractal);行为复杂性表现为学习,自适应性,混沌同步,混沌边沿,随机性等等;认识复杂性又称为主观复杂性,它表现为不确定性,描述复杂性与计算复杂性等等。例:神经网络中的突触有强有弱,可抑制也可兴奋,)网络结构。即系统内部和系统之间的相互作用可以看成由节点、边(连接)构成的体系,出现网络复杂性、小世界特征与无标度特征等。,15,一切系统都具有网络结构,复杂系统具有复杂的网络结构。,16,3.网络系统的复杂性(1)结构复杂性 网络连接结构错综复杂、极其混乱,同时又蕴含着丰富的结构:社区、基序、聚集性、生成规律性等等,而且网络连接结构可能是随时间变化的,例如,WWW上每天都不停地有页面和链接的产生和删除。静态结构的复杂性和结构动态演化的复杂性。例:神经系统由神经元互连形成,连接以“突触连接结构”实现,突触有强弱、兴奋与抑制、不同的神经递质;连接不断改变,形成连接结构变化。(重边,加权等),17,(2)节点复杂性 A)节点的独立或固有特性 网络中的节点可能是具有分岔和混沌等复杂非线 性行为的动力系统。例如,基因网络中每个节点都具有复杂的时间演化行为。而且,一个网络中可能存在多种不同类型的节点。例如,控制哺乳动物中细胞分裂的生化网络就包含各种各样的基质和酶。B)关联引发的节点特性 当关联失去时这类特性会在节点处消失或改变。例如,耦合神经元重复地被同时激活,那么它们之间的连接就会加强,这被认为是记忆和学习的基础。,18,(3)复杂网络之间相互影响的复杂性 实际的复杂网络会受到各种各样因素的影响和作用。例如,电力网络故障会导致Internet网速变慢,运输系统失控等一系列不同网络间的连锁反应。,(4)网络分层结构的复杂性例如,行政管理网络是具有层结构的,多数网络都有节点的分层结构,只是在许多网络中没有意识到是一种造成复杂性的重要结构。,19,复杂网络也是研究复杂系统的一种技术和方法,它关注系统中个体相互作用的拓扑结构,是理解复杂系统性质和功能的基本方法。,复杂网络是二十一世纪科学研究的思想和理念,它启发我们用什么观点理解这个世界:整个世界以及组成世界的任何细部都是由网络及其变化形成的。,20,三、复杂网络研究简史,格尼斯堡七桥问题,Euler(17071783),瑞士数学家,图论之父,一笔画问题,1736年,七桥游戏,21,随机图理论 20世纪60年代,由两位匈牙利数学家Erds和Rnyi建立的随机图理论(random graph theory)被公认为是在数学上开创了复杂网络理论的系统性研究。,Erds和Rnyi的最重要的发现是:ER随机图的许多重要性质都是突然涌现的。也就是说,对于任一给定的概率p,要么几乎每一个图都具有某个性质Q(比如说,连通性),要么几乎每一个图都不具有该性质。在20世纪的后40年中,随机图理论一直是研究复杂网络的基本理论。,22,小世界实验20世纪60年代美国哈佛大学的社会心理学家Stanley Milgram通过一些社会调查后给出的推断是:地球上任意两个人之间的平均距离是6。这就是著名的“六度分离”(six degrees of separation)推断。,为了检验“六度分离”的正确性,小世界实验Bacon数。美国Virginia大学计算机系的科学家建立了一个电影演员的数据库,放在网上供人们随意查询。网站的数据库里目前总共存有近60万个世界各地的演员的信息以及近30万部电影信息。通过简单地输入演员名字就可以知道这个演员的Bacon数。,一个有趣的数学家故事:Erds数证明小世界实验。,23,小世界实验20世纪60年代美国哈佛大学的社会心理学家Stanley Milgram通过一些社会调查后给出的推断是:地球上任意两个人之间的平均距离是6。这就是著名的“六度分离”(six degrees of separation)推断。,为了检验“六度分离”的正确性,小世界实验Bacon数。美国Virginia大学计算机系的科学家建立了一个电影演员的数据库,放在网上供人们随意查询。网站的数据库里目前总共存有近60万个世界各地的演员的信息以及近30万部电影信息。通过简单地输入演员名字就可以知道这个演员的Bacon数。,一个有趣的数学家故事:Erds数证明小世界实验。,24,有两篇开创性的文章可以看作是复杂网络研究新纪元开始的标志:一篇是美国康奈尔(Cornell)大学理论和应用力学系的博士生Watts及其导师、非线性动力学专家Strogatz教授于1998年6月在Nature杂志上发表的题为“小世界”网络的集体动力学(Collective Dynamics of Small-World Networks)的文章;另一篇是美国Notre Dame大学物理系的Barabsi教授及其博士生Albert于1999年10月在Science杂志上发表的题为随机网络中标度的涌现(Emergence of Scaling in Random Networks)的文章。这两篇文章分别揭示了复杂网络的小世界特征和无标度性质,并建立了相应的模型以阐述这些特性的产生机理。,25,1998,Watts和Strogatz:WS小世界网络,D.J.Watts,and S.H.Strogatz,Nature,393,440-442(1998).,26,A.-L.Barabasi and R.Albert,Science,286,509(1999).,1999,Barabasi和Albert:BA无标度网络,27,复杂网络研究的简史列表,技术网络,28,WWW,复杂网络的事例,社会网络,29,朋友关系网,科学引文网,交通运输网络,30,生物网络,Santa Fe 研究所的科学家合作网,32,33,经济物理学科学家合作网,不同领域的复杂网络,社会网:演员合作网,友谊网,姻亲关系网,科研合作网,Email网生物网:食物链网,神经网,新陈代谢网,蛋白质网,基因网络信息网络:WWW,专利使用,论文引用,计算机共享技术网络:电力网,Internet,电话线路网,交通运输网:航线网,铁路网,公路网,自然河流网,34,中药方剂网,虽然中药方剂的数量很大,但目前还没有统计用的数据库。不得不用手工进行统计,因此统计的数据量受到很大限制。选用了1536付药方,681种药物进行了统计。节点(药物),边(在一付方剂中药物的相互作用)。方剂:药物、药物的相互作用构成的固定完全图局域世界,同时也是节点(药物)的合作成果。各个完全图通过共用的节点(药物)架起桥梁,构成网络。网络由完全图连接而成,如下图所示。,35,中药方剂网示意图,点(药材),边(药材之间相互作用),局域世界(方剂),36,中国淮扬菜肴网,节点食品边菜肴中两种食品之间的相互作用每道菜肴局域世界(完全图)通过公共节点连接构成中国淮扬菜肴网。329道菜肴,242个顶点(食品),1713条边。完全类似于中药方剂网的讨论。,37,38,三、复杂网络研究内容,1)复杂网络模型 典型的复杂网络:随机网、小世界网、无标度网等;实际网络及其分类。2)网络的统计量及与网络结构的相关性 度分布的定义和意义,聚集性、连通性的统计量及其实际 意义等。3)复杂网络性质与结构的关系 同步性、鲁棒性和稳定性与网络结构的关系。4)复杂网络的动力学 信息传播动力学、网络演化动力学、网络混沌动力学。5)复杂网络的复杂结构 社团结构、层次结构、节点分类结构等。6)网络控制 关键节点控制、主参数控制和控制的稳定性和有效性。,39,7)复杂网络建模 机理建模、数据建模和实际系统的复杂网络正向与逆向建模。8)复杂逻辑网络 逻辑与高阶逻辑定义、分类、判定算法,高阶逻辑的实际意义等等。,F1:AB;F2:(A,B)C;F3:(A,B,C)DA,B,C,D取布尔值。,40,1)突破性进展的主要原因,越来越强大的计算设备和迅猛发展的Internet,使得人们开始能够收集和处理规模巨大且种类不同的实际网络数据。学科之间的相互交叉使得研究人员可以广泛比较各种不同类型的网络数据,从而揭示复杂网络的共性。以还原理论和整体论相结合为重要特色的复杂性科学的兴起,也促使人们开始从整体上研究网络的结构与性能之间的关系。,四、复杂网络研究二十一世纪的科学,41,2)主要研究目标,发现:揭示刻画网络系统结构的统计性质,以及度量这些性质的合适方法。建模:建立合适的网络模型以及理解网络的统计性质的意义与产生机理。分析:基于单个节点的特性和整个网络的结构性质分析与预测网络的行为。控制:提出改善已有网络性能和设计新的网络的有效方法,特别是稳定性、同步和数据流通等方面。,度(degree):节点 i 的度 ki 定义为与该节点连接的其他节点的数目。直观上看,一个节点的度越大就意味着这个节点在 某种意义上越“重要”(“能力大”)。网络的平均度:网络中所有节点的度和的平均值,记作。事实上,=2q/p?度分布函数p(k):随机选定节点的度恰好为k的概率?节点的聚类系数(簇系数):在简单图中,设节点v的邻集为N(v),|N(v)|=ki,则节点v的聚类系数定义为这ki个节点之间存在边数Ei与总的可能边数ki(ki-1)/2之比,即:Ci=2Ei/ki(ki-1)节点v的邻点间关系的密切程度,五、复杂网络中的基本概念,网络的聚类系数C:所有节点i的聚类系数Ci的平均值。(0C1)C=0网络中所有节点都是孤立点 C=1网络中任意节点间都有边相连 网络节点间联系的密切程度,体现网络的凝聚力,许多大规模的实际网络都具有明显的聚类效应。事实上,在很多类型的网络(如社会关系网络)中,你的朋友同时也是朋友的概率会随着网络规模的增加而趋向于某个非零常数,即当N时,C=O(1)。这意味着这些实际的复杂网络并不是完全随机的,而是在某种程度上具有类似于社会关系网络中“物以类聚,人以群分”的特性。,44,最短路径(Shortest path):两个节点之间边数最少的路径,最短路径的长度称为两点间的距离,用dij,平均路径长度(特征路径长度)L:所有节点对之间的距离的平均值。,研究发现:尽管许多实际复杂网络的节点数巨大,网络的平均路径长度却小的惊人。(小世界效应),45,介数(Betweenness),点介数:网络中通过该节点的最短路径的条数 边介数:网络中通过该边的最短路径的条数反映了节点或边的作用和影响力。如果一对节点间共有B条不同的最短路径,其中有b条经过节点i,那么节点i对这对节点的介数的贡献为b/B。把节点i对所有节点对的贡献累加起来再除以节点对总数,就可得到节点i的介数。类似的,边的介数定义为所有节点对的最短路径中经过该边的数量比例(关键点边!连通性影响?)。介数越大,说明经过该节点(边)的最短路径越多。在信息传播过程中,通过该节点(边)的信息量就越大,于是就越容易发生拥塞。研究表明,节点介数与度之间有很强的相关性,不同类型的网络,其介数分布也大不一样。,46,网络介数 网络点介数,网络边介数:所有节点(边)的平均介数 网络介数说明了网络的什么性质?,核数 一个图的k-核:反复去掉图中度小于等于k 的节点后,所剩余的子图 若一个节点存在于k-核,而在(k+1)-核中被去掉,则此节点核数为k,例:所有度为1的节点的核数必为0 节点核数中的最大值称为网络图的核数 节点核数可以表明节点在核中的深度;即便一个节点的度数很高,它的核数也可能很小。例如:包含N个节点的星型网络的中心节点的度数为N-1,但它的核数为0,问题:,目前刻划复杂网络的统计量有很多,例:聚类系数,平均路径长度,平均度,介数,核数等。能不能用一个或尽可能少的统计量来综合刻划复杂网络的结构呢?用多少相互独立的统计量刻画复杂网络的结构是完备的?,48,谢谢大家!,小世界实验-六度分离,米尔格伦的实验过程是:他计划通过人传人的送信方式来统计人与人之间的联系。首先把信交给志愿者A,告诉他信最终要送给收信人S。如果他不认识S,那么就送信到某个他认识的人B手里,理由是A认为在他的交集圈里B是最可能认识S的。但是如果B也不认识S,那么B同样把信送到他的一个朋友C手中,就这样一步步最后信终于到达S那里。这样就从A到B到C到最后到S连成了一个链。斯坦利米尔格伦就是通过对这个链做了统计后做出了六度分离的结论。然而在这个实验中,实际上只有三分之一的信送到了收信人那里,因此实验的完成率很低。,小世界实验六度分离,我们或许有过这样的经历:偶尔碰到一个陌生人,同他聊了一会后发现你认识的某个人居然他也认识,然后一起发出”这个世界真小”的感叹。那么对于世界上任意两个人来说,借助第三者、第四者这样的间接关系来建立起他们两人的联系平均来说最少要通过多少人呢?美国社会心理学家斯坦利米尔格伦(Stanley Milgram)在1967年通过一些实验后得出结论:中间的联系人平均只需要5个。他把这个结论称为“六度分离”。六度分离:平均只要通过5个人,你就能与世界任何一个角落的任何一个人发生联系。这个结论定量地说明了我们世界的”大小”,或者说人与人关系的紧密程度。30多年来,六度分离理论一直被作为社会心理学的经典范例之一。尽管如此,实际上这个理论并没有得到严格的证实。美国心理学教授朱迪斯克兰菲尔德(Judith Kleinfeld)对米尔格伦最初的实验提出不同意见,因为她发现实验的完成率极低。,小世界实验-Bacon数,截止到几天前,世界电影史上共产生了大约23万部电影,78多万名电影演员(参见互联网电影库).Kavin Bacon在许多部电影中饰演小角色。几年前,Virginia 大学的计算机专家Brett Tjaden设计了一个游戏,他声称电影演员Kevin Bacon是电影界的中心。在游戏里定义了一个所谓的Bacon数:随便想一个演员,如果他(她)和Kavin Bacon一起演过电影,那么他(她)的Bacon数就为1;如果他(她)没有和Bacon演过电影,但是和Bacon数为1的演员一起演过电影,那么他的Bacon数就为2;依此类推。发现:在曾经参演的美国电影演员中,没有一个人的Bacon数超过4。,小世界实验-Bacon数,在网上有一个网页。网站的数据库里总共存有有783940个世界各地的演员的信息以及231,088部电影信息。通过简单地输入演员名字就可以知道这个演员的bacon数。目前比如输入Stephen Chow(周星驰)就可以得到这样的结果:周星驰在1991年的豪门夜宴(Haomen yeyan)中与洪金宝(Sammo Hung Kam-Bo)合作;而洪金宝又在李小龙的最后一部电影,即1978年的死亡的游戏(Game of Death)中与 Colleen Camp 合作;Colleen Camp 在去年的电影Trapped 中与Kevin Bacon 合作。这样周星驰的Bacon数为3。对78万个演员所做的统计:演员的最大Bacon数仅仅为8,平均Bacon数仅为2.948。,小世界实验-Erdos数,Paul Erdos(1913-1996):是出生于匈牙利的犹太籍数学家,被公认为20世纪最伟大的天才之一。Erdos毕生发表的论文超过1500篇(在数学史上仅次于欧拉(Euler,1707-1783),超长的合作者名单,合作者超过450位。但若加上别人所做但曾获他关键性提示之论文,则他的论文应有数万篇。他的研究领域主要是数论和组合数学,但他的论文中涵盖的学科有逼近论、初等几何、集合论、概率论、数理逻辑、格与序代数结构、线性代数、群论、拓扑群、多项式、测度论、单复变函数、差分方程与函数方程、数列、Fourier分析、泛函分析、一般拓扑和代数拓扑、统计、数值分析、计算机科学、信息论等等。Mathematical Reviews 曾把数学划分为大约六十个分支,Erdos的论文涉及到了其中的40%.,小世界实验-Erdos数,Erdos从来没有一个固定的职位,从来不定居在一个地方,也没有结婚,带着一半空的手提箱,穿梭于学术研讨会,浪迹天涯,颇富传奇色彩。有人称他为流浪学者(wande ringscholar)。他效忠的是科学的皇后,而非一特定的地方。各地都有热心的数学家提供他舒适的食宿,安排他的一切,他则对招待他的主人,给出一些挑战性的数学难题,或给予研究上的指导做为回馈。他可以和许多不同领域的数学家合作。数学家常将本身长久解决不了的问题和他讨论,于是很快地一篇论文便诞生了。,小世界实验-Erdos数,数学家以下述方式来定义Erdos数(Erdosnumber):Erdos本人之Erdos 数为0,任何人若曾与Erdos合写过论文,则其Erdos数为1。任何人若曾与一位 Erdos数为l(且不曾与有更少的Erdos数)的人合写过论文,则他的Erdos数为2几乎每一个当代数学家都有一个有限的Erdos数,而且这个数往往非常小,小得出乎本人的预料。比如说证明Fermat大定理的Andrew Wiles,他的研究方向与Erdos相去甚远,但他的Erdos数只有3,是通过这个途径实现的:Erdos-Andrew Odlyzko-Chris M.Skinner-Andrew Wiles.,小世界实验-Erdos数,Fields奖得主的Erdos数都不超过5,(只有Cohen和Grothendieck的Erdos数是5,)Nevanlinna奖得主的Erdos数不超过3,(只有Valiant的Erdos数是3)Wolf数学奖得主的Erdos数不超过6,(只有是6,且只有Kolmogorov是5,)Steele奖的终身成就奖得主的Erdos数不超过4.在具有有限Erdos数的人名单中往往还能发现一些其他领域的专家,如:比尔盖兹(Bill Gates),他的Erdos数是4,通过如下途径实现:Erdos-Pavol Hell-Xiao Tie Deng-Christos H.Papadimitriou-William H.(Bill)Gates.爱因斯坦的Erdos数是2.,网络的拓扑性质,网络中异质节点,2023/9/25,59,二维网络,三维系统生物学,复杂寓于简单,在不同领域许多系统都呈自相似结构,即局部与总体相似。例如国家、河流、行星系等都是这样。“分形”是研究自相似结构的。分形的构成常遵循一种法则:复杂的分形外形是由简单的规则重复迭代生成的。以Koch曲线为例:将一直线三等分,中间的1/3用一等边三角形取代。直线变为4段等长折线。每段直线再按此规则变化,一直重复下去,即生成Koch曲线,