Abstract:Crucial to the physicists’ strong interest in the field is the fact that such macroscopic properties typically arise as the result of a myriad of interactions between the system constituents. Network science aims at simplifying the study of a given complex system by representing it as a network, a collection of nodes and edges interconnecting them. Nowadays, it is widely recognized that some of the structural traits of networks are in fact ubiquitous properties in real systems. The identification and prediction of node influence are of great theoretical and practical significance to be known as a hot research field of complex networks. Most of current research advance is focused on static network or a snapshot of dynamic networks at a certain moment. However, in practical application scenarios, mostly complex networks extracted from society, biology, information, technology are evolving dynamically. Therefore, it is more meaningful to evaluate the node's influence in the dynamic network and predict the future influence of the node, especially before the change of the network structure. In this summary, we contribute on reviewing the improvement of node influence in dynamical networks, which involves three tasks: algorithmic complexity and time bias in growing networks; algorithmic applicability in time varying networks; algorithmic robustness in a dynamical network with small or sharp perturbation. Furthermore, we overview the framework of economic complexity based on dynamical network structure. Lastly, we point out the forefront as well as critical challenges of the field. Keywords:growing networks/ time-variant dynamic network/ network perturbation/ node influence
全文HTML
--> --> --> -->
2.1.增长网络
增长网络最显著的特征是网络规模不断地变大, 最常见的例子比如因特网、合作网络、引文网络. 网络增长导致算法的复杂性和成本提高, 因此有必要设计针对不同算法复杂性和不同网络规模, 利用节点局部到全局信息的渐进式的算法. 像紧密度、介数还有基于矩阵特征向量等网络结构全局信息的方法计算复杂性太高导致难以在大规模网络中应用[42], 而像度等这样局部特征的算法虽然算法复杂性低但预测的准确性低. 那么如何在网络规模增长到上千万甚至过亿节点的情况下快速而准确地预测节点影响力, Ercse-Ravasz等[43,44]提出了如图2所示的局部介数方法, 该方法可以只计算节点的局部信息就可以预测节点的介数. Lü等[45]也通过节点的局部特征近似计算katz指标用于复杂网络链路预测. 图 2 局部到全局的渐进式算法的示意图 (a) 全局算法; (b) 渐进式算法 Figure2. The diagram of local to global progressive algorithm: (a) Global algorithm; (b) The local to global progressive algorithm.
在实时动态网络中, 节点影响力算法的适应性问题. 现实世界的网络的统计分析表明, 大量网络的集聚性[54]、度-度相关性[55,56]、度分布[57]等基本网络结构拓扑特征是随时间演化的, 诸如社交网络之类网络结构几乎是实时动态变化的, 图3给出一个实时动态网络示例图. 图 3 实时动态网络 (a) 含有一段时间的网络; (b) 动态演化网络 Figure3. An example of the time-variant dynamic network: (a) A network with a period of time; (b) the time-variant dynamic network.
在社交网络中, 大量的研究表明网络集聚性会影响网络的传播、同步、控制等功能[58]. Klemm等[59]研究表明集群动力学中节点的影响力是由网络拓扑结构和集群动力学机制共同决定的. Aral和Walker[60]研究网络上的用户传播行为时, 发现有影响力的节点更具有集聚性. Centola[61]发现传播行为在高集聚类网络中传播更快. Bond等[62]以2010年美国大选为实例研究时发现Facebook用户的影响力与网络结构和传播机制两者都相关. 宋玉萍和倪静[63]通过构建可变集聚系数的无标度网络模拟现实中的实时动态网络的结构演化, 以及通过采用经典传播模型进行传播影响力的仿真实验, 系统分析了在不同集聚系数的无标度网络中预测节点影响力算法的准确性. 结果发现度和介数的准确性在低集聚系数的网络中表现更好, 特征向量则在高集聚网络中更准确, 而紧密度的准确性受网络集聚系数的变化影响较小. 因此当网络的集聚系数较低时, 可选择度或者介数进行网络节点影响力评价; 反之则需要选择紧密度指标或特征向量指标. 另一方面, 传播过程的感染率越高, 度指标和介数指标越可靠, 紧密度和特征向量则相反. 另外Ma等[64]和邵凤等[65]也进行其他网络特征属性的研究, 结果如图4所示. 4种经典节点影响力算法 (度、紧密度、介数、特征向量中心性) 在可变度-度相关性的无标度网络中的准确性也是不同的. 另外也可以通过将实时动态网络变成高阶网络[66,67], 这时原来网络的结构就发生改变. 如Xu等[68]和Tao等[69]将全球航运网络转换为高阶网络, 分析Pagerank的排序变化情况. 图 4 4种经典节点影响力算法(度、紧密度、介数、特征向量中心性)在可变度-度相关性的无标度网络中准确性, 其中β表示传播参数, r表示可变度-度相关性的无标度网络中的度- 度相关性参数, Kendall's tau值大小表示节点影响力方法的准确性 Figure4. The accuracy analysis of four centrality (degree, closeness, betweenness, eigenvector) methods on the scale-free network model with tunable assortative coefficient r and different infectious rate β.
22.3.结构微扰或突变的动态网络 -->
2.3.结构微扰或突变的动态网络
在生态网络中, 网络结构经过自然演化基本形成了稳定的结构, 但是经常可能遭遇一些自然因素, 比如极端天气、自然灾害或人为因素的干扰, 这样就会对原本稳定的网络结构造成了扰动. 还有就是交通网络, 节点代表站点, 边代表客流量, 我们知道在一般的工作日中, 由站点和客流量构成网络结构基本是固定的, 但是在周末或者节假日等会导致某些站点变得异常重要, 特别是在遭遇局部的极端天气时会导致某些站点重要性失效或者其周边可替代的节点就变得异常重要. 与交通网络类似, 还有日常生活中的电网, 由于某些节点突发原因导致级联失效. 另外在国际贸易网络中也有类似的现象, 例如遭遇局部战争、局部地区动荡或者突发的金融经济危机等, 造成网络结构发生微小扰动或者重大改变. 对于这类问题, 抽象成复杂网络问题就是网络结构在演化过程中保持某种状态, 但是随时会遇到网络中部分节点和边的状态发生变化即结构微扰或突变. 那么在这种复杂动态网络中, 如何预测节点影响力? 这就涉及到节点影响力方法的鲁棒性问题. 美国东北大学的Ghoshal和Barabasi[70]研究了对随机网络和无标度网络结构微扰时, 通过PageRank算法的计算所得的节点影响力排序的稳定性. 结果表明PageRank面对经过微扰过的随机网络进行节点影响力排序表现很敏感, 而对经过微扰过的无标度网络的节点排序时表现很好的鲁棒性, 特别地还存在排序超级稳定(super-stable)的节点. Lü等[71]也将结构微扰理论用于预测复杂网络连边. 最近出现一个热门领域, 即经济复杂性-基于数据驱动预测经济发展潜力[11,12]. 其基本想法是通过国家进出口贸易数据构建一个国家-产品的二部分网络(网络中边代表国家或地区有能力生产和出口某种产品), 通过对这个二部分网络的结构特征分析, 定量刻画国家的经济复杂性. 研究结果发现未来经济的发展状况, 至少在短期内, 主要由国家产业结构复杂性所决定的. 如果想要实现持续的经济增长和繁荣, 就应该把力气花在满足自身经济复杂性涌现的条件上, 而这就取决于二部分网络的结构特征. 目前该研究主题方兴未艾, 国内外主要有意大利罗马大学Pietronero小组[72-74]、美国麻省理工学院的Hidalgo小组[75-77]、瑞士弗里堡大学Zhang小组[78,79]、电子科技大学周涛小组[11,80,81]等在这方面做了一系列的研究工作. 一般国家竞争力或影响力与其进出口的产品组合(即国际贸易网络的嵌套结构(nested structure))紧密相连. 嵌套结构的定义原本来自生态学中, 简单讲就是岛屿生物系统中, 在小岛屿中出现的物种多数也出现在物种相对丰富的大岛屿中, 这一非随机分布格局被命名为嵌套结构[5]. 图5 给出了三个网络嵌套性分别为0, 0.5, 1的进出口网络的示意图. 这里选取经典网络的嵌套性算法NODF[82]如下. 首先对邻接矩阵的列和行按照度降序排列, 然后按照(1)式和(2)式计算网络的嵌套性. 图 5 邻接矩阵的嵌套性示意图 (a) 邻接矩阵的嵌套值为0; (b) 邻接矩阵的嵌套值为0.5; (c) 邻接矩阵的嵌套值为1 Figure5. The nestedness of the adjacency matrix: (a) The nestedness of the adjacency matrix is 0; (b)the nestedness of the adjacency matrix is 0.5; (c)the nestedness of the adjacency matrix is 1.
其中k为节点的度. 最终求得的邻接矩阵的嵌套值为$ [0, 1] $. 其中0表示邻接矩阵没有嵌套性质, 如图5(a), 1表示网络拥有完美的嵌套特性, 如图5(c). 嵌套结构也常用来刻画非生态系统, 例如全球或地方的经济贸易格局的演变[83]. 图6给出了牛肉、摩托车、医疗器械三类不同商品的国际贸易网络的可视化邻接矩阵, 对应三个显著不同的嵌套特性, 图中的曲线为国际贸易中786类商品的嵌套性分布图. 随着科技进步和贸易日趋紧密, 这种贸易网络中对应的嵌套特性演化规律和机制, 以及与国家经济复杂性和影响力的映射关系. Bustos等[84]研究发现在网络在演化过程中, 嵌套拓扑结构特性保持稳定, 但是网络中会有部分连边消失或新出现一些连边. 这一发现可以用来描述和预测国家某些新产业的出现或消失的模式, 从而找到经济发展的新动力, 为国家或地区经济的发展做出前瞻指导. 图 6 786类商品国际贸易网络的嵌套性分布图, 其中子图为牛肉、摩托车、医疗器械三类不同商品的国际贸易网络的可视化邻接矩阵 Figure6. Distribution of the nestedness in the international trade networks with 786 kinds of goods. (subgraphs) The matrices are representations of the different layer of world trade networks which respectively corresponds to the network of Bovine, Motorcycles, and Medical Instruments.