1.Alibaba Research Center for Complexity Sciences, Hangzhou Normal University, Hangzhou 311121, China 2.Institute of Fundamental and Frontier Science, University of Electronic Science and Technology of China, Chengdu 611731, China
Abstract:In real life, most of the infrastructure networks closely related to the national economy and people's livelihood do not exist independently, but are interconnected with or dependent on each other, so the multilayer network model is proposed to study the independent complex systems and infrastructures. When the nodes in the multilayer network suffer initial failure or attack, the cascade occurs due to the interaction between the “intra-layer” and “inter-layer”, and the failure can propagate in the network layer and across the layers iteratively, so that the scale of the failures is enlarged gradually. As a result, many multilayer networks are more fragile than single networks. The cascading failure of multilayer network usually brings very serious catastrophes to our society. So, conducting the research on preventing the multilayer network from cascading failure and recovering is of great significance. As far as the prevention of cascading failure is concerned, what are mainly included are the strategies such as the fault detection, the protection of important nodes, the optimization of the coupling method of networks, and the backup of nodes. As for the recovery of multi-layer network, included mainly are the strategies such as common boundary node recovery, the idle connected link recovery, the link addition, the priority recovery of important nodes, the topology perturbation, and the repairing of localized attack and adaptive link. Keywords:complex network/ cascade failure/ precaution strategy/ recovery strategy
全文HTML
--> --> -->
1.引 言在复杂网络研究的早期, 单个网络上的多个动力学特性均受到了广泛的关注, 如疾病传播[1,2]、网络同步[3,4]、级联失效[5]和网络控制[6,7]等. 而随着研究的深入, 人们发现很多现实网络都不是孤立存在的, 比如电力网络和通讯网络之间存在相互依赖关系. 这些网络会因与其他网络之间的依赖关系, 在面临蓄意攻击或随机故障时比孤立网络更加脆弱[8]. 现实中存在互相依赖和联系的复杂系统非常多, 如黑客或者病毒的攻击会使得因特网出现故障甚至瘫痪, 从而导致银行金融系统、电力网络、交通网络和物流信息网络等一系列关键基础设施的数据采集与监视控制系统(supervisory control and data acquisition, SCADA)无法正常工作, 进而导致这些系统的瘫痪和崩溃. 比如电力网络中的发电站需要铁路网络等为其运送燃料和物资的补给, 而铁路网络也需要通过电力网络和通信网络提供支撑和控制. 图1[9]总结了电力基础设施网络和其他基础设施之间的依赖关系. 这些基础设施中的一个或某几个一旦出现故障或受到攻击, 其影响都会快速地扩散到其他相关网络中, 引发一系列迭代级联事故, 从而将损害扩大到更广范围. 发生在2003年意大利停电事故[10]和2005年8月印度尼西亚大停电事故均凸显了这种大规模的耦合网络故障对社会生产生活甚至国家安全带来的巨大风险. Tootaghaj等[11]搜集了全球近年来比较重大的停电事故, 如表1所列. 为了避免和减少级联失效对基础设施所带来的损害, 2016年, 我国通过了《网络安全法》, 构建起以信息共享为基础, 事前预防、事中控制、事后恢复与惩治的关键信息基础设施保护体系[12]. 美国在这方面也甚为关注, 自克林顿政府以来就出台大量的相关法律文件: 第63号总统令和《国土安全法》等, 扩展对关键基础设施的保护范围[13]. 图 1 电力基础设施依赖关系[9] Figure1. Dependencies among power infrastructures[9].
地点
日期
受灾人数/百万
巴西
1999/3/11
97
印度
2001/1/2
230
美国, 加拿大
2003/8/14-15
55
意大利, 瑞士
2003/9/28
55
印度尼西亚
2005/8/18
100
巴西, 巴拉圭
2009/11/10-11
87
土耳其
2015/3/31
70
印度
2012/7/30-31
620
孟加拉
2014/11/1/
150
肯尼亚
2016/6/7
44
表1重大停电事故数据[11] Table1.Data on major power outages[11].
Muro等[14]提出相依网络恢复策略, 旨在对未被级联失效波及的剩余网络进行保护. 这一策略使得级联失效过程和恢复过程动态交替进行, 其核心是找到两个相依网络中的共同边界节点. 共同边界节点是指两个网络中距离各自巨分支距离为1的一对失效的相互依赖节点. 图4中节点1和2即为共同边界节点. 初始网络A发生了故障, 网络B中所对应的节点也会失效, 在网络B将故障传递回网络A之前, 恢复机制会介入并找出当前的共同边界节点, 每轮恢复阶段以概率γ对共同边界节点进行恢复, 从而尽可能地遏制级联失效在相依网络上的传播. Muro等发现, 最终网络有以下三种情况, 第一是系统不被修复也不会崩溃; 第二是部分节点在这一过程中失效, 但恢复策略避免了系统的崩溃; 第三是恢复过程也不能阻断级联失效过程, 最终系统崩溃. 图 4 故障恢复策略图解[14] 网络A和网络B的巨分支如图所示. 情况1: 两个通过相依边连接的失效节点(节点1和节点2)分别距离其巨分支的距离l = 1, 然后以恢复概率γ进行修复; 情况2: 如果两个相互依赖的故障节点(节点3和节点5)中至少有一个与其巨分支的距离大于1, 则不符合恢复的条件, 所以放弃恢复这一对节点 Figure4. Illustration of failure recovery strategy[14]. The giant components of network A and network B are shown in the figure. Case 1: Two failed nodes (nodes 1 and 2) connected by dependent edges are respectively at a distance of l = 1 from their maximal cluster, and then repaired with recovery probability γ. Case 2: If at least one of the two interdependentdent failed nodes (nodes 3 and 5) is more than 1 away from its maximal cluster, the recovery condition is not met, so the pair of nodes is abandoned to be restored.
在Buldyrev提出的相依网络级联失效模型的基础上, La Rocca等[67] 2018年提出在两个相依网络中对相较而言恢复代价更低的那个网络进行恢复的策略. 这里假设网络B为符合条件的网络, 在步骤n = 0时, 从网络A中移走1-p比例的节点, 得到网络A的巨分支. 因为网络A与网络B的节点一对一依赖, 所以可以得到网络B此时的巨分支. 以概率γ同时恢复网络B中某个有限簇(其规模不小于2)中的两个节点与巨分支之间的连边. 但如果该有限簇只有单个节点, 那么就以相同方式恢复其与巨分支之间的一条连边. 需要注意的是所有可能被恢复的有限簇中的节点必须有空闲连边. 空闲连边是一种虚拟连边, 指的是那些在级联失效过程中断开的连边. 当一条连边断开以后, 则它两端的节点各自得到一条空闲连边, 如图5(a)中的虚线边所示. 图 5 网络B中恢复策略的实现示意图[67] (a) GC表示网络巨分支, 虚线表示空闲连边, 带有空闲连边的簇表示可修复的簇, 没有空闲连边的簇表示无法进行恢复的簇; (b)网络B完成重连后的巨分支 Figure5. Schematic diagram of the implementation of recovery strategy in network B[67]: (a) GC represents the giant component of the network, the dashed lines indicate idle connected edges, clusters with free connected edges repre-sent repairable clusters, and clusters without free connected edges represent clusters that cannot be recovered; (b) the giant component of network B after reconnection.