基于加权<i>K</i>-阶传播数的节点重要性

全文HTML

--> --> -->

3.典型网络的节点重要性

为了验证加权K-阶传播数法在节点重要性评估方面的优势, 本文将利用WS小世界网络、海豚网络、美国西部电网、芝加哥公路网络、网络科学家合著网络以及小鼠神经纤维束网络进行仿真分析.
2

3.1.WS小世界网络

-->

3.1.WS小世界网络

小世界网络是指同时具有较短特征路径长度以及较大平均聚类系数的一种网络类型. Watts和Strogatz^[25]最早提出了一种构造小世界网络的方法, 即将最近邻耦合网络中的边依概率进行随机重连, 通常将这种网络称为WS小世界网络. 图1(a)基于100节点最近邻耦合网络随机生成了一个WS小世界网络, 该最近邻耦合网络中每个节点与其邻近的左右两侧各两个节点相连. 在随机重连后, 边31-33和95-96分别被改连为31-72和95-53, 见图1(b)和图1(c), 其余边的位置不变.

图 1 随机生成的100节点WS小世界网络　(a) 网络结构; (b) 边31-33被改连至边31-72; (c) 边95-96被改连至边95-53
Figure1. A random WS small-world network with 100 nodes: (a) Network structure; (b) the edge 31-33 is rescheduled to the edge 31-72; (c) the edge 95-96 is rescheduled to the edge 95-53.

表1列出了该WS小世界网络与同规模随机网络的平均聚类系数、特征路径长度等参数. 可见, 该网络的特征路径长度为随机网络的2.49倍, 但其平均聚类系数为随机网络的近20倍, 这是由于边31-72和95-53的长程连接提高了网络的连通性.

网络类型	节点数	边数	平均聚类系数	特征路径长度
WS小世界网络	100	200	0.486	8.4891
随机网络	100	200	0.0254	3.4158

表1WS小世界网络以及同规模随机网络的网络参数
Table1.Network features of the WS small-world network and random networks.

现利用加权K-阶传播数法对该网络节点的重要性进行分析. 图2(a)为网络的K-阶结构熵${H^K}$

, 图2(b)为权重系数${c^K}$

, 图2(c)为归一化的节点重要性. 此外, 图2(c)中的小图按色度对重要性进行了标注.

图 2 基于加权K-阶传播数法的WS小世界网络节点重要性结果　(a) K-阶结构熵; (b) 权重系数; (c) 节点重要性
Figure2. Node importance of the WS small-world network based on the weighted K-order propagation number algorithm: (a) The K-order structure entropy; (b) the weight coefficient; (c) the importance of nodes.

由前文所述, 节点95和53, 31和72之间的长程连接提高了网络的连通性, 若移除上述任一节点, 网络的特征路径长度将大为增加, 因此加权K-阶传播数法认为以上四个节点的重要性最高是较为合理的. 由于该网络是基于最近邻耦合网络构造的, 而最近邻耦合网络中每个节点与其邻近的左右两侧各两个节点相连. 因此, 与95, 53, 31, 72距离相近的左右各两个节点的重要性应当相似, 且距离95, 53, 31, 72越远, 节点的重要性越低. 例如, 移除91, 92, 99或98中的任一节点对网络结构造成的影响是相似的; 此外, 同时移除99和98相较同时移除100和1, 会有更多的节点难以通过95进行长程通信, 因此99和98的重要性高于100和1是较为合理的. 值得注意的是, 图2(c)中97的重要性显著高于96, 这是由于边96-95被断开, 若依赖96进行长程通信需要借助边95-94, 而97与95直接相连, 因此通过97进行长程通信更为便捷. 此外, 由于边33-31被断开, 33, 34, 35等节点向30, 29, 28等节点进行短程通信, 或经由31向72等节点进行长程通信, 均需要依赖节点32, 因此其重要性应当较高. 最后, 35, 36, 37, 38等节点进行长短程通信时需要依赖33或34; 对35, 37等奇数节点而言, 通过33或34进行通信的效果相同, 但对36, 38等偶数节点而言, 通过34进行通信的效率更高, 可见34的重要性大于33, 这也可以解释图2(c)中36的重要性略高于35等现象.
为了进一步证明加权K-阶传播数法的有效性, 图3绘制了度中心性、Ren法、Chen法、介数中心性、特征向量法、Katz指标(权重衰减因子取1.5倍邻接矩阵最大特征值的倒数)、PageRank算法(阻尼系数取0.85)以及CI法(权重系数取0.5)得出的节点重要性结果. 由于K-核分解法得到的所有节点的重要性相同, 因此其结果未在图3给出.

图 3 基于若干传统算法的WS小世界网络节点重要性评价结果　(a) 度中心性; (b) Ren法; (c) Chen法; (d) 介数中心性; (e) 特征向量法; (f) Katz指标法; (g) PageRank算法; (h) CI法
Figure3. Node importance of the WS small-world network based on some traditional algorithms: (a) Degree centrality; (b) Ren method; (c) Chen method; (d) betweenness centrality; (e) eigenvector method; (f) Katz index; (g) PageRank; (h) CI method.

由图3可知, 以上方法认为33或96的重要性最低, 而加权K-阶传播数法却认为33和96的重要性较高. 由前文分析可知, 虽然在33节点移除后, 网络的长短程通信不会受到显著影响, 但27, 28, 29等节点与34, 35, 36等节点间的短程通信, 或34, 35, 36等节点依靠31进行长程通信只能依赖边32-34进行; 同样, 当96被移除后, 边95-97将参与所有通信, 可见33和96的存在降低了其余重要节点或边的负载, 起到了分流的作用, 因此认为33或96在所有节点中重要性最低是值得商榷的; 度中心性、特征向量法、Katz指标、PageRank算法和CI法认为72和53的重要性远高于31和95, 但长程通信需要同时依赖以上4个节点进行, 因此节点31和72或95和53的重要性应当是相似的; 度中心性、Ren法、Chen法、Katz指标、PageRank算法和CI法, 尤其是K-核分解法对节点的排序并不细致, 存在节点重要性相同的情况; 此外, 介数中心性认为10, 11, 12等节点的重要性高于52, 54, 71, 73等节点, 49, 51, 55, 57, 74, 76等节点的重要性高于50, 52, 54, 56, 73, 75等节点, PageRank算法认为61, 62, 63等节点的重要性高于52, 54, 71, 73等节点, 均缺乏较为合理的解释. 可见, 加权K-阶传播数法对网络通信的刻画更为细致, 节点重要性的评估优于以上传统方法.
2

3.2.海豚网络

-->

3.2.海豚网络

为了进一步验证加权K-阶传播数法的有效性, 本文以海豚网络为例进行研究. Lusseau等^[26,27]对新西兰道特富尔峡湾(Doubtful Sound) 62只宽吻海豚进行研究并构建了海豚社会网络. 基于加权K-阶传播数法的海豚网络节点重要性结果如图4所示, 图4(a)为网络的K-阶结构熵${H^K}$

, 图4(b)为权重系数${c^K}$

, 图4(c)为归一化后的节点重要性. 网络中节点代表海豚, 边表示海豚间的相关接触.

图 4 基于加权K-阶传播数法的海豚网络节点重要性结果　(a) K-阶结构熵; (b) 权重系数; (c) 节点重要性
Figure4. Node importance of the dolphin network based on the weighted K-order propagation number algorithm: (a) The K-order structure entropy; (b) the weight coefficient; (c) the importance of nodes.

表2列出了基于加权K-阶传播数法、Ren法、Chen法、介数中心性、特征向量法、Katz指标(权重衰减因子为1.5倍邻接矩阵最大特征值的倒数)、PageRank算法(阻尼系数0.85)、CI法(权重系数取0.5)得出的前15个重要节点的排序结果. 由于度中心性和K-核分解法存在节点重要性相等的情况, 其排序结果未在表2列出. 其中, 基于度中心性法得到的节点重要性排序结果(前20个重要节点)为15 > 38 = 46 > 34 = 52 > 18 = 21 = 30 = 58 > 2 = 14 = 39 = 41 > 10 = 16 = 19 = 37 = 44 = 51 = 55; K-核分解法认为1, 2, 7, 8, 9等37个节点的重要性最高且相等.

节点重要性	加权K-阶传播数法	Ren法	Chen法	介数中心性法	特征向量法	Katz指标法	PageRank算法	CI法
1	15	15	15	37	15	15	15	15
2	38	38	38	2	38	38	18	38
3	46	46	46	41	46	46	52	46
4	21	34	34	38	34	34	58	34
5	41	51	51	8	51	52	38	41
6	34	41	41	18	30	30	46	30
7	37	21	17	21	52	41	34	52
8	30	30	22	55	17	21	30	21
9	52	52	19	52	41	51	14	51
10	51	44	30	58	22	39	2	19
11	2	39	21	40	19	19	21	39
12	39	19	25	29	39	17	39	17
13	19	37	39	30	25	22	10	22
14	44	22	52	44	44	44	41	44
15	9	18	44	15	21	25	55	25

表2海豚网节点重要性排序结果
Table2.Node importance ordering result of the dolphin network.

与度中心性、Ren法、Chen法、特征向量法、Katz指标、PageRank算法和CI法不同, 加权K-阶传播数法认为节点37相对重要, 排在第7位. 文献[27]将该海豚网络划分成了若干小社区, 指出37号海豚曾消失了一段时间, 此时不同海豚社区间的互动受到了限制, 当37号海豚再次出现时, 社区又恢复了普遍联系, Lusseau等^[27]指出37号海豚是社区间信息交流的关键个体. 因此, 加权K-阶传播数法认为节点37相对重要的结论是较为合理的. 然而, 37号海豚处于社区边缘, 因此介数中心性认为节点37重要性最高的结论是值得商榷的.
此外, 加权K-阶传播数法提高了对节点2和21的重视程度, 分别排在第11和第4位, 而2和21处于各自海豚社区偏中心位置, 又与37等负责信息交流的节点直接相连, 因此该结论是较为合理的; Ren法、Chen法、特征向量法、Katz指标法和CI法认为节点22相对重要, 但该节点的度中心性与介数均是较低的; 最后, 度中心性法和K-核分解法存在节点重要性相同的情况, 排序不细致. 可见, 加权K-阶传播数法在评价海豚网络节点重要性时适当地提高了对海豚社区间信息交流起到关键作用的节点的重视程度, 结果更为合理.
2

3.3.基于节点重要性的蓄意攻击研究

-->

3.3.基于节点重要性的蓄意攻击研究

为了进一步验证加权K-阶传播数法的优越性, 本文对美国西部电网^[25]、芝加哥公路网络^[28]、网络科学家合著网络^[29]以及小鼠神经纤维束网络(Kasthuri_graph_v4)^[30]进行了节点重要性研究. 其中美国西部电网共有4941个节点和6594条边, 描述了美国西部的高压输电电网结构; 芝加哥公路网络共有1467个节点和1298条边, 描述了美国芝加哥地区的公路运输情况; 网络科学家合著网络共有1589个节点和2742条边, 描述了从事网络理论和实验的科学家合著关系; 小鼠神经纤维束网络共有1029个节点和1700条边, 描述了小鼠部分脑皮层中神经元间的轴突束连接. 美国西部电网、芝加哥公路网络和网络科学家合著网络均是无权无向的; 小鼠神经纤维束网络是有权无向的, 为了适应加权K-阶传播数法, 本文忽略了该网络的边权信息. 以上网络的K-阶结构熵H^K如图5所示.

图 5 K-阶结构熵　(a) 美国西部电网; (b) 芝加哥公路网络; (c) 科学家合作网络; (d) 小鼠神经纤维束网络
Figure5. The K-order structure entropy: (a) The western power grid of the United States; (b) the road transportation network of the Chicago region; (c) the co-authorship network in network science; (d) the axonal tracts network between neurons of mouse.

由于以上四个网络的节点数较多, 本文拟采用蓄意攻击策略对节点重要性进行研究^[31-33]. 蓄意攻击策略是指基于节点重要性由高到低的排序依次攻击网络, 即移除与节点相连的所有边, 通过网络结构随攻击次数的变化情况来评价节点重要性算法的各自特点. 由于在蓄意攻击后网络结构发生了变化, 因此仅仅依据原始网络的节点重要性进行研究会存在偏差. 为了解决此问题, 本文在每次蓄意攻击后更新节点排序结果. 此外, 若存在重要性相等的情况, 将选择编号最小的节点进行攻击.
由于网络被攻击后可能会出现孤立节点, 因此选用网络效率来评价网络的连通性. 网络效率的表达式为

$e = \frac{1}{{n(n - 1)}}\sum\limits_{{v_i} \ne {v_j}} {\frac{1}{{{d_{{v_i}{v_j}}}}}} , $

其中${d_{{v_i}{v_j}}}$

是指节点${v_i}$

和${v_j}$

之间的最短路径长度. 由(6)式可知, e值越大, 网络效率越高; 当网络由孤立节点组成时$e = 0$

, 取值最小. 攻击节点可能造成网络连接通路的中断, 节点间的最短路径将有所增大, 网络效率则会随之降低. 为了更为直观地反映被攻击后网络效率的降低情况, 依照文献[9]定义网络效率下降率$\varepsilon $

为

$\varepsilon = 1 - \frac{e}{{{e_0}}}, $

其中${e_0}$

为未被攻击的原始网络的网络效率. 由(7)式可见, ε的取值为$[0,\;1]$

, 当网络未被攻击时$\varepsilon = 0$

, 当网络被攻击时ε会随之升高; 最终, 当所有的边被删除时网络效率降至最低, 此时$\varepsilon = 1$

. 此外, 为了进一步分析攻击前后网络拓扑结构的变化情况, 依照文献[33]将网络最大子图节点数设为γ. 图6和图7分别绘制了美国西部电网、芝加哥公路网络、网络科学家合著网络以及小鼠神经纤维束网络基于不同节点重要性的排序方法, 其网络效率下降率ε和最大子图节点数γ随攻击次数的变化曲线. 其中, Katz指标的权重衰减因子为1.5倍邻接矩阵最大特征值的倒数; PageRank算法的阻尼系数取0.85; CI法的权重系数取0.5.

图 6 网络效率下降率ε随攻击次数的变化情况　(a) 美国西部电网; (b) 芝加哥公路网络; (c) 网络科学家合著网络; (d) 小鼠神经纤维束网络
Figure6. Change of the network efficiency decrease rate ε with attacking times: (a) The western power grid of the United States; (b) the road transportation network of the Chicago region; (c) the co-authorship network in network science; (d) the axonal tracts network between neurons of mouse.

图 7 最大子图节点数γ随攻击次数的变化情况　(a) 美国西部电网; (b) 芝加哥公路网络; (c) 网络科学家合著网络; (d) 小鼠神经纤维束网络
Figure7. Change of the node number of the maximum sub-graph ε with attacking times: (a) The western power grid of the United States; (b) the road transportation network of the Chicago region; (c) the co-authorship network in network science; (d) the axonal tracts network between neurons of mouse.

对美国西部电网而言, 依照加权K-阶传播数法和介数中心性法的排序结果进行攻击, 网络效率下降得最为迅速, 仅攻击约100次后, 网络效率便下降了近90%; 而依据度中心性、Ren法、Chen法、特征向量法、Katz指标、PageRank算法和CI法则需约300次, K-核分解法需约550次, 才能达到同等效果. 此外, 基于加权K-阶传播数法和介数中心性对网络进行攻击, 最大子图节点数降低的速率远远高于其他方法. 以加权K-阶传播数法为例, 当网络被攻击200次后, 最大子图节点数仅为154, 为原始网络节点数的3%, 可认为网络基本瘫痪. 而度中心性、Ren法、Chen法、特征向量法、Katz指标和CI法则需攻击近400次, PageRank算法需650次, K-核分解法需1000次才能达到相同效果; 对芝加哥公路网络而言, 依据加权K-阶传播数法、介数中心性、Chen法、特征向量法、Katz指标和CI法进行蓄意攻击, 网络被破坏的程度较为接近, 且优于度中心性、Ren法、PageRank算法和K-核分解法. 其中, 依据加权K-阶传播数法进行蓄意攻击, 网络效率下降得最为迅速; 对网络科学家合著网络而言, 依照加权K-阶传播数法和介数中心性进行蓄意攻击, 网络被破坏的程度较为接近, 且优于其他算法; 对小鼠神经纤维束网络而言, 依据加权K-阶传播数法、度中心性、介数中心性、特征向量法、Katz指标、PageRank算法和CI法进行蓄意攻击, 网络被破坏的程度较为接近, 且优于Ren法、Chen法和K-核分解法. 其中, 依据加权K-阶传播数法和介数中心性进行蓄意攻击, 网络最大子图节点数下降得最为迅速, 略优于其他算法.
综上所述, 无论对美国西部电网、芝加哥公路网络、网络科学家合著网络还是小鼠神经纤维束网络而言, 基于加权K-阶传播数法进行蓄意攻击, 仅需移除少量重要节点便可实现对网络结构的充分破坏.

4.结　论

本文考虑到个体间的相关关系, 基于网络拓扑结构重新描述了传染病模型, 并将各个节点分别设置为传染源进行疾病传播, 提出了加权K-阶传播数法. 通过对WS小世界网络的仿真分析发现, 加权K-阶传播数法相较于传统的节点重要性评价指标能够更为综合地考量长程连接对网络长、短程通信的影响; 此外, 加权K-阶传播数法不仅认为海豚网络社区中心的重要性较高, 且适当地提高了对社区间的信息交流起到关键作用的海豚的受重视程度. 最后, 本文还基于蓄意攻击策略以美国西部电网、芝加哥公路网络、网络科学家合著网络以及小鼠神经纤维束网络为实例进行了研究. 然而, 由于目前加权K-阶传播数法的求解依赖于网络邻接矩阵的K-阶多项式, 需要进行K–1次矩阵乘法和K次矩阵加法, 时间复杂度较高. 因此需要进一步探索K-阶传播数的物理意义以提出更为便捷的求解方案. 此外, 小鼠神经纤维束网络原为有权网络, 为了适应加权K-阶传播数法, 本文忽略了该网络的边权信息. 因此将加权K-阶传播数法进行改进, 使其适用于有向有权网络, 也是后续研究的重点.

本站小编 Free考研考试/2021-12-29

English Abstract

Node importance based on the weighted K-order propagation number algorithm

1.College of Electronic and Optical Engineering, College of Microelectronics, Nanjing University of Posts and Telecommunications, Nanjing 210023, China
2.National and Local Joint Engineering Laboratory of RF Integration and Micro-Assembly Technology, Nanjing 210003, China

Corresponding author:Huang Li-Ya, huangly@njupt.edu.cn

全文HTML

3.1.WS小世界网络

3.2.海豚网络

3.3.基于节点重要性的蓄意攻击研究

相关话题/网络 传播 结构 指标 疾病

领限时大额优惠券,享本站正版考研考试资料!

知识图谱复杂网络特性的实证研究与分析

在具有排斥耦合的神经元网络中有序斑图的熵测量

退火温度对Ta<sub>2</sub>O<sub>5</sub>/SiO<sub>2</sub>多层反射膜结构和应力特性的影响

复杂网络电输运性能与通信序列熵之间的关联

基于相对距离的复杂网络谱粗粒化方法

CdSeS合金结构量子点的多激子俄歇复合过程

钫原子磁偶极超精细结构常数及其同位素的磁偶极矩的理论计算

超强激光与泡沫微结构靶相互作用提高强流电子束产额模拟研究

湍流等离子体鞘套中高斯光束的传播特性分析

Helmholtz腔与弹性振子耦合结构带隙