删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于链路预测的未来新增航线发现*

本站小编 Free考研考试/2021-12-25

分析航空运输网络结构演变态势,预测未来新增航线,是航空公司及早进行资源布局、占据竞争优势的迫切需求,也是机场适时调整发展战略、地方政府抢占政策先机的重要依据。基于新增航线预测研判航空运输网络发展模式,对确保整个网络持续良性发展、增强网络结构鲁棒性乃至重建下一代航空运输网络都有着重要的意义。
新增航线预测与航线网络结构优化一直是航空运输业关注的研究热点。Kasturi等[1]运用最优化思想,从航空公司角度出发,以航线盈利能力最大或运营成本最小为优化目标,构建航线网络优化模型,为新增航线提供参考依据。葛伟等[2]立足于整个航空运输网络,强调网络演变应尽可能靠近某种“好”的结构,如蛛网结构,并由此推断未来新增航线将与蛛网的形成相关。
复杂网络是近年来国内外****的研究热点,其中尤以网络结构分析特别是链路预测技术发展迅速。所谓链路预测,是指基于已知的网络节点和网络结构等信息预测网络中尚未连接的2个节点之间未来产生链接的可能性[3],目前在社交网络[4]、合著网络[5]、生物医学网络[6]等领域已取得成功应用。近年来,逐渐有****开始探索将复杂网络特别是链路预测技术应用于航空运输网络。Takahashi等[7]采用基于相似性的链路预测方法,考虑网络结构特征,识别航空运输网络中未来可能的新增航线。Najari等[8]改进基于相似性的链路预测方法,将航空运输网络按航空公司分层,考虑层内及层间的结构相似性,进行新增航线预测。刘宏鲲等[9]采用链路预测技术分析航空运输网络的演变及其影响因素,指出通航城市属性在预测中的重要性。Zheng等[10]考虑网络结构和航班频率,构建加权局部贝叶斯模型预测未来新增航线。
总体来讲,采用链路预测技术预测未来新增航线的相关研究仍处于探索阶段,且目前主要采用基于相似性的预测方法,存在网络信息挖掘不充分、相似性指标选取主观化等问题。基于此,本文结合航空运输网络特性,提出了一种新增航线发现(New Air Routes Prediction,NARP) 模型,主要贡献如下:①通过提取节点对的局部封闭子图捕获网络局部拓扑结构上的非线性模式;②考虑通航城市的社会、经济、环境等属性,提出一种融合网络结构特征和节点属性特征的NARP模型;③采用深度图卷积神经网络(Deep Graph Convolution Neural Network,DGCNN)进行图特征学习,解决对人为指定相似性指标的依赖。
1 航空运输网络与新增航线发现 航空运输网络是以通航城市为节点、城市间直飞航线为边形成的网络,是航空客运网和航空货运网的叠加,其网络节点(通航城市)具有天然的社会、经济、环境等属性。新增航线是指当前网络中不存在、但一段时间之后将会出现在网络中的直飞航线,是航线网络结构动态演变的重要组成,同时也受通航城市社会、经济、环境等因素影响。作为一种复杂网络,航空运输网络的拓扑结构和节点属性中都蕴含着预示网络结构未来演变模式的潜在信息,本文试图通过捕捉网络演变模式,挖掘航线新增的原因和驱动力,实现对未来新增航线的预测。
2 基于链路预测的NARP模型 本文提出一种基于链路预测的NARP模型,综合考虑航空运输网络局部拓扑结构特征和节点层次属性特征,采用DGCNN对特征相似性进行学习,通过将链路预测问题转换为二分类问题实现未来新增航线的发现。图 1给出了NARP模型的主要框架,详述如下:
图 1 NARP模型的主要框架 Fig. 1 Major framework of NARP model
图选项




1) 考虑网络局部拓扑结构特征,提取局部封闭子图,构建子图邻接矩阵。
2) 考虑节点在局部封闭子图中的结构重要性,根据距离标记子图中节点,构建子图节点标签向量。
3) 考虑节点社会、经济、环境等因素对新增航线的影响,采用因子分析和层次聚类法,提取节点层次属性,构建节点属性向量。
4) 融合2)生成的节点标签向量和3)生成的节点属性向量,构建节点信息矩阵。
5) 以1)生成的子图邻接矩阵和4)生成的子图节点信息矩阵为输入,采用基于DGCNN的链路预测方法学习特征相似性,并预测新增航线。
2.1 提取局部封闭子图 将航空运输网络描述为G=(V, E),V为通航城市集合,E为直飞航线集合。设x, yV为网络G中任意2个没有连边的节点,则节点对(x, y)的h跳局部封闭子图指的是从图G中提取节点x, y及其所有h跳邻居节点i所组成的子图,记为Gx, yh图 2为节点对(x, y)的1跳局部封闭子图Gx, y1。可以看出,Gx, y1中包含了节点对(x, y)及其全部1跳邻居,能够描述节点对(x, y)周围1跳拓扑结构。
图 2 节点对(x, y)的1跳局部封闭子图 Fig. 2 The 1-hop local enclosing subgraph for node pairs (x, y)
图选项




从网络G=(V, E)中提取节点对(x, y)的h跳局部封闭子图Gx, yh的算法如下。
算法1 ??局部封闭子图提取算法。
输入x, y, G, h
输出Gx, yh
1: Vx, y0={x, y}
2: M={x, y}
3: for i=0, 1, …, h-1 do
4: if |M==0| then
5:??break
6: end if
7:
8: Vx, yi+1=Vx, yiM
9: end for
10: Gx, yh=G(Vx, yh)
11: return Gx, yh
算法1中,M表示节点对(x, y)的所有邻居集合,N1(v)表示节点v的所有1跳邻居集合,Vx, yi表示Gx, yi中所有节点的集合,G(·)表示从节点集合中生成局部封闭子图。
将提取到的局部封闭子图Gx, yh构造成邻接矩阵,记为AK×KKGx, yh中节点总个数。ai, jA中的元素,ai, j=1表示子图中节点ij间存在连边,ai, j=0表示子图中节点ij间不存在连边。邻接矩阵的构造算法如下。
算法2 ??局部封闭子图邻接矩阵构造算法。
输入Gx, yh, Vx, yh
输出A=[ai, j]。
1: Initialize A←0K×K
2: nodes[K]←Vx, yh
3: for i=1, 2, …, K do
4: for j=1, 2, …, K do
5:??if (nodes[i], nodes[j]) in Gx, yh.
edges() then
6:?? ai, j=1
7:??else
8:?? ai, j=0
9:??end if
10: end for
11: end for
12: return A
算法2中,Vx, yh表示Gx, yh中所有节点的集合,Gx, yh.edges()表示获取Gx, yh中所有连边集合。
2.2 标记子图节点角色 对局部封闭子图Gx, yhx, y之外的任一节点i而言,与节点对(x, y)的距离越小,其在结构上的角色就越重要,对未来链路形成的影响也就越大[11]。这里的“距离”指的是最短路径距离,即2个节点间最短路径上边的数目。本文分别计算节点i与节点x和节点y的距离,并以此为依据标记节点i,以识别其结构重要性。
节点i的标签li的标记规则如下:
(1)

式中:dx=d(i, x)为节点i与节点x的距离,dy=d(i, y)为节点i与节点y的距离,d=dx+dy
式(1)给出的节点标签li具有以下特征:
1) 节点x和节点y的标签为1,即lx=1,ly=1。
2) 其他任意节点ij,若d(i, x)=d(j, x)且d(i, y)=d(j, y),则li=lj
3) 若d(i, x)+d(i, y)≠d(j, x)+d(j, y)且d(i, x)+d(i, y) < d(j, x)+d(j, y),则li < lj
4) 若d(i, x)+d(i, y)=d(j, x)+d(j, y)且d(i, x) d(i, y) < d(j, x) d(j, y),则li < lj
5) 若d(i, x)=∞或d(i, y)=∞,则li=0。
Gx, yh中共有K个节点,则该局部封闭子图的节点标签向量labelK维,记为label=(lx, ly, li1, li2, …,liK-2)T图 3图 2所示的Gx, y1中每个节点对应的标签和子图节点标签向量。可以看出,距离节点对(x, y)较远的节点,其标签值也相对较大。
图 3 节点标记示意图 Fig. 3 Schematic diagram of node labeling
图选项




2.3 提取节点层次属性 航空业既服务于又受制于区域发展。一般来讲,经济发达的城市通常拥有较多航线,地面运输不便的城市拥有较密集航空运输网络,运营高效发展态势良好的机场能吸引更多航空公司将其作为新航线目的地。亦即节点(通航城市)的社会、经济等属性对航空运输网络的演变有重要影响,预测未来新增航线需要融合考虑此类属性。
节点属性可划分为城市属性和机场属性两大类。城市属性相关指标主要考量城市的经济、人口、地面交通、对外开放和旅游发展等方面,能够反映城市发展航空运输的需求与动力;机场属性相关指标主要考量机场的吞吐量、基建程度、成长速度等方面,能够反映机场运营的能力与潜力。
本文围绕城市和机场共采集15个指标对节点属性进行全方位衡量,如图 4中“基础指标”所示。考虑到指标间可能存在的相关性,采用“因子分析法”进行降维,结合主成分分析与因子最大方差旋转,得到4个主成分因子,如图 4中“主成分因子”所示。在此基础上对各节点进行层次聚类,形成类内相似、类间显著差异的9个类别。典型类别如:包括北京在内的第一类通航城市节点,是国家政治经济中心,机场客货吞吐量很大;包括成都在内的第三类通航城市节点,多为人口众多的旅游城市或区域中心城市,是地区级的航空运输中心。
图 4 节点属性示意图 Fig. 4 Schematic diagram of node attributes
图选项




为了从多个层面提取节点属性并避免信息冗余,本文将节点属性向量确定为29维,记为attrt=(a1, …, a9, b1, …, b4, c1, …, c4, d1, …, d4, e1, …, e4, f1, …, f4)∈{0, 1}1×29t表示图中第t个节点,a1, …, a9描述通航城市类别,b1, …, b4描述机场运营级别,c1, …, c4描述城市社会经济级别,d1, …, d4描述城市地面交通级别,e1, …, e4描述机场成长级别,f1, …, f4描述城市综合能力级别, 如图 4所示。
2.4 构建子图节点信息矩阵 子图节点信息矩阵由子图节点标签向量label和子图中每个节点的属性向量attr两部分融合而成,记为XK×DK为子图中节点的总个数,D为节点融合特征的维数。为了实现2种不同类型信息的有效融合,先采用label的独热编码向量构造初始矩阵,再将相应节点的属性向量映射到矩阵中相应行,使矩阵每一行对应一个节点的融合特征,如图 5所示。
图 5 子图节点信息矩阵示意图 Fig. 5 Schematic diagram of subgraph node information matrix
图选项




2.5 基于DGCNN的链路预测 DGCNN是一种面向图结构的新型神经网络[12]。如图 6所示,在卷积神经网络(Convolutional Neural Network,CNN)的基础上,先加入图卷积层进行图特征提取,再加入池化排序层进行特征排序,最终使用CNN读取排序图表示,从而实现神经网络对图数据的表示与学习。
图 6 DGCNN结构示意图 Fig. 6 Schematic diagram of DGCNN structure
图选项




NARP模型借助DGCNN在图结构数据上的建模优势,从航空运输网络中同时学习拓扑结构和节点属性2类特征,通过特征相关性推断节点对未来连接的可能性。具体做法如下:
1) 将2.1节局部封闭子图邻接矩阵AK×K和2.4节局部封闭子图节点信息矩阵XK×D输入到DGCNN中。
2) 图卷积过程可表述为
(2)

式中:T(t)为第t个图卷积层的输出,大小为K×C(t)C(t)为该层输出通道数;为添加了自环的子图邻接矩阵;为节点度对角矩阵, 为该层参数矩阵,大小为C(t-1)×C(t)δ(·)为非线性激活函数ReLU。当t=1时,有T(t-1)=X,即
第1个图卷积层将节点信息矩阵X与参数矩阵W(1)相乘进行线性特征变换;通过向相邻节点及节点本身传播节点信息;为在图卷积后保持固定的特征尺度,通过进行标准化;运用非线性激活函数δ(·)输出该层图卷积结果,作为下一图卷积层输入。模型中,DGCNN堆叠s个图卷积层重复提取多尺度图特征,并连接每层卷积结果T(1), …, T(s)作为图卷积的最终结果,每一行可看作一个节点的“特征描述符”。
3) 池化排序层根据节点标签对逐行排序;将张量中K的大小统一为Z,要求在一批子图中有p%的子图能够满足:子图中节点个数大于或等于Z,则对于节点个数K < Z的子图,需要添加Z-K行的0来扩展,对于节点个数K>Z的子图,需要截断后面的K-Z行;输出大小为的张量,作为CNN的输入。
4) 根据池化排序层的结果,使用分类效果较好的CNN实现链路预测(二分类)任务,输出分类结果。
3 实验 3.1 实验数据 实验数据:①中国航空运输网络相关数据(2016年),源自《中国民航统计年鉴2016》[13],不包括港澳台地区,共整理出137个通航城市节点和3 926条航线(部分偏远支线机场数据不完全,但不影响实验结果);②节点属性相关数据(2016年),其中机场属性数据来源于《从统计看民航2017》[14],城市属性数据整理自各省市的统计年鉴和社会发展统计公报。
实验数据E按不同的比例划分为训练集ET和测试集EP两部分, 满足ETEP=EETEP=?。
3.2 实验基准方法 NARP模型融合了网络结构特征和节点属性特征,并采用DGCNN进行链路预测。考虑到目前链路预测采用的方法主要是基于相似性的方法[15]及基于矩阵分解、随机游走、神经网络等图表示学习的方法[16],且这些方法大都只考虑了网络拓扑结构[17]。本文选择了2类基准方法:第一类是目前文献中具有代表性的主流方法,第二类是本文模型的简化版,即只考虑网络拓扑结构的NARP-s模型。图 7给出了本文的基准方法及其类型划分。
图 7 不同基准方法的类型划分 Fig. 7 Type division of each benchmark method
图选项




各基准方法概述如下:
1) AA[18]。其工作原理是: 度小的共同邻居节点贡献大于度大的共同邻居节点,如下:
(3)

式中:Γ(v)为节点v的邻居集合。
2) Katz[4]。其工作原理是: 网络中短路径的贡献大于长路径,如下:
(4)

式中:|pathsx, yl|为节点x到节点y长度为l的路径数量;β为权重衰减因子。
3) SVD[19]。其工作原理是:将图的邻接矩阵分解为低维矩阵,通过逼近节点一阶相似性来捕获隐藏在原始邻接矩阵中的局部拓扑性质。
4) HOPE[20]。其工作原理是:分解图的相似性矩阵,通过逼近节点的高阶相似性来保持非对称传递性。
5) DeepWalk[21]。其工作原理是:通过随机游走获取节点的局部上下文信息,在不同距离上连接节点,捕获图的拓扑结构特征。
6) node2vec[22]。其工作原理是:通过灵活的偏置随机游走,结合深度优先遍历和广度优先遍历获得节点序列,将拓扑结构信息保存成嵌入特征。
7) LINE[23]。其工作原理是:通过逼近节点的一阶相似性和二阶相似性直接建模节点嵌入向量,类似于一个多层感知器模型。
8) GAE[24]。其工作原理是:使用图卷积网络编码器得到节点的低维向量表示,再使用内积解码器得到图节点相似度。
9) NARP-s。NARP-s单考虑网络结构特性进行链路预测,不考虑节点属性因素,是本文NARP模型的简化。
3.3 实验评价指标 实验评价指标选用AUC。AUC是指随机地从测试集EP中选择一条边的分数值比随机地从不存在边的集合中选择一条边的分数值高的概率。
每次从EP中随机选取一条边,再随机从中选取一条边,对两者的分数值进行比较。若EP中的边分数高,则记1分,若两者相等,则记0.5分。假设一共进行了n次独立比较,其中有n1次选择EP中边的得分高于选择中边的得分,有n2次两者得分相等,则AUC计算方法如式(5)所示。AUC值介于0.5~1之间,值越大,表示方法的准确度越高。
(5)

3.4 实验参数设置 1) 子图提取中的h值设定: 一般设定h∈{1, 2, 3},本文实验中h=2取得较好的效果,因此设置h取值为2。
2) NARP模型中所使用的DGCNN的主要参数:4个图卷积层(32, 32, 32, 1)、1个池化排序层层和1个CNN。其中,CNN包含2个一维卷积层(分别为16和32个输出通道)、1个全连接层(128个神经元)和1个输出层。
其余参数设置详见表 1
表 1 DGCNN的主要参数设置 Table 1 Main parameter setting in DGCNN
参数 数值
迭代数num_epochs 30
批大小batch_size 30
学习率learning_rate 0.000 4
子图数占比p 0.6
优化器optimizer RMS prop
丢弃函数droupout Yes


表选项






3) 基准模型中的主要参数:SVD中权重衰减值设置为5×10-4;DeepWalk中游走次数设置为32,步长设置为64;node2vec中超参数n2v_p、n2v_q均设置为1,windsize设置为10,边特征向量由节点表示向量的哈达玛积(Hadamard product) 计算;LINE中超参数epochs设置为5,建模节点嵌入向量时设置为逼近节点的二阶相似度;GAE中隐藏层单元数设置为128。
3.5 实验结果与分析 本文共进行了如下3组实验。
1) 模型性能评价:固定数据集划分、不同模型预测性能的对比实验。
按7∶3将实验数据集划分为ETEP两部分,分别采用本文NARP模型和3.2节所述各基准模型进行链路预测。重复独立实验30次,取AUC的平均值。各模型的预测准确度(AUC值)如表 2所示。
表 2 数据集7∶3划分下各模型的AUC值 Table 2 AUC value of each model under dataset 7∶3 partition
模型 AUC/%
AA 82.37±0.62
Katz 85.78±0.93
SVD 89.88±0.70
HOPE 90.59±0.79
DeepWalk 89.04±2.03
node2vec 89.83±1.28
LINE 88.42±3.14
GAE 86.84±1.12
NARP-s 91.65±0.95
NARP 92.47±0.67


表选项






表 2可以看出:①本文模型的简化版本NARP-s模型的AUC值较其他模型均有提升,较AA、Katz最高提升9.28%,较SVD、HOPE最高提升1.77%,较DeepWalk、node2vec最高提升2.61%,较LINE、GAE最高提升4.81%。这表明提取局部封闭子图及区分标记节点角色,能够改善预测准确度。采用DGCNN进行特征学习而不依赖预先定义的链接规则,可使预测精度得到较大提升。②较之只考虑结构的NARP-s模型,综合考虑结构和属性的NARP模型的AUC值有了进一步提升。这表明本文所选取的节点层次属性在提升链路预测准确度方面起到了积极作用,融合网络结构和节点属性2类特征进行链路预测比单纯考虑结构特征能获得更好的预测性能。
2) 模型鲁棒性考察:不同比例数据集划分、不同模型鲁棒性的对比实验。
训练集中数据占比越大,网络就越完整,可用于链路预测的信息也就越多。本文依次按照9∶1、7∶3、5∶5、3∶7、1∶9的比例将数据集划分为ETEP,逐步减少网络中的可用信息,分别采用不同模型进行链路预测。在不同数据集划分下,均独立重复实验30次,取AUC的平均值。不同模型在不同数据集划分下的预测准确度(AUC值)如图 8所示。
图 8 不同数据集划分下各模型的AUC值 Fig. 8 AUC values of each model under different dataset partition
图选项




图 8可以看出:①随着训练集占比的减少,各模型的预测准确度逐渐下降。这表明网络的状态会对各模型预测效果产生影响,网络残缺会导致预测性能下降。②NARP模型在不同网络状态下一直保持相对较高的预测准确度,尤其是在网络极度不完整的状态下仍能保持在80%左右。这表明NARP模型性能稳定,在网络极度残缺的情况下仍能够充分利用并有效分析网络中的已知信息,能够较好解决基于残缺网络的预测问题,模型鲁棒性较好。
将本文模型与各基准方法的AUC值变化情况进行对比,如图 9所示。
图 9 不同数据集划分下各模型的AUC值变化情况对比 Fig. 9 Comparison of AUC changes of each model under different dataset partition
图选项




图 9(a)可以看出,AA、Katz这一类基于相似性的方法对网络状态依赖度很高,随着网络逐渐残缺,预测性能大幅下降;而NARP模型在残缺的网络上仍能保持相较高的预测准确度。这表明基于人为设定的相似性前提对不同的网络状态不具有普适性,NARP模型基于图神经网络自学习网络特征,使得模型拥有良好的鲁棒性。
图 9(b)(c)可以看出,本文模型与SVD、HOPE这一类基于矩阵分解的方法及DeepWalk、node2vec这一类基于随机游走的方法相比鲁棒性优势不明显。分析其原因,主要是因为航空运输网络现有数据规模不是很大,在一定程度上未能充分发挥NARP模型的鲁棒性优势。NARP模型从局部封闭子图中学习与网络演变有关的特征信息,而对比方法均是基于整个网络进行计算,随着数据规模的扩大,NARP模型的鲁棒优势将会逐渐显现。
图 9(d)可以看出,与同类型的基准方法相比,NARP模型有着更好的鲁棒性能,随着网络的逐渐残缺,预测准确度的下降幅度不大。这表明NARP模型除了借助图神经网络进行结构特征学习外,还区分了不同节点在结构上的重要性,使得模型的鲁棒性比一般基于神经网络的方法好。
另外,从图 9也可以看出,除AA、Katz这一类基于相似性的基准方法之外,其余基准方法在网络极度不完整的情况下(ETEP=1∶9),预测准确度均超越NARP-s模型。这也表明在网络极度残缺的情况下,只利用网络结构信息进行预测是欠缺的,网络结构特征和节点属性特征相互补充,使得NARP模型具有更好的鲁棒性。
3) 模型应用:使用NARP模型预测中国航空运输网络中未来新增航线。
基于2016年中国航空运输网络实际数据,考虑通航城市间最小距离(500 km),使用NARP模型预测中国航空运输网络中未来最有可能会新增的航线。预测结果TOP-15新增航线及其所对应的通航城市(以机场三字码表示)如表 3所示。
表 3 NARP预测的TOP-15新增航线 Table 3 Top-15 new air routes predicted by NARP
序号 新增航线
1 TAO-SYX
2 WUH-SJW
3 TAO-URC
4 HET-WNZ
5 KWL-CGQ
6 HAK-LJG
7 TAO-ZUH
8 HGH-DSN
9 CTU-YNZ
10 HAK-YNZ
11 TNA-HFE
12 SHA-LXA
13 HAK-CZX
14 CKG-ACX
15 INC-NGB


表选项






以2016年的中国航空运输网络为基准,表 3中所列的TOP-15预测航线(直飞航线,不包含经停航线)几乎有一半实际地出现在2016年之后的现实航空网络中,如TAO-SYX(青岛-三亚)、HGH-DSN(杭州-鄂尔多斯)、CKG-ACX(重庆-兴义)等。这说明NARP模型能够较好地拟合现实航空运输网络的实际演变过程,对民航相关部门的决策制定具有较高的指导意义和实用价值。
从预测结果中也可以看出:①大多数预计新增连接的通航城市是省会城市、区域中心城市和旅游业发达的城市。这类通航城市发展潜力较大,机场凭借经济、政策等优势发展势头较足,未来确有新增航线的能力和需求。②大多数预计新增的航线位于中国东部及沿海地区。由于人口、经济和地理等方面的优势,在一定程度上决定了航空客货运的需求量,为了满足城市发展的需求,未来航空运输网络演化将会呈现出这些地区航线进一步加密的态势。③未来新增航线有东、西部相连的趋势。这是因为中西部地区因经济欠发达而航线较少,航空网络在这些区域结构相对孱弱。未来,随着国家政策的支持,中西部地区发展态势将不断向好,新增“东部-西部”航线不仅有助于带动中西部地区发展,而且有助于航空运输网络的结构优化和良性发展。
4 结论 本文以航空运输网络为研究对象,从网络的整体出发,将基于DGCNN的链路预测方法应用于航空运输网络的新增航线预测问题之上。结论如下:
1) 借助DGCNN在图结构数据上的建模优势,NARP模型能够从网络中自学习拓扑结构特征,克服基于相似性的链路预测方法高度依赖于人为指定相似度指标这一弊端,使模型更适合当前网络预测。在仅利用网络结构信息的情况下,NARP-s模型的预测准确率较AA、Katz最高提升9.28%。
2) NARP模型提取网络的局部封闭子图进行链路预测,弥补了矩阵分解、随机游走等方法不能捕捉到网络局部拓扑结构上非线性模式的不足;又通过标记节点在结构上的角色,弥补了一般神经网络模型未对节点贡献度加以区分的不足。在仅利用网络结构信息的情况下,NARP-s模型的预测准确率较SVD、HOPE最高提升1.77%,较DeepWalk、node2vec最高提升2.61%,较LINE、GAE最高提升4.81%。
3) 从网络节点(通航城市)的社会、经济背景中提取多层属性,并在预测时充分考虑节点属性信息对链路生成的影响,使得NARP模型的预测结果更加贴合航空运输网络的实际演变模式。所预测的TOP-15新增航线中几乎有50%实际地出现在之后的现实航空网络中,说明模型具有较高的实用性。
4) 融合网络结构特征和节点属性特征进行链路预测,不仅进一步提高了NARP模型的预测准确度,而且在网络极度不完整的情况下,2类特征相互补充,使得模型具有良好的鲁棒性。

参考文献
[1] KASTURI E, DEVI S P, KIRAN S V, et al. Airline route profitability analysis and optimization using BIG DATA analytics on aviation data sets under heuristic techniques[J]. Procedia Computer Science, 2016, 87: 86-92. DOI:10.1016/j.procs.2016.05.131
[2] 葛伟, 朱金福, 吴薇薇. 蛛网式航线网络模型设计[J]. 交通运输系统工程与信息, 2012, 12(4): 172-177.
GE W, ZHU J F, WU W W. Design of cobweb air route network model[J]. Journal of Transportation Systems Engineering and Information Technology, 2012, 12(4): 172-177. DOI:10.3969/j.issn.1009-6744.2012.04.025 (in Chinese)
[3] MARTINEZ V, BERZAL F, CUBERO J C. A survey of link prediction in complex networks[J]. ACM Computing Surveys, 2017, 49(4): 1-33.
[4] LIBEN-NOWELL D, KLEINBERG J. The link-prediction problem for social networks[J]. Journal of the Association for Information Science and Technology, 2007, 58(7): 1019-1031.
[5] LEI C, RUAN J. A novel link prediction algorithm for reconstructing protein-protein interaction networks by topological similarity[J]. Bioinformatics, 2013, 29(3): 355-364. DOI:10.1093/bioinformatics/bts688
[6] YUE X, WANG Z, HUANG J, et al. Graph embedding on biomedical networks: Methods, applications and evaluations[J]. Bioinformatics, 2020, 36(4): 1241-1251.
[7] TAKAHASHI Y, OSAWA R, SHIRAYAMA S. A basic study of the forecast of air transportation networks using different forecasting methods[J]. Journal of Data Analysis and Information Processing, 2017, 5(2): 49-66. DOI:10.4236/jdaip.2017.52004
[8] NAJARI S, SALEHI M, RANJBAR V, et al. Link prediction in multiplex networks based on interlayer similarity[J]. Physica A-Statistical Mechanics and Its Applications, 2019, 536: 120-978.
[9] 刘宏鲲, 吕琳媛, 周涛. 利用链路预测推断网络演化机制[J]. 中国科学: 物理学力学天文学, 2011, 41(7): 816-823.
LIU H K, LV L Y, ZHOU T. Uncovering the network evolution mechanism by link prediction[J]. Scientia Sinica Physica, Mechanica & Astronomica, 2011, 41(7): 816-823. (in Chinese)
[10] ZHENG Y, LI W, CAO X, et al. Optimization of air transportation network using link prediction methods[C]//Proceedings of the 17th COTA International Conference of Transportation Professionals, 2018: 991-1000.
[11] ZHANG M, CHEN Y. Link prediction based on graph neural networks[C]//Advances in Neural Information Processing Systems. Cambridge: MIT Press, 2018, 31: 5171-5181.
[12] ZHANG M, CUI Z, NEUMANN M, et al. An end-to-end deep learning architecture for graph classification[C]//Proceedings of 32nd AAAI Conference on Artificial Intelligence. Palo Alto: AAAI Press, 2018: 4438-4445.
[13] 中国民用航空局发展计划司. 中国民航统计年鉴2016[M]. 北京: 中国民航出版社, 2016: 52-140.
PL CAAC. China civil aviation statistical yearbook 2016[M]. Beijing: China Civil Aviation Publishing House, 2016: 52-140. (in Chinese)
[14] 中国民用航空局发展计划司. 从统计看民航2017[M]. 北京: 中国民航出版社, 2017: 53-137.
PL CAAC. Statistical data on civil aviation of China[M]. Beijing: China Civil Aviation Publishing House, 2017: 53-137. (in Chinese)
[15] ZHOU T, LV L Y, ZHANG Y C. Predicting missing links via local information[J]. The European Physical Journal B, 2009, 71(4): 623-630. DOI:10.1140/epjb/e2009-00335-8
[16] GOYAL P, FERRARA E. Graph embedding techniques, applications, and performance: A survey[J]. Knowledge-Based Systems, 2018, 151: 78-94. DOI:10.1016/j.knosys.2018.03.022
[17] MUTLU E C, OGHAZ T A. Review on graph feature learning and feature extraction techniques for link prediction[EB/OL]. (2019-01-10)[2020-06-27]. https://arxiv.org/abs/1901.03425.
[18] ADAMIC L A, ADAR E. Friends and neighbors on the Web[J]. Social Networks, 2003, 25(3): 211-230. DOI:10.1016/S0378-8733(03)00009-1
[19] DAI W, LIU X, CAO Y B, et al. Matrix factorization-based prediction of novel drug indications by integrating genomic space[J]. Computational and Mathematical Methods in Medicine, 2015, 2015: 1-9.
[20] OU M D, CUI P, PEI J, et al. Asymmetric transitivity preserving graph embedding[C]//Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2016: 1105-1114.
[21] PEROZZI B, AI-RFOU R, SKIENA S. DeepWalk: Online learning of social representations[C]//Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2014: 701-710.
[22] GROVER A, LESKOVEC J. node2vec: Scalable feature learning for networks[C]//Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2016: 855-864.
[23] TANG J, QU M, WANG M, et al. LINE: Large-scale information network embedding[C]//Proceedings of the 24th International Conference on World Wide Web, 2015: 1067-1077.
[24] KIPF T N, MAX W. Variational graph auto-encoders[EB/OL]. (2016-11-21)[2020-07-01]. https://arxiv.org/abs/1611.07308.


相关话题/网络 结构 城市 信息 数据

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于优先级赤字轮询调度的WAIC网络延迟分析*
    随着航空技术的发展和成熟,先进飞机机载的电子设备和功能组件通过综合化互连构成的航空电子系统日益复杂。航空电子机内无线通信(WirelessAvionicsIntra-Communication,WAIC)可以替代部分有线互连,减轻机载电缆的重量和体积,并且更容易覆盖难以通过电缆到达的位置。无线网络信 ...
    本站小编 Free考研考试 2021-12-25
  • 环氧树脂基复合材料加筋板结构吸湿行为研究*
    纤维增强聚合物基复合材料具有比强度高、比模量高、质量轻、耐腐蚀性强及一体化成型等特点,被广泛应用到现代飞机结构部件上[1-2]。尽管相比金属材料,复合材料具有良好的耐腐蚀性,但研究发现,在总体或局部环境中由于温度、湿度等影响作用,聚合物基复合材料会发生湿热老化效应导致力学性能退化,进而甚至威胁到飞机 ...
    本站小编 Free考研考试 2021-12-25
  • 一种基于卷积神经网络的地磁基准图构建方法*
    在过去几十年中,导航制导技术得到了巨大的发展,其中最主流的研究方向是惯性导航技术及卫星导航技术[1-3]。由于惯性导航中使用的陀螺仪会产生随时间不断累积的漂移误差,同时卫星信号容易受到地形、气候等客观因素的干扰,导航定位的精度难以继续提升。考虑到地磁场相对而言十分稳定,基本不会随时间变化,同时受环境 ...
    本站小编 Free考研考试 2021-12-25
  • 基于复杂网络的车载自组织网络脆弱性分析*
    车载自组织网络(VehicularAdHocNetwork,VANET)是移动自组织网络的重要分支,是智能交通系统(IntelligentTransportSystems,ITS)的基础,为车辆与车辆之间、车辆与固定基础设施之间提供了快速通信[1]。为达到智能连通的目标,VANET无需集中管理,也不 ...
    本站小编 Free考研考试 2021-12-25
  • 基于改进加权响应面的结构可靠度计算方法*
    在现有的结构可靠度分析方法中,一次二阶矩法[1]、二次二阶矩法[2-3]的精度较低,并且在非线性程度较高的情况下还会遇到无法收敛的问题。蒙特卡罗法[4-5]虽然能够得到精确解,但需要大量的抽样和计算时间,限制了其实际应用。响应面法[6]采用多项式函数来近似极限状态函数,原理简单、易于操作且计算效率较 ...
    本站小编 Free考研考试 2021-12-25
  • 基于导重法的自重载荷下悬臂梁结构拓扑优化*
    结构拓扑优化是指在一定的设计区域内,在满足特定的约束条件和边界条件情况下,寻求材料最优分配的过程。拓扑优化的问题自其被提出以来就受到了广泛的关注和研究,包括载荷不确定问题[1-2]、传热学问题[3-4]、非线性问题[5]及工程应用问题[6-7]等。重力作为工程应用中无法避免的载荷,在很多结构设计中是 ...
    本站小编 Free考研考试 2021-12-25
  • 基于深度残差收缩网络的滚动轴承故障诊断*
    滚动轴承在机械设备中应用广泛,由于其长时间处在高速、高负荷、变工况、强噪声干扰运转环境下,故障率很高。及时发现滚动轴承潜在故障并判断故障类型能够指导维修工作、提高维修效率以及机械设备的可靠性和安全性。目前,主流的滚动轴承故障诊断方法大多都基于对振动、光信号和电信号的研究,其中基于滚动轴承振动信号的故 ...
    本站小编 Free考研考试 2021-12-25
  • 基于中心-对数半长的区间数据主成分分析*
    主成分分析(PrincipalComponentAnalysis,PCA)是一种对包含多个变量的平面数据表进行最佳综合简化的多元分析方法[1]。其主要目的是在保证数据信息损失最小的前提下,对多元数据进行降维处理,基本原理是通过正交变换将p个相互关联的变量转换为p个相互无关的"主成分",并省却数据变异 ...
    本站小编 Free考研考试 2021-12-25
  • 改进的深度神经网络下遥感机场区域目标检测*
    目标检测目前为计算机视觉和数字图像处理的一个热门方向,其通过机器自主识别人们需要检测目标的方式,可以大大减少人力资源的消耗。而机场对于军用和民用领域都有重大的意义,对于民用来说是商业活动的中心同时也是城市的资源配置中心;对于军用来说,是空中力量的关键基础,也是夺取制空权的坚强力量。而随着卫星遥感图像 ...
    本站小编 Free考研考试 2021-12-25
  • 连续变迎角试验数据自适应分段拟合滤波方法*
    在常规高超声速风洞测力试验[1-3]中,常采用阶梯变迎角试验方式,即利用模型机构阶梯地改变试验模型的迎角,天平测量每个迎角台阶上试验模型的气动力,取一段时间进行平均,获取该模型在对应迎角的气动载荷。利用模型机构实现阶梯变迎角过程中产生较快的启动、停止,试验模型因而产生较大的振动,需要在每个迎角台阶停 ...
    本站小编 Free考研考试 2021-12-25