一种鲁棒性增强的机载网络流量分类方法*

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2021-12-25

机载网络作为航空集群等新型作战系统的信息交互纽带^[1-2]，通过为多样化业务流提供传输服务，可以保证平台间高效协同地执行作战任务^[3-4]。在复杂多变的战场环境下，不同类型的业务流往往具有不同的信息价值及服务质量(Quality of Service，QoS)需求^[5]。同时，由于机载网络具有网络拓扑高度动态、链路不稳定等特点，导致其可用带宽受限。因此，为不同类型的业务流配置相应的流量控制策略，成为优化网络带宽使用，提升网络性能，使机载网络通信能力高度收敛于作战需求的关键手段。这也使得机载网络流量类型的准确分类具有重要意义。
数据流的业务类型通常可由其应用层标注信息直接确定，因此通过对应用层协议的解析可以直接实现业务类型判断。然而，对于数据流中间转发节点而言，应用层协议的解析过程将造成数据流处理过程复杂，转发效率降低，数据传输实时性、保密性无法保证等问题；这也使得现有的流量分类方法更多基于传输层端口号、数据包有效负载等非应用层特征与业务类型之间的映射关系实现。该类流量分类方法虽然突破了对应用层协议解析的要求，但由于其所依赖的特征相对单一，且与业务类型之间并不具有严格的映射关系，其识别准确性存在局限，难以适用于大规模、多业务类型的复杂网络。
随着人工智能的兴起，基于机器学习的流量分类方法开始受到广泛关注^[6-7]。基于机器学习的流量分类方法主要分为浅层学习方法和深度学习方法。其中，浅层学习方法基于经典机器学习算法，对人为提取的流量特征进行学习从而训练生成分类器^[6]。然而对流量特征的人为选取加大了训练集构造的工作量，且选取的特征具有较强的主观性，难以保证所选特征集最优，在一定程度上限制了分类准确性能的提升。为降低训练工作量，进一步提升分类准确性，近年来相关研究者将深度学习引入流量分类^[7-10]。该类方法以神经网络模型为代表，通过将数据流负载映射为多维图像视觉特征，并利用深度学习模型的图像识别原理实现数据流业务类型的判别，具有准确性较高的优势。此外，由于深度学习模型具有特征自主提取的能力，因此在训练过程中，仅需提供相对完备的数据流样本训练集，深度学习模型即可基于数据流的物理层特征实现分类器的自主训练，避免了对不同传输体制下流量传输特征的人为分析，在降低训练工作量的同时，具有较强的适应性，可有效适用于包含多种传输体制、多种业务类型的异构化复杂网络。
不同于稳定的地面有线网络，机载网络链路变化频繁、丢包率较高、传输时延不稳定等特点造成流量监测设备往往难以在有限的监测周期内获取较为完整的数据流负载信息。采用深度学习方法时，缺失的数据包将造成数据流负载空间特征失真，从而严重影响分类准确性能。为突破基于负载空间特征分类方法的分类性能瓶颈，相关研究在数据流负载空间特征之外，将数据流的时序特征引入了流量识别问题^[11-12]。实验结果表明，数据流的时序特征也可作为流量分类问题的重要特征维度之一，从而为数据包缺失条件下的分类问题提供新的思路。
针对机载网络高丢包率条件下的流量分类问题，本文提出了一种高鲁棒性的机载网络流量分类方法，并设计了鲁棒性增强的长时递归卷积神经网络(Robustness-Enhanced Long-term Recursive Convolutional neural Network，RE-LRCN)分类模型。在分类模型线下训练阶段，通过数据预处理将数据流负载映射为多个灰度矢量，分别利用卷积神经网络与长短时记忆(Long Short Term Memory, LSTM)网络实现数据流负载空间特征及数据流时序特征的提取，完成RE-LRCN的训练。在线上分类阶段，采用基于双向序列缺失样本填充算法对线上采集的数据流样本中缺失的数据包进行灰度值填充，基于已训练的RE-LRCN分类模型实现流量类型的判别。实验结果表明，RE-LRCN分类模型可以在数据包缺失的条件下有效保证流量分类的准确性。
1 数据集与数据预处理机载网络具有网络拓扑高度动态、网络状态高度不稳定的特点，造成其网络流量的分布呈现以下特点：①传输过程中的丢包率较高，数据流时间序列中可能存在大量的缺失数据包；②传输的时延较大，单条数据流完成传输的持续时间较长，因此无法保证数据流经过某监测节点时，数据包的到达顺序与数据包序号保持一致^[3]。另外，机载网络的作战应用背景对流量分类的实时性提出了更高的要求，需要在较短的监测时间下，基于有限的数据流特征的条件下实现流量分类。
1.1 数据集构造为实现分类器的训练并验证分类准确性，采集了在某次机载网络仿真实验过程中产生的机载网络数据流样本，并根据所属业务类型，将采集到的全体数据流样本划分为4类：图像视频类数据流(A类)、态势信息类数据流(B类)、语音类数据流(C类)及指挥控制类数据流(D类)^[5]。在此基础上，提取全体数据流样本的完整字节信息，构建了基于有效负载的机载网络原始流量数据集，命名为AN_Set。AN_Set中的样本分布情况如表 1所示。
表 1 AN_Set中数据流样本分布 Table 1 Distribution of data flow samples in AN_Set

类别	数量	比例/%
A	3 113	25.53
B	3 671	30.10
C	2 265	18.57
D	3 146	25.80
合计	12 195	100

表选项

在此基础上，将AN_Set数据集划分为训练数据集(Training Set，Tr_Set)与测试数据集(Testing Set，Te_Set)。其中，训练数据集中的样本数量占AN_Set数据集总样本数量的70%，其流量样本均包含了完整的数据包序列；测试数据集占全体样本数量的30%。为模拟实际机载网络环境下网络传输稳定性较差、丢包率较高的特点，对测试数据集进行了进一步的处理，按照1%、2%及5%的丢包率，对其全体样本的数据包进行随机剔除，并分别得到3个子测试数据集，分别命名为Te_Set_1、Te_Set_2、Te_Set_3。
1.2 数据预处理方法数据预处理过程就是将数据流样本所包含的负载特征映射为可被分类器识别的数据类型。本文采用的数据预处理方法是基于文献[8]中提出的方法，将数据流负载视作该流的原始特征，首先对采用传输控制协议(Transmission Control Protocol，TCP)类数据流，按照数据包顺序号进行重组，对于非TCP类数据流则按照固定时间间隔顺序捕获，然后将数据流有效负载(字节)转换为数值化特征，并以灰度形式填充至灰度矢量中。
为满足机载网络环境下流量分类的实时性要求，需要在采集到的部分数据包的条件下实现流量的分类。文献[13]中的实验结果表明，位于数据流前部的数据包所含的负载特征更具有代表性。因此，为实现数据流样本的早期识别，本文以数据流样本中位于前部的数据包构成的前部子流为对象进行数据预处理。数据预处理流程如图 1所示。

图 1 数据预处理方法 Fig. 1 Data preprocessing method

图选项

在数据预处理过程中，首先设置一个n元前部子流截取窗口，该窗口对每一条数据流样本的前n个数据包进行采集并提取其全部负载，然后将该数据流样本的n元前部子流中每个数据包有效负载的前m个字节映射为一个m元的灰度矢量B_i，将n个数据包所映射的灰度矢量构成一个灰度矢量集合A_out={B₁, B₂, …, B_n}。对于部分所含字节数低于m的数据包样本，在其所映射的灰度矢量中的空缺字节位填充0作为灰度值。
此外，由于网络中数据流样本长度各异，也可能造成部分数据流样本所含数据包数量低于截取窗口大小。同时，在分类器进行数据流在线识别的过程中，由于机载网络链路的不稳定性，将不可避免地出现部分数据流样本不完整的情况。对于该类数据流样本中缺失的数据包，按照该数据包在数据流中的排列顺序，在灰度矩阵中保留其所对应的灰度矢量填充的位置，将其初始化为全零矢量，并定义为待定灰度矢量。采用基于双向序列的样本填充算法进行处理，该算法将在1.3节中进行详细介绍。
1.3 缺失样本的处理现有基于深度学习的流量分类方法大多针对地面有线网络，具有较高的稳定性与较低的时延，因此，无论在数据集构造还是数据流的线上分类过程中，流量监测设备都可以采集到较为完整的数据流时间序列，并基于采集得到的时间序列特征实现流量分类。然而机载网络高时延、不稳定特点造成流量监测设备难以在较高的实时性要求下采集到完整的数据流负载特征，因此，需要通过缺失样本填充算法对数据流时间序列样本中的缺失数据包进行补全。
首先，对样本填充算法中需要的一些变量进行定义。设数据流样本经过数据预处理后得到一个n元的灰度矢量集合A_out={B₁, B₂, …, B_n}，B_i=[b_i¹, b_i², …, b_i^m]表示该样本前部子流数据包所映射的灰度矢量，b_i^j为该样本前部子流第i个数据包中的第j个字节映射的灰度值。在此基础上，定义2个集合：①有效灰度矢量集合Ω，包含了一条数据流样本中被前部子流截取窗口采集到的全体数据包所映射的灰度矢量；②待定灰度矢量集合Γ，包含了数据预处理阶段保留的缺失数据包所对应的待定灰度矢量。为对数据流样本前部子流中的缺失数据包进行填充，基于时间序列缺失值处理方法^[14]，设计了基于双向序列的样本填充算法。
算法1??基于双向序列的样本填充算法。
输入:数据流样本映射的灰度集合A_out={B₁, B₂, …, B_n}。
输出：A_out, M_1×n。
1??M_1×n=zeros(n)
2??for i=1:n
3????if B_i∈Γ
4??????M[i]=1
5??????for j=1:m;
6????????

7??????end for
8??????Ω=Ω∪{B_i}
9??????Γ=Γ－{B_i}
10????end if
11????update (A_out)
12??end for
该算法采用平滑的方法对灰度矩阵中缺失的灰度矢量(待定灰度矢量)进行填补。待定灰度矢量中任意一个元素的取值为灰度矩阵中已确定取值的灰度矢量在对应位置灰度值的加权和。在此基础上，采用指数衰减的形式确定各灰度矢量对当前待定灰度矢量的贡献，有效灰度矢量与当前待定灰度矢量的距离越远，其贡献越低。该算法最终输出完成灰度填充的灰度矩阵A_out及缺失值标识矢量M_1×n。
2 鲁棒性增强的长时递归卷积神经网络 2.1 整体模型构建 RE-LRCN的流量分类整体模型如图 2所示，其结构包括数据预处理层、负载空间特征提取网络、时序特征提取网络及输出层。该模型以数据流样本的原始负载信息为输入，通过对负载特征的自主提取与分析，实现对数据流样本所属业务类型标签(本文中为1.1节所述数据集AN_Set中的A、B、C、D四类业务类型标签)的分类。

图 2 鲁棒性增强的长时递归卷积神经网络模型 Fig. 2 Model of RE-LRCN

图选项

1) 数据预处理层。对输入的数据流原始样本进行数据包重排序、前部子流截取、灰度矢量映射及缺失样本处理等操作。输出为数据流样本映射的灰度矢量集合A_out={B₁, B₂, …, B_n}及缺失值标识矢量M_1×n。
2) 负载空间特征提取网络。由n个k层一维卷积神经网络构成，其中L_j(j=1, 2, …, k)表示一维卷积神经网络第j层结构。负载空间特征提取网络分别以数据流样本中按序排列的数据包所映射的灰度矢量B_i为输入，实现数据包的负载空间特征的提取，并输出各数据包的高维负载空间特征矢量s_i。
3) 时序特征提取网络。由n个LSTM单元串联构成，以各数据包的高维负载空间特征矢量s_i及缺失值标识矢量M_1×n为输入，提取数据流的时序特征矢量t_i至输出层，最终生成该数据流的类别标签。
2.2 数据流负载空间特征提取数据包是数据流中承载负载信息的基本单元，因此对数据流负载空间特征的提取基于数据包层面。数据流样本经过数据预处理环节之后生成了一个灰度矢量集合，每个灰度矢量对应于一个数据包，其包含了该数据包前m个字节所包含的全部空间信息。通过卷积神经网络，实现该数据流负载空间特征的有效提取。
标准的卷积神经网络模型包括输入层、卷积层、池化层及全连接层。其中，输入层主要实现输入数据的预处理及训练样本的筛选；卷积层由卷积核与激活函数构成，通过对上一层特征面的扫描实现隐含局部空间特征的提取；池化层位于卷积层之间，通过对特征面的池化下采样实现对特征面数据量的压缩；全连接层位于卷积神经网络末端，根据前部网络结构所提取到的空间特征进行样本所属类型的判别并输出预测标签。常用的卷积神经网络结构中通常具有2~3层全连接层，RE-LRCN分类模型的特征提取网络仅保留单层全连接层结构，用于将前部网络结构提取到的样本的多个特征面/特征矢量转换为单个特征矢量。
由于数据包中的负载以字节流的形式出现，因此选取一维卷积神经网络中的卷积层、池化层及单层全连接层构成的网络结构，实现空间特征的提取。数据流负载空间特征提取网络的结构如表 2所示。
表 2 数据流负载空间特征提取网络的结构 Table 2 Structure of data flow loading spatial feature extraction network

层数	类型	输入	窗口大小	窗口数量	步长	边缘填充	输出
1	卷积层+激活函数	(28×1)×1	3×1×1	3	1	边缘一致	(28×1)×3
2	最大池化层	(28×1)×3	3×1×3	1	3	边缘一致	(10×1)×3
3	卷积层+激活函数	(10×1)×3	3×1×3	6	1	边缘一致	(10×1)×6
4	最大池化层	(10×1)×6	3×1×6	1	3	边缘一致	(4×1)×6
5	全连接层	(4×1)×6		10			10×1

表选项

数据流样本经过数据流负载空间特征提取网络后，将输出n个10×1的数据包高维负载空间特征矢量s_i，每个s_i对应该数据流样本中前部子流的一个数据包。
2.3 数据流时序特征提取 LSTM网络作为一种改进循环神经网络，通过记忆单元可实现时序特征的有效提取^[15]，目前在文本识别、视频分析及行为识别领域取得广泛应用^[16-17]。RE-LRCN中数据流时序特征的提取基于LSTM网络。为在数据流样本缺失条件下实现数据流时序特征的提取，在LSTM网络常规结构的基础上构建了低样本缺失敏感的LSTM网络，通过引入惩罚因子机制，对缺失数据流样本对LSTM时序特征提取的贡献进行控制。
低样本缺失敏感的LSTM网络结构如图 3所示，其包括基本的LSTM单元及惩罚因子控制模块(Penalty Factor Control Model，PFCM)。由n个LSTM单元依次串联，构成LSTM单向网络结构，其以各数据包负载空间特征向量s_i为输入，实现数据流时序特征矢量t_i的提取。PFCM模块以缺失值标识矢量M_1×n为输入，对惩罚因子p_i进行维持与控制。

图 3 低样本缺失敏感的LSTM网络结构 Fig. 3 Structure of LSTM network with low sample loss sensitivity

图选项

2.3.1 LSTM单元结构首先对时序特征提取网络中的LSTM单元进行设计。如图 3所示，c_i∈R^N表示LSTM单元中的记忆单元，实现对时序特征的提取与维持；h_i表示当前时刻LSTM单元的输出状态。LSTM单元结构主要由输入节点g_i∈R^N、输入门in_i∈R^N、遗忘门f_i∈R^N、输出门o_i∈R^N构成。其中，输入节点g_i根据当前输入s_i与前一时刻状态h_i-1，通过双曲激活函数φ(x)映射为[-1, 1]范围的系数，从而确定当前时刻的输入s_i对于时序特征提取过程中的贡献。双曲激活函数表达式如下：

(1)

输入门in_i、遗忘门f_i及输出门o_i根据当前输入s_i与前一时刻状态h_i-1，通过S型曲线激活函数σ(x)映射为[0, 1]范围内的系数，分别确定输入节点g_i对当前时刻记忆单元c_i的实际贡献程度、前一时刻记忆单元c_i-1到当前时刻记忆单元c_i的继承程度及前一时刻记忆单元c_i-1到当前时刻输出状态h_i的通过程度。S型曲线激活函数表达式如下：

(2)

基于以上概念，当前时刻LSTM单元的记忆单元c_i取值通过式(3)确定：

(3)

c_i包括2个部分：①前一时刻记忆单元输出与当前时刻遗忘门输出的乘积；②当前时刻输入门、输入节点及缺失值惩罚因子的乘积。为限制缺失样本对记忆单元的贡献程度，在输入门提供的通过系数的基础上，进一步引入了惩罚因子，惩罚因子的确定将在2.3.2节中介绍。
此外，当前时刻输出状态h_i取值通过式(4)确定：

(4)

h_i取值表示当前LSTM单元的输出，该输出可作为下一个LSTM单元的输入之一。

2.3.2 惩罚机制 1.3节中通过缺失样本填充算法，对单个数据流样本中的缺失数据包样本所对应的灰度矢量进行了填充。然而，该算法仅通过对灰度矩阵的平滑实现缺失灰度矢量的填充，无法获取对应数据包实际的负载空间特征，因此，应相应降低该类数据包对应的高维负载空间特征在数据流时序特征提取过程中的贡献。本文在LSTM网络基础上引入了惩罚机制，通过限制缺失样本对记忆单元的贡献程度，优化数据流时序特征的提取过程。
惩罚机制的实现基于PFCM单元，PFCM单元相互串联构成PFCM网络，其与LSTM网络平行，维持对惩罚因子p_i取值的控制。PFCM单元对惩罚因子取值的控制流程通过如图 4所示流程实现。

图 4 惩罚机制流程 Fig. 4 Flowchart of penalty mechanism

图选项

各PFCM单元以缺失值标识矢量M_1×n为输入，输出为各级LSTM单元所对应的惩罚因子p_i，参数γ与?分别表示惩罚因子衰减参数与惩罚因子上调参数。对于每一个数据流样本，先对惩罚因子初始值进行初始化，之后对每一个PFCM单元，根据输入的缺失值标识矢量取值确定惩罚因子的衰减与上调。若输入的缺失值标识为1，即该时刻对应的数据包为丢失数据包，此时对惩罚因子进行指数衰减操作，并输出此时的惩罚因子实现对LSTM输入门的控制；若输入的缺失值标识为0，表明此时对应的数据包为实际采集到的数据包，此时对惩罚因子进行加性上调，直至惩罚因子升至初始值1。
3 仿真结果与分析 3.1 实验环境配置及评价指标本文所选取的实验硬件环境为一台内存为4 GB，搭载1.8 GHz主频处理器的64位Win 10操作系统PC。软件环境为1.13.1版本的Tensorflow框架及5.3.0版本的Anaconda3环境。使用1.1节中构造的训练数据集Tr_Set对RE-LRCN分类模型进行训练，并以1.1节中构造的3个子测试数据集(Te_Set_1、Te_Set_2、Te_Set_3)对分类器的分类准确性能进行验证。分类器线下训练阶段及线上分类阶段的相关参数设置如表 3所示。
表 3 实验相关参数设置 Table 3 Experimental parameter setting

参数	数值
输出灰度矢量尺寸	28×1
前部子流截取窗口大小	28
负载空间特征提取网络训练轮次e₁	50
负载空间特征提取网络学习率η₁	0.5
时序特征提取网络训练轮次e₂	50
时序特征提取网络学习率η₂	0.3
惩罚因子衰减参数γ	0.5
惩罚因子上调参数?	0.2

表选项

本文主要对分类器的分类准确性指标进行评估。选取的3个准确性指标分别为：类可信度λ_i、类覆盖度μ_i及整体分类准确率ξ。设分类器在对一个n分类问题的验证过程中，i类样本被正确分类的数量为TP_i，其他任意类样本被错误分类为i类样本的数量为FP_i，i类样本被错误分类为其他类别样本的数量为FN_i，则3项准确性指标分别表示如下：

(5)

(6)

(7)

3.2 基于数据流时序特征的流量分类性能分析首先以样本数据完整的测试数据集Te_Set验证基于数据流时序、空间特征的流量分类性能。针对所依赖特征维度，可将现有基于深度学习的流量分类器分为：基于空间特征的分类器模型、基于时序特征的分类器模型及基于时/空间特征的分类器模型。其中，基于空间特征的分类器模型以卷积神经网络模型(记为CNN)为代表；基于时序特征的分类器模型以LSTM网络模型为代表；基于时/空间特征的分类器模型以RE-LRCN模型及文献[11]提出的基于层次化时空特征的流量分类模型(记为HAST)为代表。4种方法均采用本文提出的预处理方法，其中在CNN方法中采用二维卷积神经网络模型，因此将全体灰度矢量按照数据包到达先后顺序拼接为一个n×m的灰度矩阵；而在LSTM方法与RE-LRCN方法中，由于在提取时序特征的过程中均需以数据包为单位，因此其输入为n个m元灰度矢量(本文中设置m=n=28)，LSTM方法直接对预处理得到的灰度矢量进行时序特征的提取，而RE-LRCN方法则首先实现对数据流负载空间特征的提取，得到高维负载空间特征矢量后，再对数据流时序特征提取。在4类分类器进行线上分类过程中，数据流样本被正确分类所需数据包个数占被全体正确分类数据流样本所含数据包总数比例的统计结果均在15%以下，这是由于4类分类器均采用了2.2节中设计的数据预处理方法，对于任意一条数据流样本，均以其前m(本仿真实验中m=28)个数据包构成的数据流前部子流作为特征提取对象。该统计结果表明，采用本文提出的数据预处理方法可以实现部分大流量早期分类，从而满足机载网络流量处理的实时性需求。
4种分类器的分类准确性能对比如图 5所示。通过对比可以发现，基于多维度特征的分类模型的分类准确性能优于基于单一维度特征的分类模型。其中，以CNN模型为代表的基于负载空间特征的流量分类模型准确性能略优于以LSTM网络为代表的基于数据流时序特征的分类模型，其整体分类准确率接近90%。相对于基于单一维度特征的分类模型，基于多维度特征的分类模型通过同时提取数据流空间、时序特征，实现了分类准确性能的有效提升，整体分类准确率均达到90%以上。其中，HAST分类模型通过对数据流、数据包2个层次的负载空间特征的提取及基于数据包到达时间的数据流时序特征提取，获得了最优的分类准确性能，其整体分类准确率达到95.28%。而RE-LRCN分类模型通过对数据包层次负载空间特征及时序特征的提取，其整体分类准确率为91.80%，略低于HAST模型。图 5(b)、图 5(c)分别为4种分类模型下各类流量的类覆盖度及类可信度，其分布趋势与4种方法的整体分类准确率相似，同时，可以观察到基于多维特征的分类模型下，各类流量的类可信度与类覆盖度分布更为平稳。

图 5 不同分类模型下测试数据集的分类准确性能对比 Fig. 5 Comparison of classification veracity performance under different classification models in Te_Set

图选项

3.3 机载网络环境下流量分类准确性能对比分析为验证RE-LRCN分类模型在实际机载网络环境下的分类准确性能，分别以经过数据包随机剔除处理后的样本数据不完整的机载网络数据流测试数据集(Te_Set_1、Te_Set_2、Te_Set_3)，测试RE-LRCN分类模型在不同丢包率条件下的分类准确性能。
本文选取了几种常用的基于深度学习的流量分类方法作为对照，包括基于离差标准化卷积神经网络的流量分类方法(MMN-CNN)^[9]、HAST方法^[11]及基于普通长时递归卷积神经网络的方法^[12](LRCN)。在以上对照方法中，对于缺失数据包样本，均采用本文提出的平滑方法进行填充，训练与测试过程如图 6所示。

图 6 样本缺失条件下分类模型训练及测试过程 Fig. 6 Training and testing process of classification model with loss of samples

图选项

图 7为不同流量分类方法下，不同测试数据集的整体分类准确率对比。可以发现，随着丢包率的提升，不同方法下获得的整体分类准确率呈现下降趋势，随着丢包率由1%提升至5%，4种分类方法的整体分类准确率均下降4%左右。这表明数据流中的数据包样本丢失现象对分类模型的分类准确性能具有较为明显的影响。而在4种分类模型中，RE-LRCN分类模型在数据包缺失的条件下可以获得最优的分类准确性能，其在1%、2%与5%的丢包率下分别可以获得91.17%、90.33%与88.17%的整体分类准确率，接近于理想测试数据集无丢包条件下91.80%的整体分类准确率。而原始的LRCN分类模型在3个子测试数据集下的整体分类准确率较RE-LRCN分类模型分别低3.54%、3.6%与3.84%；而HAST分类模型虽然在理想测试数据集下能够获得最优的分类准确性能，但由于其提取了多个维度的数据流特征，导致其高度拟合理想测试数据集，而在数据包样本缺失的测试数据集下的泛化性能较差，因而随着丢包率的提升，其分类准确性能出现显著恶化。基于数据流负载空间特征的MMN-CNN分类模型虽在理想测试数据集下的分类性能较好，但其在数据包样本缺失条件下的分类性能恶化最为严重，在5%的丢包率条件下，其整体分类准确率降至79.32%。

图 7 样本缺失条件下不同分类模型整体分类准确率对比 Fig. 7 Comparison of overall classification precision among different classification models with loss of samples

图选项

图 8进一步展示了不同丢包率条件下，各流量分类模型所获得的类覆盖度与类可信度对比。其中，图 8(a)~图 8(c)为各流量分类模型在不同子测试数据集下的类覆盖度对比。图 8(d)~图 8(f)为类可信度的对比。可以发现，随着子测试数据集丢包率的提升，各类流量分类模型所获得的类覆盖度与类可信度的整体变化趋势与图 7所示的整体分类准确率的变化趋势相同，均有所下降。其中，RE-LRCN分类模型所获得的类覆盖度与类可信度在4种分类模型中最优，与原始的LRCN分类模型相比，通过惩罚因子机制，限制对缺失数据包样本对记忆单元的贡献值，在3个子测试数据集中，使4类数据流的平均类覆盖度分别提升3.61%、3.57%与3.85%，平均类可信度分别提升3.60%、3.77%与3.89%。MMN-CNN分类模型随丢包率的提升，其类覆盖度与类可信度衰减较为严重，其原因在于该模型基于二维卷积神经网络对数据流负载空间特征进行了提取，而数据包样本的缺失导致数据流映射的灰度图中的部分灰度矢量失真，从而严重影响分类模型的判别。

图 8 样本缺失条件下不同分类模型类可信度与类覆盖度对比 Fig. 8 Comparison of precision and recall among different classification models with loss of samples

图选项

4 结论 1) RE-LRCN分类模型通过时间、空间2个维度的特征提取，可以在完备的网络流量数据集中获取较为理想的分类准确性能。通过在完备的网络流量数据集上的仿真结果表明，在所选的4种分类模型中，RE-LRCN分类模型的整体分类准确率可达到91.80%的整体分类准确率，仅次于同样采用时、空间特征提取的HAST分类模型。
2) 在数据包缺失环境下，RE-LRCN分类模型具有更高的鲁棒性。在丢包率分别为1%、2%与5%的机载网络流量测试数据集上，RE-LRCN分类模型分别获得91.17%、90.33%与88.17%的整体分类准确率，高于本文中所选的对照分类模型。
3) 随着流量数据集中丢包率的提升，各类分类模型的分类准确性能均呈现一定程度的衰减，RE-LRCN分类模型对数据集缺失的敏感度相对较低，在所选的4类分类模型中，分类准确性能衰减程度最低。
4) RE-LRCN分类模型将特征提取对象固定为一条数据流的前部子流段，在一定程度上提升了分类判决的实时性，但由于限制了数据包样本的提取，因此在一定程度上影响了分类准确性能。

参考文献

[1]	霍大军. 网络化集群作战研究[M]. 北京: 国防大学出版社, 2013: 66-68. HUO D J. Operation of network swarm[M]. Beijing: National Defense University Press, 2013: 66-68. (in Chinese)

[2]	梁晓龙, 何吕龙, 张佳强, 等. 中国科学:技术科学[M]. 2019: 277-287. LIANG X L, HE L L, ZHANG J Q, et al. Configuration control and evolutionary mechanism of aircraft swarm[M]. 2019: 277-287. (in Chinese)

[3]	CAO X B, YANG P, MOHAMED A, et al. Airborne communication networks:A survey[J]. IEEE Journal on Selected Areas in Communications, 2018, 36(9): 1907-1926. DOI:10.1109/JSAC.2018.2864423

[4]	吕娜, 杜思深, 张岳彤, 等. 数据链理论与系统[M]. 北京: 电子工业出版社, 2018: 7-9. LV N, DU S S, ZHANG Y T, et al. Theory and system of data link[M]. Beijing: Publishing House of Electronics Industry, 2018: 7-9. (in Chinese)

[5]	梁一鑫, 程光, 郭晓军, 等. 机载网络体系结构及其协议栈研究进展[J]. 软件学报, 2016, 27(1): 96-111. LIANG Y X, CHENG G, GUO X J, et al. Research progress on architecture and protocol stack of the airborne network[J]. Journal of Software, 2016, 27(1): 96-111. (in Chinese)

[6]	NGUYEN T T, ARMITAGE G. A survey of techniques for internet traffic classification using machine learning[J]. IEEE Communications Surveys & Tutorials, 2009, 10(4): 56-76.

[7]	SHAFIQ M, YU X, LAGHARI A A, et al.Network traffic classification techniques and comparative analysis using machine learning algorithms[C]//20162nd IEEE International Conference on Computer and Communications (ICCC).Piscataway: IEEE Press, 2016: 2451-2455.

[8]	李勤, 师维, 孙界平, 等. 基于卷积神经网络的网络流量识别技术研究[J]. 四川大学学报(自然科学版), 2017, 54(5): 959-964. LI Q, SHI W, SUN J P, et al. The research of network traffic identification based on convolutional neural network[J]. Journal of Sichuan University (Natural Science Edition), 2017, 54(5): 959-964. DOI:10.3969/j.issn.0490-6756.2017.05.011 (in Chinese)

[9]	王勇, 周慧怡, 俸皓, 等. 基于深度卷积神经网络的网络流量分类方法[J]. 通信学报, 2018, 39(1): 14-23. WANG Y, ZHOU H Y, FENG H, et al. Network traffic classification method basing on CNN[J]. Journal on Communications, 2018, 39(1): 14-23. (in Chinese)

[10]	SHI H, LI H, DAN Z, et al. An efficient feature generation approach based on deep learning and feature selection techniques for traffic classification[J]. Computer Networks, 2018, 132: 81-98. DOI:10.1016/j.comnet.2018.01.007

[11]	WEI W, SHENG Y, WANG J, et al. HAST-IDS:Learning hierarchical spatial-temporal features using deep neural networks to improve intrusion detection[J]. IEEE Access, 2018, 6(99): 1792-1806.

[12]	ZOU Z, GE J, ZHENG H, et al.Encrypted traffic classification with a convolutional Long short-term memory neural network[C]//2018 IEEE 20th International Conference on High Performance Computing and Communications.Piscataway: IEEE Press, 2018: 329-334.

[13]	TONG W, ZHEN H, WEI W, et al. Early-stage internet traffic identification based on packet payload size[J]. Journal of Southeast University(English Edition), 2014, 30(3): 289-295.

[14]	范竣翔, 李琦, 朱亚杰, 等. 基于RNN的空气污染时空预报模型研究[J]. 测绘科学, 2017, 42(7): 76-83. FAN J X, LI Q, ZHU Y J, et al. A spatio-temporal prediction framework for air pollution based on deep RNN[J]. Science of Surveying and Mapping, 2017, 42(7): 76-83. (in Chinese)

[15]	GREFF K, SRIVASTAVA R K, KOUTNíK J, et al. LSTM:A search space odyssey[J]. IEEE Transactions on Neural Networks & Learning Systems, 2016, 28(10): 2222-2232.

[16]	DONAHUE J, HENDRICKS L A, ROHRBACH M, et al. Long-term recurrent convolutional networks for visual recognition and description[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2014, 39(4): 677-691.

[17]	LIU J, SHAHROUDY A, XU D, et al.Spatio-temporal LSTM with trust gates for 3D human action recognition[C]//European Conference on Computer Visio.Berlin: Springer, 2016: 816-833.