基于字嵌入的可识别长流的分层注意力模型

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研/2020-05-27

在网络安全研究中，基于深度学习的入侵检测方法因具有较强的检测能力而受到越来越多的关注。然而，大部分基于深度学习的入侵检测方法处理长度过长的网络流量数据时能力不足，它们选择只处理流量的包头部分，忽略流量载荷中有价值的信息，因此当黑客把攻击行为隐藏在流量的载荷中时，这些入侵检测方法就无法有效检测到恶意流量。
　　中科院声学所国家网络新媒体工程技术研究中心的博士生韩陆超等人提出了一种能够检测不同长度流量的注意力模型，以检测基于流量载荷的恶意流量；同时设计了一种基于生成式对抗网络（Generative Adversarial Networks, GAN）的流量生成模型，可以从原始数据集生成新的网络流量数据，以增强数据的安全性并保护用户隐私。相关研究成果2019年6月24日在线发表于国际学术期刊 IEEE Access 。
　　研究人员提出的分层注意力模型，可以从字节和数据包这两个层面学习流量信息。该模型使用双向GRU(Gated Recurrent Unit)构建字节表示，并通过注意机制给不同的字节分配不同的权重，一些与分类目标直接相关的关键字节在编码过程中被赋予更多权重。数据包表示的构建与此类似，最后使用注意力机制汇总构建整个TCP（Transmission Control Protocol）流的表示向量。
　　在入侵检测研究中经常遇到缺乏流量数据的问题，特别是在深度学习方法中，训练数据的局限性严重限制了模型的训练效果。此外，直接检测现实用户的网络流量可能会侵犯用户隐私。
　　研究人员提出了Flow-WGAN（Wasserstein GAN）流量生成模型，从原始数据集中生成新数据。这种模型的结构和提取信息的方法与分类器不同，因此可以从同一原始训练集中学习新的特征并获得具有全新数据的网络流数据包。研究人员用此数据包来模拟新的网络应用流量类型，以评估分类器的性能或改进分类器。
　　基于ISCX-2012和ISCX-2017数据集的实验结果表明，与其他四种先进的深度学习方法相比，该分层注意力模型在准确性和真阳性率（true positive rate，TPR）方面具有更高的性能，且该模型在检测生成的数据包时所需训练时间比当前最先进的HSAT-IDS恶意流量检测模型减少30%。
　　

　
　　分层注意力模型的结构图（图/中科院声学所）
　　

　
　　流量生成模型的原理图（图/中科院声学所）
　　关键词：
　　网络安全；入侵检测；深度学习
　　参考文献：
　　HAN Luchao, SHENG Yiqiang, ZENG Xuewen. A Packet-Length-Adjustable Attention Model Based on Bytes Embedding Using Flow-WGAN for Smart Cybersecurity. IEEE Access, 2019, 7: 82913 - 82926. DOI: 10.1109/ACCESS.2019.2924492.
　　论文链接：
　　https://ieeexplore.ieee.org/document/8744218

相关话题/数据 网络

领限时大额优惠券,享本站正版考研考试资料!
优惠券领取后72小时内有效，10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材，产品类型包含电子书、题库、全套资料以及视频，无论您是考研复习、考证刷题，还是考前冲刺等，不同类型的产品可满足您学习上的不同需求。 ...
考试优惠券本站小编 Free壹佰分学习网 2022-09-19
基于变体GRU预处理网络数据包的入侵检测优化算法
在网络空间中，用入侵检测（Intrusion Detection System，IDS）判断网络数据包是否包含攻击对于防范网络攻击和保护信息安全具有重要意义。现有的IDS算法存在两个问题，一是利用人工经验大量提取的特征无法准确描述网络数据包；二是神经网络结构复杂、内存占用大、功耗大。　　中科院声学所 ...
中科院声学研究所本站小编 Free考研 2020-05-27
声场声信息国家重点实验室参加第13届ACM国际水下网络与系统会议
2018年12月3日至5日，第13届ACM国际水下网络与系统会议（The 13th ACM International Conference on Underwater Networks & Systems，WUWNet’18）在中国深圳举办，声场声信息国家重点实验室作为主办方之一参与了会议筹备工作 ...
中科院声学研究所本站小编 Free考研 2020-05-27
基于混合沃森模型和时频选择网络的目标声源定位方法
在声学环境中利用麦克风阵列拾取目标声源信号时，不同通道的观测信号会出现能量和相位的差异，根据这些差异可以判断出目标声源的波达方向（即信号到达阵列参考阵元的方向角）。然而，当环境中存在方向性噪声或其他非目标声源干扰时，声源定位算法一般无法有效地区分目标声源方位和干扰声源方位，往往需要依赖额外的信息（如 ...
中科院声学研究所本站小编 Free考研 2020-05-27
基于小波谱图和深度卷积网络的音频场景识别新框架
近年来，网络上音频的种类和数量呈现爆发式增长。相比语音和音乐，音频中的环境信息更加多样，受到了国内外研究者的广泛关注。　　音频场景分类的目的是识别出录制音频的特定场景，从而使穿戴式设备、智能机器人感知周围的环境信息并做出相应反射。传统的音频分类任务大都使用短时特征，如梅尔频率倒谱系数等。然而，环境信 ...
中科院声学研究所本站小编 Free考研 2020-05-27
基于软听觉噪声掩蔽和深度神经网络的风噪语音增强方法
在真实的声学环境中，尤其是户外录音时，语音信号的感知质量和可懂度通常会受到非平稳背景噪声（如风噪）的严重影响。风噪一般是由用户头部、记录设备或其他障碍物周围的湍流气流产生，会严重削弱语音通信的声音质量。　　为了消除语音通信中的风噪、减少语音失真，声学所院语言声学与内容理解重点实验室的白海钏、葛凤培等 ...
中科院声学研究所本站小编 Free考研 2020-05-27
新的动态网络预测方法
在现实生活中，网络无处不在。小到蛋白质分子相互连接的生物网，大到人与人相互联系的关系网，我们的衣食住行几乎被抽象的网络包围。这些网络数据量大，而且会随着时间不断演变。　　近期，声学所院语言声学与内容理解重点实验室颜永红研究员领导的大数据课题组宣布，基于动态网络的学习表示并用于链路预测的研究取得阶段性 ...
中科院声学研究所本站小编 Free考研 2020-05-27
数据科学的理论与应用—记分子系统中心第十四期“未来科学沙龙”
2019年8月7日下午，由中国科学院遗传与发育生物学研究所分子系统生物学研究中心主办的“未来科学沙龙”第十四期于研究所职工之家顺利举行。本场沙龙以“数据科学”为主题，介绍了企业界数据分析的重要步骤、何为数据科学家以及数据科学家的必备技能。分子系统生物学研究中心王秀杰研究员、钱文峰研究员和屠强研究员出 ...
中科院遗传与发育生物学研究所本站小编 Free考研 2020-05-26
储成才研究员应邀在Current Opinion in Plant Biology撰写植物氮信号调控网络综述文章
氮是植物需求量最大的矿质营养元素，农业生产中以氮肥为主的化肥投入对提高粮食产量、保障粮食安全起到了至关重要的作用。但是，氮肥的超量施用导致植物氮肥利用效率低下，引起包括温室气体排放、水体富营养化在内的诸多环境问题。由于土壤中氮源的种类及含量高度可变，植物在长期进化过程中形成了响应外界氮素营养条件，且 ...
中科院遗传与发育生物学研究所本站小编 Free考研 2020-05-26
钱文峰研究组优化单细胞DNA甲基化修饰异质性算法并发布数据库HeteroMeth
DNA甲基化是真核生物体内广泛存在的一种表观遗传修饰，在基因转录调控、细胞分化、基因组印迹、X染色体失活等生物学过程中发挥着至关重要的作用。由于测序技术和计算方法的局限，以往研究者获得的是一个细胞群体的平均DNA甲基化水平。平均化的甲基化水平虽然承载着一定的信息，却丢失了诸如不同细胞之间存在的甲基化 ...
中科院遗传与发育生物学研究所本站小编 Free考研 2020-05-26
钱文峰研究组发现遗传互作网络对染色体上基因顺序的决定作用
真核生物基因在染色体上的呈线性排列。在多个物种中均有报道指出，基因的排列顺序不是完全随机的。然而基因有序排列的进化机制仍不明确。　　中国科学院遗传与发育生物学研究所钱文峰研究组根据进化理论模型推测遗传互作网络是影响基因排列顺序的重要因素。研究者对基因顺序的形成进行了进化模拟计算，并对酵母遗传互作网络 ...
中科院遗传与发育生物学研究所本站小编 Free考研 2020-05-26