基于混合词向量深度学习模型的DGA域名检测方法

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2022-01-01

杜鹏, 丁世飞

(中国矿业大学计算机科学与技术学院江苏徐州 221116) (矿山数字化教育部工程研究中心(中国矿业大学) 江苏徐州 221116) (pengdu@cumt.edu.cn)

出版日期: 2020-02-01

基金资助:国家自然科学基金项目(61672522,61976216,61379101)；江苏省研究生科研创新计划项目(KYCX19_2196)；中国矿业大学研究生科研创新计划项目(KYCX19_2196)

A DGA Domain Name Detection Method Based on Deep Learning Models with Mixed Word Embedding

Du Peng and Ding Shifei

(School of Computer Science and Technology, China University of Mining and Technology, Xuzhou, Jiangsu 221116) (Engineering Research Center of Mine Digitization (China University of Mining and Technology), Ministry of Education, Xuzhou, Jiangsu 221116)

Online: 2020-02-01

Supported by:This work was supported by the National Natural Science Foundation of China (61672522, 61976216, 61379101), the Graduate Innovation Fund of Jiangsu Province (KYCX19_2196), and the Postgraduate Research & Practice Innovation Program of China University of Mining and Technology (KYCX19_2196).

摘要/Abstract

摘要： 域名生成算法(domain generation algorithm, DGA)是域名检测中防范僵尸网络攻击的重要手段之一，对于生成威胁情报、阻断僵尸网络命令与控制流量、保障网络安全有重要的实际意义.近年来，DGA域名检测技术从依靠手工提取特征发展到自动提取特征的基于深度学习模型的方法，在DGA域名检测任务中取得了较大的进展.但对于不同僵尸网络家族的DGA域名的多分类任务，由于家族种类多，且各家族域名数据存在不平衡性，因此许多已有的深度学习模型在DGA域名的多分类任务上仍有提高空间.针对以上挑战，设计了基于字符和双字母组级别的混合词向量，以提高域名字符串的信息利用度，并设计了基于混合词向量方法的深度学习模型.最后设计了包含多种对比模型的实验，对混合词向量的有效性进行验证.实验结果表明基于混合词向量的深度学习模型在DGA域名检测与分类任务中相比只基于字符级词向量的模型有更好的分类性能，特别是在小样本的DGA域名类别上的分类性能更优，证明了该模型的有效性.

参考文献

相关文章 15

[1]	吴宗友, 白昆龙, 杨林蕊, 王仪琦, 田英杰. 电子病历文本挖掘研究综述[J]. 计算机研究与发展, 2021, 58(3): 513-527.
[2]	廖海斌, 徐斌. 基于性别和年龄因子分析的鲁棒性人脸表情识别[J]. 计算机研究与发展, 2021, 58(3): 528-538.
[3]	付章杰, 李恩露, 程旭, 黄永峰, 胡雨婷. 基于深度学习的图像隐写研究进展[J]. 计算机研究与发展, 2021, 58(3): 548-568.
[4]	古天龙, 冯旋, 李龙, 包旭光, 李云辉. 基于社会新闻数据集的伦理行为判别方法[J]. 计算机研究与发展, 2021, 58(2): 253-263.
[5]	陈晋音, 陈奕芃, 陈一鸣, 郑海斌, 纪守领, 时杰, 程瑶. 面向深度学习的公平性研究综述[J]. 计算机研究与发展, 2021, 58(2): 264-280.
[6]	李金鹏, 张闯, 陈小军, 胡玥, 廖鹏程. 自动文本摘要研究综述[J]. 计算机研究与发展, 2021, 58(1): 1-21.
[7]	孟子尧, 谷雪, 梁艳春, 许东, 吴春国. 深度神经架构搜索综述[J]. 计算机研究与发展, 2021, 58(1): 22-33.
[8]	朱泓睿, 元国军, 姚成吉, 谭光明, 王展, 户忠哲, 张晓扬, 安学军. 分布式深度学习训练网络综述[J]. 计算机研究与发展, 2021, 58(1): 98-115.
[9]	林培光, 周佳倩, 温玉莲. SCONV：一种基于情感分析的金融市场趋势预测方法[J]. 计算机研究与发展, 2020, 57(8): 1769-1778.
[10]	李若南, 李金宝. 一种无源被动室内区域定位方法的研究[J]. 计算机研究与发展, 2020, 57(7): 1381-1392.
[11]	李冬梅, 张扬, 李东远, 林丹琼. 实体关系抽取方法研究综述[J]. 计算机研究与发展, 2020, 57(7): 1424-1448.
[12]	邢新颖, 冀俊忠, 姚垚. 基于自适应多任务卷积神经网络的脑网络分类方法[J]. 计算机研究与发展, 2020, 57(7): 1449-1459.
[13]	胡超文, 邬昌兴, 杨亚连. 基于扩展的S-LSTM的文本蕴含识别[J]. 计算机研究与发展, 2020, 57(7): 1481-1489.
[14]	于海涛, 杨小汕, 徐常胜. 基于多模态输入的对抗式视频生成方法[J]. 计算机研究与发展, 2020, 57(7): 1522-1530.
[15]	卢海峰, 顾春华, 罗飞, 丁炜超, 杨婷, 郑帅. 基于深度强化学习的移动边缘计算任务卸载研究[J]. 计算机研究与发展, 2020, 57(7): 1539-1554.

PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4128