一种基于概率主题模型的恶意代码特征提取方法

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2022-01-01

刘亚姝^1,2,王志海¹,侯跃然³,严寒冰⁴

¹(北京交通大学计算机与信息技术学院北京 100044);²(北京建筑大学电气与信息工程学院北京 100044);³(北京邮电大学网络技术研究院北京 100876);⁴(国家计算机网络应急技术处理协调中心北京 100029) (ly_s8020@163.com)

出版日期: 2019-11-12

基金资助:国家重点研发计划项目(2018YFB0803604,2018YFB0804704);国家自然科学基金项目(U1736218,61672086)

A Method of Extracting Malware Features Based on Probabilistic Topic Model

Liu Yashu^1,2, Wang Zhihai¹, Hou Yueran³, Yan Hanbing⁴

¹(School of Computer and Information Technology, Beijing Jiaotong University, Beijing 100044);²(School of Electrical and Information Engineering, Beijing University of Civil Engineering and Architecture, Beijing 100044);³(Institute of Network Technology, Beijing University of Posts and Telecommunications, Beijing 100876);⁴(National Computer Network Emergency Response Technical TeamCoordination Center of China, Beijing 100029)

Online: 2019-11-12

摘要/Abstract

摘要： 在当前复杂网络环境下，恶意代码通过各种方式快速传播，入侵用户终端设备或网络设备、非法窃取用户隐私数据，对网络和互联网用户造成了严重的安全威胁.传统检测方法难以检测未知恶意代码，而恶意代码变体的多样性和庞大数量也对未知恶意代码检测构成了巨大挑战.提出了一种无监督的恶意代码识别方法，通过分析反汇编PE文件给出汇编指令标准化规则，结合潜在狄立克雷分布(latent Dirichlet allocation, LDA)获得汇编指令中潜在的“文档-主题”、“主题-词”的分布.再以“主题分布”构造恶意样本特征，产生一个全新的恶意代码检测框架.结合“困惑度”和变化的步长给出了最优“主题”数目的快速评价和自动确定方法，解决了LDA模型中主题数目需要预先指定的问题.同时解析了“文档-主题”、“主题-词”聚集结果的语义可解释性，说明了该方法获得的样本特征具有潜在的语义.实验结果表明：与其他方法相比该方法具有相当的或更好的恶意代码鉴别能力，同时能够准确地识别恶意代码的新变体.

参考文献

相关文章 5

[1]	辛宇,杨静,汤楚蘅, 葛斯乔. 基于局部语义聚类的语义重叠社区发现算法[J]. 计算机研究与发展, 2015, 52(7): 1510-1521.
[2]	谭文堂王桢文殷风景葛斌肖卫东. 一种面向多文本集的部分比较性LDA模型[J]. 计算机研究与发展, 2013, 50(9): 1943-1953.
[3]	任昭春马军陈竹敏. 基于动态主题建模的Web论坛文档摘要[J]. , 2012, 49(11): 2359-2367.
[4]	陈允杰, 张建伟, 王顺凤, 詹天明,. 一种各向异性Wells算法脑核磁共振图像分割模型[J]. , 2010, 47(11): 1878-1885.
[5]	王双成, 冷翠平, 曹锋,. 小数据集贝叶斯网络多父节点参数的修复[J]. , 2009, 46(5): 787-793.

PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4040

相关话题/北京 网络 未知 计算机 数据

领限时大额优惠券,享本站正版考研考试资料!
优惠券领取后72小时内有效，10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材，产品类型包含电子书、题库、全套资料以及视频，无论您是考研复习、考证刷题，还是考前冲刺等，不同类型的产品可满足您学习上的不同需求。 ...
考试优惠券本站小编 Free壹佰分学习网 2022-09-19
面向双注意力网络的特定方面情感分析模型
孙小婉1,3,王英1,2,3,王鑫3,4,孙玉东2,31(吉林大学软件学院长春130012);2(吉林大学计算机科学与技术学院长春130012);3(符号计算与知识工程教育部重点实验室(吉林大学)长春130012);4(长春工程学院计算机技术与工程学院长春130012)(sunxw17@mails. ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
一种基于局部属性生成对抗网络的人脸修复算法
蒋斌,刘虹雨,杨超,涂文轩,赵子龙(湖南大学信息科学与工程学院长沙410082)(jiangbin@hnu.edu.cn)出版日期:2019-11-12基金资助:国家自然科学基金项目(61702176)；湖南省自然科学基金项目(2017JJ3038)AFaceInpaintingAlgorithmw ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
机会移动社交网络中基于群组构造的数据分发机制
李婕1,洪韬1,王兴伟1,黄敏2,郭静11(东北大学计算机科学与工程学院沈阳110819);2(东北大学信息科学与工程学院沈阳110819)(lijie@mail.neu.edu.cn)出版日期:2019-11-12基金资助:国家自然科学基金项目(61502092，61872073)；辽宁省高校创新 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
云环境下支持可更新加密的分布式数据编码存储方案
严新成1,陈越1,巴阳1,贾洪勇2,朱彧11(战略支援部队信息工程大学郑州450001)；2(郑州大学软件与应用科技学院郑州450001)(imtodshine@163.com)出版日期:2019-10-16基金资助:国家自然科学基金项目(61702549)；河南省科技攻关计划基金项目(172102 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
基于数据纵向分布的隐私保护逻辑回归
宋蕾1,马春光2,段广晗1,袁琪31(哈尔滨工程大学计算机科学与技术学院哈尔滨150001)；2(山东科技大学计算机科学与工程学院山东青岛266590)；3(齐齐哈尔大学通信与电子工程学院黑龙江齐齐哈尔161006)(songl@hrbeu.edu.cn)出版日期:2019-10-16基金资助:国家 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
基于卷积神经网络的JPEG图像隐写分析参照图像生成方法
任魏翔,翟黎明,王丽娜,嘉炬(空天信息安全与可信计算教育部重点实验室(武汉大学)武汉430072)(武汉大学国家网络安全学院武汉430072)(renweixiang@whu.edu.cn)出版日期:2019-10-16基金资助:国家自然科学基金重点项目(U1536204)；NSFC-通用技术基础研 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
面向绿色数据中心的能耗有效查询优化技术
邢宝平1,吕梦圆1,金培权1,2,黄国锐3,岳丽华1,21(中国科学技术大学计算机科学与技术学院合肥230027);2(中国科学院电磁空间信息重点实验室合肥230027);3(中国人民解放军31002部队北京100081)(lmys@mail.ustc.edu.cn)出版日期:2019-09-10基 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
机器学习化数据库系统研究综述
孟小峰,马超红,杨晨(中国人民大学信息学院北京100872)(xfmeng@ruc.edu.cn)出版日期:2019-09-10基金资助:国家自然科学基金项目(61532016，61532010，91846204，91646203，61762082)；国家重点研发计划项目(2016YFB100060 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
基于PU与生成对抗网络的POI定位算法
田继伟,王劲松,石凯(天津理工大学计算机科学与工程学院天津300384)(天津市智能计算及软件新技术重点实验室(天津理工大学)天津300384)(计算机病毒防治技术国家工程实验室(天津理工大学)天津300457)(jiwei.tian@foxmail.com)出版日期:2019-09-10基金资助: ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
基于生成式对抗网络的结构化数据表生成模型
宋珂慧1,张莹1,张江伟2,袁晓洁11(南开大学计算机学院天津300350);2(新加坡国立大学计算机学院新加坡117417)(songkehui@dbis.nankai.edu.cn)出版日期:2019-09-10基金资助:国家自然科学基金项目(61772289,U1836109)AGenerat ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01