删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

面向云数据中心多语法日志通用异常检测机制

本站小编 Free考研考试/2022-01-01

张圣林1,李东闻1,孙永谦1,孟伟彬2,3,4,张宇哲1,张玉志1,刘莹3,4,裴丹2,4
1(南开大学软件学院 天津 300350);2(清华大学计算机科学与技术系 北京 100084);3(清华大学网络科学与网络空间研究院 北京 100084);4(北京信息科学与技术国家研究中心 北京 100084) (zhangsl@nankai.edu.cn)
出版日期: 2020-04-01


基金资助:国家重点研发计划项目(2018YFB0204304)

Unified Anomaly Detection for Syntactically Diverse Logs in Cloud Datacenter

Zhang Shenglin1, Li Dongwen1, Sun Yongqian1, Meng Weibin2,3,4, Zhang Yuzhe1, Zhang Yuzhi1, Liu Ying3,4, Pei Dan2,4
1(College of Software, Nankai University, Tianjin 300350);2(Department of Computer Science and Technology, Tsinghua University, Beijing 100084);3(Institute for Network Sciences and Cyberspace, Tsinghua University, Beijing 100084);4(Beijing National Research Center for Information Science and Technology, Beijing 100084)
Online: 2020-04-01


Supported by:This work was supported by the National Key Research and Development Plan of China (2018YFB0204304).




摘要/Abstract


摘要: 得益于自然语言处理和机器学习方法的快速发展,基于日志对云数据中心软硬件系统进行自动异常检测变得越来越流行.无监督学习方法不需要标记异常日志,但通常存在准确性较低、仍需标注大量正常日志的问题.尽管有监督学习方法的准确性较高,但由于不同软硬件系统产生不同类型的、语法各异的日志,导致有监督学习方法需要为每一类型日志标注足够多的异常日志以训练相应的异常检测模型,这极大地增加了标注异常日志的人力成本.与此同时,不同类型日志在发生异常时往往具有相同或相似的语义.因此,提出了一种跨日志类型的通用异常检测机制——LogMerge.该机制通过学习多语法日志的语义相似性,可实现日志异常模式的跨日志类型迁移,从而大大减少了异常标注开销.LogMerge采用词嵌入方法先后构建单词和模板的向量,然后使用聚类方法将语义相同或相近的模板聚成一类,解决了不同类型日志语法不同带来的挑战.此外,LogMerge结合CNN与LSTM方法构建异常检测模型,既有效提取了日志序列的前后依赖性,又显著降低了日志序列中噪声带来的影响.使用公开日志数据集的实验表明,相比于当前的有监督学习方法和无监督学习方法,LogMerge取得了更高的准确性.实验还验证了LogMerge能够显著减少异常标注工作量——在目标类型日志异常标注较少时,依然能够取得较高的准确性.






[1]古天龙, 冯旋, 李龙, 包旭光, 李云辉. 基于社会新闻数据集的伦理行为判别方法[J]. 计算机研究与发展, 2021, 58(2): 253-263.
[2]胡超文, 邬昌兴, 杨亚连. 基于扩展的S-LSTM的文本蕴含识别[J]. 计算机研究与发展, 2020, 57(7): 1481-1489.
[3]陈波, 陆游游, 蔡涛, 陈游旻, 屠要峰, 舒继武. 一种分布式持久性内存文件系统的一致性机制[J]. 计算机研究与发展, 2020, 57(3): 660-667.
[4]陈游旻, 朱博弘, 韩银俊, 屠要峰, 舒继武. 一种持久性内存文件系统数据页的混合管理机制[J]. 计算机研究与发展, 2020, 57(2): 281-290.
[5]吴尚宇, 谢婧雯, 王毅. 面向键值存储的日志结构合并树优化技术[J]. 计算机研究与发展, 2020, 57(11): 2432-2441.
[6]张晗,郭渊博,李涛. 结合GAN与BiLSTM-Attention-CRF的领域命名实体识别[J]. 计算机研究与发展, 2019, 56(9): 1851-1858.
[7]林欣,田鑫,季怡,徐云龙,刘纯平. 一种残差置乱上下文信息的场景图生成方法[J]. 计算机研究与发展, 2019, 56(8): 1721-1730.
[8]王海涛,李战怀,张晓,赵晓南. 一种基于LSM树的键值存储系统性能优化方法[J]. 计算机研究与发展, 2019, 56(8): 1792-1802.
[9]叶静,邹博伟,洪宇,沈龙骧,朱巧明,周国栋. 汉语否定与不确定覆盖域检测[J]. 计算机研究与发展, 2019, 56(7): 1506-1516.
[10]张龙,王劲松. SDN中基于信息熵与DNN的DDoS攻击检测模型[J]. 计算机研究与发展, 2019, 56(5): 909-918.
[11]席亮,王勇,张凤斌. 基于自适应人工鱼群FCM的异常检测算法[J]. 计算机研究与发展, 2019, 56(5): 1048-1059.
[12]王海涛,李战怀,张晓,卜海龙,孔兰昕,赵晓南. 基于历史数据的虚拟机资源分配方法[J]. 计算机研究与发展, 2019, 56(4): 779-789.
[13]黄继鹏,史颖欢,高阳. 面向小目标的多尺度Faster-RCNN检测算法[J]. 计算机研究与发展, 2019, 56(2): 319-327.
[14]陈兴蜀, 陈佳昕, 金鑫, 葛龙. 云环境基于系统调用向量空间的进程异常检测[J]. 计算机研究与发展, 2019, 56(12): 2684-2693.
[15]韩东明,郭方舟,潘嘉铖,郑文庭,陈为. 面向时序数据异常检测的可视分析综述[J]. 计算机研究与发展, 2018, 55(9): 1843-1852.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4160
相关话题/计算机 数据 北京 语法 系统

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • GitHub中软件生态系统的演化
    齐晴,曹健,刘妍岑(上海交通大学电子信息与电气工程学院计算机系上海201100)(qi_ng616@sjtu.edu.cn)出版日期:2020-03-01基金资助:国家重点研发计划项目(2018YFB1003800)TheEvolutionofSoftwareEcosysteminGitHubQiQ ...
    本站小编 Free考研考试 2022-01-01
  • 基于用户级融合I/O的Key-Value存储系统优化技术研究
    安仲奇1,张云尧1,2,邢晶1,霍志刚1,21(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190);2(中国科学院大学计算机与控制工程学院北京100049)(anzhongqi@ncic.ac.cn)出版日期:2020-03-01基金资助:国家重点研发计划项目(2018YFC ...
    本站小编 Free考研考试 2022-01-01
  • 2020大数据与智能存储系统前沿技术专题前言
    舒继武1,王意洁21(清华大学北京100084);2(国防科技大学长沙410073)出版日期:2020-02-01Online:2020-02-01摘要/Abstract摘要:近年来,随着国家和社会信息化发展的不断加速,对信息存储提出了越来越高的要求.一方面,大数据时代,数据存储的规模和处理需求越来 ...
    本站小编 Free考研考试 2022-01-01
  • 一种分布式持久性内存文件系统的一致性机制
    陈波1,2,陆游游2,蔡涛1,陈游旻2,屠要峰3,舒继武21(江苏大学计算机科学与通信工程学院江苏镇江212013);2(清华大学计算机科学与技术系北京100084);3(中兴通讯股份有限公司南京210012)(chenbo_9312@163.com)出版日期:2020-03-01基金资助:国家重点 ...
    本站小编 Free考研考试 2022-01-01
  • 基于冲突检测的高吞吐NVM存储系统
    蔡涛,王杰,牛德姣,刘佩瑶,陈福丽(江苏大学计算机科学与通信工程学院江苏镇江212013)(caitao@ujs.edu.cn)出版日期:2020-02-01基金资助:国家自然科学基金项目(61806086);国家重点研发计划项目(2018YFB0804204);中国博士后科学基金项目(2016M6 ...
    本站小编 Free考研考试 2022-01-01
  • 一种持久性内存文件系统数据页的混合管理机制
    陈游旻1,朱博弘1,韩银俊2,屠要峰2,舒继武11(清华大学计算机科学与技术系北京100084);2(中兴通讯股份有限公司南京210012)(chenym16@mails.tsinghua.edu.cn)出版日期:2020-02-01基金资助:国家重点研发计划项目(2018YFB1003301);中 ...
    本站小编 Free考研考试 2022-01-01
  • 新型存储设备上重复数据删除指纹查找优化
    何柯文,张佳辰,刘晓光,王刚(南开大学计算机学院天津300350)(天津市网络与数据安全技术重点实验室(南开大学)天津300350)(hekw@nbjl.nankai.edu.cn)出版日期:2020-02-01基金资助:国家自然科学基金项目(U1833114,61872201,61702521,6 ...
    本站小编 Free考研考试 2022-01-01
  • 基于生成矩阵变换的跨数据中心纠删码写入方法
    包涵1,2,王意洁1,2,许方亮21(并行与分布处理国家重点实验室(国防科技大学)长沙410073);2(国防科技大学计算机学院长沙410073)(hanb_nudt@foxmail.com)出版日期:2020-02-01基金资助:国家重点研发计划项目(2016YFB1000101);国家自然科学基 ...
    本站小编 Free考研考试 2022-01-01
  • 基于地理空间大数据的高效索引与检索算法
    赵慧慧1,2,赵凡2,3,陈仁海1,2,冯志勇1,21(天津大学智能与计算学部天津300350);2(天津大学深圳研究院广东深圳518000);3(天津大学国际工程师学院天津300350)(1442700849@qq.com)出版日期:2020-02-01基金资助:国家自然科学基金项目(617023 ...
    本站小编 Free考研考试 2022-01-01
  • 基于收益模型的Spark SQL数据重用机制
    申毅杰,曾丹,熊劲(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190)(中国科学院大学北京100049)(shenyijie@ict.ac.cn)出版日期:2020-02-01基金资助:国家重点研发计划项目(2016YFB1000202);国家自然科学基金项目(6137904 ...
    本站小编 Free考研考试 2022-01-01