摘要:基于日志数据的故障诊断是指通过智能化手段分析系统运行时产生的日志数据以自动化地发现系统异常、诊断系统故障.随着智能运维(artificial intelligence for IT operations,简称AIOps)的快速发展,该技术正成为学术界和工业界的研究热点.首先总结了基于日志数据的分布式软件系统故障诊断研究框架,然后就日志处理与特征提取、基于日志数据的异常检测、基于日志数据的故障预测和基于日志数据分析的故障根因诊断等关键技术对近年来国内外相关工作进行了深入分析,最后以所提出的研究框架为指导总结相关研究工作,并对未来研究可能面临的挑战进行了展望.
Abstract:Log-based failure diagnosis refers to intelligent analysis of system runtime logs to automatically discover system anomalies and diagnose system failures. Today, this technology is one of the key technologies of artificial intelligence for IT operations (AIOps), which has become a research hotspot in both academia and industry. This study first analyzes the log-based failure diagnosis process, and summarizes the research framework of fault diagnosis based on logs and four key technologies in the field:Log processing and feature extraction technology, anomaly detection technology, failure prediction technology, and fault diagnosis technology. Next, a systematic review is conducted of the achievements of scholars at home and abroad in these four key technical fields in recent years. At last, the different technologies are summarized in this field based on the research framework, and the possible challenges are looked forwarded for future research.
PDF全文下载地址:
http://jos.org.cn/jos/article/pdf/6045
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
基于日志数据的分布式软件系统故障诊断综述
本站小编 Free考研考试/2022-01-02
相关话题/数据 系统 技术 工作 智能
分布式追踪技术综述
摘要:随着分布式软件系统在各个行业的广泛应用,如何提升系统运维效率,保障其服务的可靠与稳定,得到了学术界与工业界的关注.分布式软件系统其规模庞大、结构复杂、持续更新且大量服务请求并发执行的特点,给分布式软件系统的运维任务带来了严峻的挑战.传统的以组件/节点/进程/线程为中心的系统监控与追踪方法难以支 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02甲状腺、乳腺超声影像自动分析技术综述
摘要:超声诊断是甲状腺、乳腺癌首选影像学检查和术前评估方法.但良/恶性结节的超声表现存在重叠,仍欠缺定量、稳定的分析手段,严重依赖操作者的经验.近年来,基于计算机技术的医疗影像分析水平快速发展,超声影像分析取得了一系列里程碑式的突破,为医疗提供有效的诊断决策支持.以甲状腺、乳腺两类超声影像为对象,梳 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02数据中心网络负载均衡问题研究
摘要:数据中心网络是现代网络和云计算的重要基础设施,实现数据中心网络负载均衡是保证网络吞吐并提高服务体验的关键环节.首先分析了数据中心网络与传统互联网之间的区别,总结其特点及特殊性在负载均衡方案设计方面的优势.然后从数据中心的复杂性和多样性角度分析其负载均衡方案设计所面临的挑战.将现有数据中心网络负 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02信息物理系统软件设计自动化专题前言
摘要:为了更精确地认识与改造世界,新一代的嵌入式系统必须将计算世界与物理世界作为紧密交互的整体进行认知,实现集计算、通信与控制于一体的深度融合的理论体系与技术框架,即信息物理系统(cyber-physicalsystems,简称CPS).与传统嵌入式系统不同,CPS充分考虑了计算部件与物理环境的深度 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02自主机器人多智能体软件架构及伴随行为机制
摘要:自主机器人是一类由计算机软件控制的信息物理系统,如何支持该类机器人在开放环境下的有效和协调运行,是自主机器人控制软件(controlsoftwareofautonomousrobot,简称CSAR)研究与实践面临的一项重要挑战.基于组织理论的思想,采用Structure-in-5的组织架构模式 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02基于动态分析的软件不变量综合技术
摘要:软件不变量是软件的重要属性,在软件验证、软件调试和软件测试等领域有重要作用.自20世纪末以来,基于动态分析的不变量综合技术成为相关领域的一个研究热点,并且取得了一定的进展.收集了90篇相关论文对该领域进行系统总结.基于动态分析的不变量综合技术是该领域的核心问题,提出了“学习者-预言”框架统一描 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02面向大数据分析作业的启发式云资源供给方法
摘要:云计算已成为大数据分析作业的主流运行支撑环境,选择合适的云资源优化其性能面临巨大挑战.当前研究主要考虑大数据分析框架(如Hadoop,Spark等)的多样性,采用机器学习方法进行资源供给,但样本少容易陷入局部最优解.提出了大数据环境下基于负载分类的启发式云资源供给方法RP-CH,基于云资源共享 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02持久化内存文件系统的磨损攻击与防御机制
摘要:近来出现诸多以非易失性存储器(non-volatilememory,简称NVM)作为存储设备的新型持久化内存文件系统,充分发掘NVM的低延迟和可按字节寻址等优点,优化文件访问的I/O栈和一致性机制,极大提升文件系统的性能.然而,现有持久化内存文件系统都没有考虑NVM写耐受度低的缺陷,极易导致N ...中科院软件研究所 本站小编 Free考研考试 2022-01-02系统软件构造与验证技术专题前言
摘要:Abstract:PDF全文下载地址:http://jos.org.cn/jos/article/pdf/5958 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02面向顺序存储结构的数据流分析
摘要:C程序中数组、malloc动态分配后的连续内存等顺序存储结构被大量使用,但大多数传统的数据流分析方法未能充分描述其结构及其上的操作,特别是在利用指针访问顺序存储结构时,传统的分析方法只关注了指针的指向关系,而未讨论指针可能发生偏移的数值信息,且未考虑发生偏移时可能存在越界的不安全问题,导致了对 ...中科院软件研究所 本站小编 Free考研考试 2022-01-02