1(北京大学软件与微电子学院 北京 102600);2(中兴通讯股份有限公司 广东深圳 518057);3(北京大学信息科学技术学院 北京 100871) (yanghongzhang@pku.edu.cn)
出版日期:
2020-02-01基金资助:
国家重点研发计划项目(2018YFB1003302);国家自然科学基金项目(61672062);江苏省工业和信息产业转型升级专项资金项目(2018GX02517)Proactive Fault Tolerance Based on “Collection—Prediction—Migration—Feedback” Mechanism
Yang Hongzhang1, Yang Yahui1, Tu Yaofeng2, Sun Guangyu3, and Wu Zhonghai11(School of Software & Microelectronics, Peking University, Beijing 102600);2(ZTE Corporation, Shenzhen, Guangdong 518057);3(School of Electronics Engineering and Computer Science, Peking University, Beijing 100871)
Online:
2020-02-01Supported by:
This work was supported by the National Key Research and Development Program of China (2018YFB1003302), the National Natural Science Foundation of China(61672062), and the Jiangsu Provincial Program of Industrial & Information Industry Transformation (2018GX02517).摘要/Abstract
摘要: 硬盘故障是数据中心最主要的故障,严重影响了可靠性.传统的数据容错技术一般都是通过增加数据冗余来实现的,存在缺陷.主动容错技术通过预测硬盘故障提前将数据迁移,成为研究热点.现有技术大多研究硬盘故障预测,缺乏采集、迁移、反馈的研究,难以商用.提出“采集—预测—迁移—反馈”全流程主动容错机制,包括:分时硬盘信息采集方法、滑动窗口记录合并及样本构建方法、多类型硬盘故障预测方法、多盘联合数据迁移方法、预测结果二级验证及快速反馈方法.测试表明:采集硬盘信息对业务影响仅0.96%,硬盘故障预测召回率达94.66%,数据修复时间较传统方法减少55.10%.该工作已在中兴通讯的数据中心稳定商用,满足了主动容错技术在高可靠、高智能、低干扰、低成本、广适用等核心目标.
参考文献
相关文章 15
[1] | 周鹏, 武延军, 赵琛. 一种融合程序员和神经网络的自动化程序生成方法[J]. 计算机研究与发展, 2021, 58(3): 638-650. |
[2] | 杨帆, 张鹏, 王展, 元国军, 安学军. 基于在网计算加速的拜占庭容错算法[J]. 计算机研究与发展, 2021, 58(1): 164-177. |
[3] | 林培光, 周佳倩, 温玉莲. SCONV:一种基于情感分析的金融市场趋势预测方法[J]. 计算机研究与发展, 2020, 57(8): 1769-1778. |
[4] | 成科扬, 王宁, 师文喜, 詹永照. 深度学习可解释性研究进展[J]. 计算机研究与发展, 2020, 57(6): 1208-1217. |
[5] | 于剑. 图灵测试的明与暗[J]. 计算机研究与发展, 2020, 57(5): 906-911. |
[6] | 董永强, 王鑫, 刘永博, 杨望. 异构YANG模型驱动的网络领域知识图谱构建[J]. 计算机研究与发展, 2020, 57(4): 699-708. |
[7] | 包涵, 王意洁, 许方亮. 基于生成矩阵变换的跨数据中心纠删码写入方法[J]. 计算机研究与发展, 2020, 57(2): 291-305. |
[8] | 王江,章明星,武永卫,陈康,郑纬民. 类Paxos共识算法研究进展[J]. 计算机研究与发展, 2019, 56(4): 692-707. |
[9] | 李增鹏,马春光,赵明昊. 抵抗自适应密钥恢复攻击的层级全同态加密[J]. 计算机研究与发展, 2019, 56(3): 496-507. |
[10] | 王宝楠,胡风,张焕国,王潮. 从演化密码到量子人工智能密码综述[J]. 计算机研究与发展, 2019, 56(10): 2112-2134. |
[11] | 陈宇飞,沈超,王骞,李琦,王聪,纪守领,李康,管晓宏. 人工智能系统安全与隐私风险[J]. 计算机研究与发展, 2019, 56(10): 2135-2150. |
[12] | 韩栋,周聖元,支天,陈云霁,陈天石. 智能芯片的评述和展望[J]. 计算机研究与发展, 2019, 56(1): 7-22. |
[13] | 曹珍富. 信息安全的新发展——为《计算机研究与发展》创刊六十周年而作[J]. 计算机研究与发展, 2019, 56(1): 131-137. |
[14] | 郑庆华,董博,钱步月,田锋,魏笔凡,张未展,刘均. 智慧教育研究现状与发展趋势[J]. 计算机研究与发展, 2019, 56(1): 209-224. |
[15] | 吴宇,杨涓,刘人萍,任津廷,陈咸彰,石亮,刘铎. 近似存储技术综述[J]. 计算机研究与发展, 2018, 55(9): 2002-2015. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4119