删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于随机森林的流处理检查点性能预测

本站小编 Free考研考试/2022-01-03

褚征,
于炯,
新疆大学信息科学与工程学院 乌鲁木齐 830046
基金项目:国家自然科学基金(61862060, 61462079, 61562086, 61562078),新疆大学博士生科技创新项目(XJUBSCX-201901)

详细信息
作者简介:褚征:男,1991年生,博士生,研究方向为分布式计算、内存计算和机器学习
于炯:男,1966年生,教授,研究方向为分布式计算、内存计算和绿色计算
通讯作者:于炯 yujiong@xju.edu.cn
中图分类号:TN919; TP311

计量

文章访问数:2815
HTML全文浏览量:882
PDF下载量:78
被引次数:0
出版历程

收稿日期:2019-07-23
修回日期:2020-02-17
网络出版日期:2020-03-10
刊出日期:2020-06-22

Performance Prediction Based on Random Forest for the Stream Processing Checkpoint

Zheng CHU,
Jiong YU,
School of Information Science and Engineering, Xinjiang University, Urumqi 830046, China
Funds:The National Natural Science Foundation of China (61862060, 61462079, 61562086, 61562078), The Doctoral Science, Technology Innovation Project in Xinjiang University (XJUBSCX-201901)


摘要
摘要:物联网(IoT)的发展引起流数据在数据量和数据类型两方面不断增长。由于实时处理场景的不断增加和基于经验知识的配置策略存在缺陷,流处理检查点配置策略面临着巨大的挑战,如费事费力,易导致系统异常等。为解决这些挑战,该文提出基于回归算法的检查点性能预测方法。该方法首先分析了影响检查点性能的6种特征,然后将训练集的特征向量输入到随机森林回归算法中进行训练,最后,使用训练好的算法对测试数据集进行预测。实验结果表明,与其它机器学习算法相比,随机森林回归算法在CPU密集型基准测试,内存密集型基准测试和网络密集型基准测试上针对检查点性能的预测具有误差低,准确率高和运行高效的优点。
关键词:流处理/
预测方法/
检查点性能/
随机森林/
回归算法
Abstract:Since real-time processing scenarios for ever-increasing amount and type of streaming data caused by the development of the Internet of Things (IoT) keep increasing, and strategies based on empirical knowledge for checkpoint configuration are deficiencies, the strategy faces huge challenges, such as time-consuming, labor-intensive, causing system anomalies, etc. To address these challenges, regression algorithm-based prediction is proposed for checkpoint performance. Firstly, six kinds of features, which have a huge influence on the performance, are analyzed, and then feature vectors of the training set are input into the regression algorithms for training, finally, test sets are used for the checkpoint performance prediction. Compared with other machine learning algorithms, the experimental results illustrat that the Random Forest (RF) has lower errors, higher accuracy and faster execution on CPU intensive benchmark, memory intensive benchmark and network intensive benchmark.
Key words:Stream processing/
Prediction method/
Checkpoint Performance/
Random Forest (RF)/
Regression algorithm



PDF全文下载地址:

https://jeit.ac.cn/article/exportPdf?id=1a749da7-1eb1-4b9c-851a-e1e5be7fb447
相关话题/计算 测试 新疆大学 博士生 网络

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 虚拟网络切片中的在线异常检测算法研究
    王威丽,陈前斌,,唐伦1.重庆邮电大学通信与信息工程学院重庆4000652.重庆邮电大学移动通信重点实验室重庆400065基金项目:国家自然科学基金(61571073),重庆市教委科学技术研究项目(KJZD-M201800601)详细信息作者简介:王威丽:女,1994年生,博士生,研究方向为虚拟化网 ...
    本站小编 Free考研考试 2022-01-03
  • 面向可靠性的5G网络切片重构及映射算法
    赵国繁,,唐伦,胡彦娟,赵培培,陈前斌1.重庆邮电大学通信与信息工程学院重庆4000652.重庆邮电大学移动通信技术重点实验室重庆400065基金项目:国家自然科学基金(61571073),重庆市教委科学技术研究项目(KJZD-M201800601)详细信息作者简介:赵国繁:女,1993年生,硕士, ...
    本站小编 Free考研考试 2022-01-03
  • 一种基于数据平面可编程的软件定义网络报文转发验证机制
    左志斌,常朝稳,,祝现威信息工程大学郑州450001基金项目:国家自然科学基金(61572517)详细信息作者简介:左志斌:男,1979年生,博士生,研究方向为SDN、网络安全常朝稳:男,1965年生,教授,博士生导师,研究方向为网络安全、态势感知祝现威:男,1991年生,博士生,研究方向为SDN、 ...
    本站小编 Free考研考试 2022-01-03
  • 关于系统级故障诊断的烟花-反向传播神经网络算法
    归伟夏,陆倩,,苏美力广西大学计算机与电子信息学院南宁530004基金项目:国家自然科学基金(61862003,61862004),广西研究生教育创新计划资助项目(YCSW2019036)详细信息作者简介:归伟夏:女,1974年生,副教授,博士,研究方向为智能计算、网络与并行分布式计算陆倩:女,19 ...
    本站小编 Free考研考试 2022-01-03
  • 一种基于异步传感器网络的空间目标分布式跟踪方法
    黄静琪1,2,,,胡琛1,孙山鹏2,高翔2,何兵11.火箭军工程大学西安7100252.宇航动力学国家重点实验室西安710043详细信息作者简介:黄静琪:女,1987年生,助理研究员,研究方向为航天器精密轨道确定、实时轨道计算、分布式滤波胡琛:男,1988年生,博士,讲师,研究方向为分布式滤波、多智 ...
    本站小编 Free考研考试 2022-01-03
  • 无线传感网络量化及能量优化策略
    吕敬祥,罗文浪,1.井冈山大学电子与信息工程学院吉安3430092.流域生态与地理环境监测国家测绘地理信息局重点实验室吉安343009基金项目:国家自然科学基金(51867011),江西省教育厅科技计划项目(GJJ180576),省部重点实验室开放基金(WE2016014)详细信息作者简介:吕敬祥: ...
    本站小编 Free考研考试 2022-01-03
  • 基于三级邻居的复杂网络节点影响力度量方法
    杨书新,,梁文,朱凯丽江西理工大学信息工程学院赣州341000基金项目:国家自然科学基金(61662028),江西省教育厅科学技术研究项目基金(GJJ170518),江西省研究生创新专项资金项目(YC2018-S331)详细信息作者简介:杨书新:男,1979年生,副教授,研究方向为社会网络分析、生物 ...
    本站小编 Free考研考试 2022-01-03
  • 一种平衡准确性以及高效性的显著性目标检测深度卷积网络模型
    张文明,姚振飞,高雅昆,,李海滨燕山大学电气工程学院秦皇岛066004基金项目:河北省自然科学基金(F2015203212,F2019203195)详细信息作者简介:张文明:男,1979年生,副教授,研究方向为工业过程控制、机器视觉姚振飞:男,1992年生,硕士生,研究方向为机器视觉与图像处理高雅昆 ...
    本站小编 Free考研考试 2022-01-03
  • 基于改进循环生成式对抗网络的图像风格迁移
    张惊雷,,厚雅伟1.天津理工大学电气电子工程学院天津3003842.天津市复杂系统控制理论及应用重点实验室天津300384详细信息作者简介:张惊雷:男,1969,教授,博士,研究方向为模式识别、图像处理等厚雅伟:男,1995,硕士生,研究方向为图像处理、目标检测等通讯作者:张惊雷 zhangjing ...
    本站小编 Free考研考试 2022-01-03
  • H-CRAN网络下联合拥塞控制和资源分配的网络切片动态资源调度策略
    唐伦1,魏延南1,,,谭颀1,唐睿2,陈前斌11.重庆邮电大学通信与信息工程学院移动通信技术重点实验室重庆4000652.重庆大学光电工程学院重庆400044基金项目:国家自然科学基金(61571073),重庆市教委科学技术研究项目(KJZD-M201800601)详细信息作者简介:唐伦:男,197 ...
    本站小编 Free考研考试 2022-01-03