删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

编码技术改进大规模分布式机器学习性能综述

本站小编 Free考研考试/2022-01-01

王艳,李念爽,王希龄,钟凤艳
(华东交通大学软件学院 南昌 330013) (wangyann@189.cn)
出版日期: 2020-03-01


基金资助:国家自然科学基金项目(61402172);江西省自然科学基金项目(20192BAB217006)

Coding-Based Performance Improvement of Distributed Machine Learning in Large-Scale Clusters

Wang Yan, Li Nianshuang, Wang Xiling, Zhong Fengyan
(School of Software, East China Jiaotong University, Nanchang 330013)
Online: 2020-03-01


Supported by:This work was supported by the National Natural Science Foundation of China (61402172) and the Natural Science Foundation of Jiangxi Province of China (20192BAB217006).




摘要/Abstract


摘要: 由于分布式计算系统能为大数据分析提供大规模的计算能力,近年来受到了人们的广泛关注.在分布式计算系统中,存在某些计算节点由于各种因素的影响,计算速度会以某种随机的方式变慢,从而使运行在集群上的机器学习算法执行时间增加,这种节点叫作掉队节点(straggler).介绍了基于编码技术解决这些问题和改进大规模机器学习集群性能的研究进展.首先介绍编码技术和大规模机器学习集群的相关背景;其次将相关研究按照应用场景分成了应用于矩阵乘法、梯度计算、数据洗牌和一些其他应用,并分别进行了介绍分析;最后总结讨论了相关编码技术存在的困难并对未来的研究趋势进行了展望.






[1]吴宗友, 白昆龙, 杨林蕊, 王仪琦, 田英杰. 电子病历文本挖掘研究综述[J]. 计算机研究与发展, 2021, 58(3): 513-527.
[2]陈晋音, 陈奕芃, 陈一鸣, 郑海斌, 纪守领, 时杰, 程瑶. 面向深度学习的公平性研究综述[J]. 计算机研究与发展, 2021, 58(2): 264-280.
[3]于畅, 王雅文, 林欢, 宫云战. 基于故障检测上下文的等价变异体识别算法[J]. 计算机研究与发展, 2021, 58(1): 83-97.
[4]朱泓睿, 元国军, 姚成吉, 谭光明, 王展, 户忠哲, 张晓扬, 安学军. 分布式深度学习训练网络综述[J]. 计算机研究与发展, 2021, 58(1): 98-115.
[5]李双峰. TensorFlow Lite:端侧机器学习框架[J]. 计算机研究与发展, 2020, 57(9): 1839-1853.
[6]陈珂锐, 孟小峰. 机器学习的可解释性[J]. 计算机研究与发展, 2020, 57(9): 1971-1986.
[7]丁成诚, 陶蔚, 陶卿. 一种三参数统一化动量方法及其最优收敛速率[J]. 计算机研究与发展, 2020, 57(8): 1571-1580.
[8]贺一笑, 庞明, 姜远. 蒙德里安深度森林[J]. 计算机研究与发展, 2020, 57(8): 1594-1604.
[9]李冬梅, 张扬, 李东远, 林丹琼. 实体关系抽取方法研究综述[J]. 计算机研究与发展, 2020, 57(7): 1424-1448.
[10]陶涛, 孙玉娥, 陈冬梅, 杨文建, 黄河, 罗永龙. 一种基于智能手机传感器数据的地图轮廓生成方法[J]. 计算机研究与发展, 2020, 57(7): 1490-1507.
[11]张军, 谢竟成, 沈凡凡, 谭海, 汪吕蒙, 何炎祥. 通用图形处理器缓存子系统性能优化方法综述[J]. 计算机研究与发展, 2020, 57(6): 1191-1207.
[12]蓝天, 彭川, 李森, 叶文政, 李萌, 惠国强, 吕忆蓝, 钱宇欣, 刘峤. 单声道语音降噪与去混响研究综述[J]. 计算机研究与发展, 2020, 57(5): 928-953.
[13]刘辰屹, 徐明伟, 耿男, 张翔. 基于机器学习的智能路由算法综述[J]. 计算机研究与发展, 2020, 57(4): 671-687.
[14]周文, 张世琨, 丁勇, 陈曦. 面向低维工控网数据集的对抗样本攻击分析[J]. 计算机研究与发展, 2020, 57(4): 736-745.
[15]刘俊旭, 孟小峰. 机器学习的隐私保护研究综述[J]. 计算机研究与发展, 2020, 57(2): 346-362.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4140
相关话题/计算机 计算 介绍 技术 数据

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于用户级融合I/O的Key-Value存储系统优化技术研究
    安仲奇1,张云尧1,2,邢晶1,霍志刚1,21(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190);2(中国科学院大学计算机与控制工程学院北京100049)(anzhongqi@ncic.ac.cn)出版日期:2020-03-01基金资助:国家重点研发计划项目(2018YFC ...
    本站小编 Free考研考试 2022-01-01
  • 一种基于边缘计算的传感云低耦合方法
    梁玉珠1,梅雅欣1,杨毅1,马樱2,贾维嘉3,王田11(华侨大学计算机科学与技术学院福建厦门361021);2(数据挖掘与智能推荐福建省高校重点实验室(厦门理工学院)福建厦门361024);3(智慧城市物联网国家重点实验室(澳门大学)澳门999078)(cs_yuzhuliang@163.com)出 ...
    本站小编 Free考研考试 2022-01-01
  • 2020大数据与智能存储系统前沿技术专题前言
    舒继武1,王意洁21(清华大学北京100084);2(国防科技大学长沙410073)出版日期:2020-02-01Online:2020-02-01摘要/Abstract摘要:近年来,随着国家和社会信息化发展的不断加速,对信息存储提出了越来越高的要求.一方面,大数据时代,数据存储的规模和处理需求越来 ...
    本站小编 Free考研考试 2022-01-01
  • 面向非易失内存写优化的重计算方法
    张铭,华宇,刘璐荣,胡蓉,李子怡(武汉光电国家研究中心(华中科技大学)武汉430074)(华中科技大学计算机学院武汉430074)(csmzhang@hust.edu.cn)出版日期:2020-02-01基金资助:国家自然科学基金项目(61772212)AWrite-OptimizedRe-comp ...
    本站小编 Free考研考试 2022-01-01
  • 一种持久性内存文件系统数据页的混合管理机制
    陈游旻1,朱博弘1,韩银俊2,屠要峰2,舒继武11(清华大学计算机科学与技术系北京100084);2(中兴通讯股份有限公司南京210012)(chenym16@mails.tsinghua.edu.cn)出版日期:2020-02-01基金资助:国家重点研发计划项目(2018YFB1003301);中 ...
    本站小编 Free考研考试 2022-01-01
  • 新型存储设备上重复数据删除指纹查找优化
    何柯文,张佳辰,刘晓光,王刚(南开大学计算机学院天津300350)(天津市网络与数据安全技术重点实验室(南开大学)天津300350)(hekw@nbjl.nankai.edu.cn)出版日期:2020-02-01基金资助:国家自然科学基金项目(U1833114,61872201,61702521,6 ...
    本站小编 Free考研考试 2022-01-01
  • 基于“采集—预测—迁移—反馈”机制的主动容错技术
    杨洪章1,杨雅辉1,屠要峰2,孙广宇3,吴中海11(北京大学软件与微电子学院北京102600);2(中兴通讯股份有限公司广东深圳518057);3(北京大学信息科学技术学院北京100871)(yanghongzhang@pku.edu.cn)出版日期:2020-02-01基金资助:国家重点研发计划项 ...
    本站小编 Free考研考试 2022-01-01
  • 基于生成矩阵变换的跨数据中心纠删码写入方法
    包涵1,2,王意洁1,2,许方亮21(并行与分布处理国家重点实验室(国防科技大学)长沙410073);2(国防科技大学计算机学院长沙410073)(hanb_nudt@foxmail.com)出版日期:2020-02-01基金资助:国家重点研发计划项目(2016YFB1000101);国家自然科学基 ...
    本站小编 Free考研考试 2022-01-01
  • 基于地理空间大数据的高效索引与检索算法
    赵慧慧1,2,赵凡2,3,陈仁海1,2,冯志勇1,21(天津大学智能与计算学部天津300350);2(天津大学深圳研究院广东深圳518000);3(天津大学国际工程师学院天津300350)(1442700849@qq.com)出版日期:2020-02-01基金资助:国家自然科学基金项目(617023 ...
    本站小编 Free考研考试 2022-01-01
  • 基于收益模型的Spark SQL数据重用机制
    申毅杰,曾丹,熊劲(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190)(中国科学院大学北京100049)(shenyijie@ict.ac.cn)出版日期:2020-02-01基金资助:国家重点研发计划项目(2016YFB1000202);国家自然科学基金项目(6137904 ...
    本站小编 Free考研考试 2022-01-01