分布式深度学习框架下基于性能感知的DBS-SGD算法

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2022-01-01

纪泽宇,张兴军,付哲,高柏松,李靖波

(西安交通大学计算机科学与技术学院西安 710049) (zeyu.ji@stu.xjtu.edu.cn)

出版日期: 2019-11-12

基金资助:国家重点研发计划项目(2016YFB0200902)

Performance-Awareness Based Dynamic Batch Size SGD for Distributed Deep Learning Framework

Ji Zeyu, Zhang Xingjun, Fu Zhe, Gao Bosong, Li Jingbo

(School of Computer Science and Technology, Xi’an Jiaotong University, Xi’an 710049)

Online: 2019-11-12

摘要/Abstract

摘要： 通过增加模型的深度以及训练数据的样本数量，深度神经网络模型能够在多个机器学习任务中获得更好的性能，然而这些必要的操作会使得深度神经网络模型训练的开销相应增大.因此为了更好地应对大量的训练开销，在分布式计算环境中对深度神经网络模型的训练过程进行加速成为了研发人员最常用的手段.随机梯度下降(stochastic gradient descent, SGD)算法是当前深度神经网络模型中最常见的训练算法之一，然而SGD在进行并行化的时候容易产生梯度过时问题，从而影响算法的整体收敛性.现有解决方案大部分针对的是各节点性能差别较小的高性能计算(high performance computing, HPC)环境，很少有研究考虑过各节点性能差别较大的集群环境.针对上述问题进行研究并提出了一种基于性能感知技术的动态batch size随机梯度下降算法(dynamic batch size SGD, DBS-SGD).该算法通过分析各节点的计算能力，对各节点的minibatch进行动态分配，从而保证了节点间每次迭代更新的时间基本一致，进而降低了节点的平均梯度过时值.提出的算法能够有效优化异步更新策略中存在的梯度过时问题.选用常用的图像分类基准Mnist和cifar10作为训练数据集，将该算法与异步随机梯度下降(asynchronous SGD, ASGD)算法、n-soft算法进行了对比.实验结果表明：在不损失加速比的情况下，Mnist数据集的loss函数值降低了60%，cifar数据集的准确率提升了约10%，loss函数值降低了10%，其性能高于ASGD算法和n-soft算法，接近同步策略下的收敛曲线.

参考文献

相关文章 4

[1]	姜桂圆张桂玲张大坤. SIFT特征分布式并行提取算法[J]. , 2012, 49(5): 1130-1141.
[2]	王鹏, 孟丹, 詹剑锋, 涂碧波,. 数据密集型计算编程模型研究进展[J]. , 2010, 47(11): 1993-2002.
[3]	王轶然, 陈莉, 冯晓兵, 张兆庆,. 全局部分重复计算划分[J]. , 2006, 43(12): 2158-2165.
[4]	张发存, 赵晓红, 王忠, 沈绪榜,. 面向算法的SIMD计算机数学模型及其应用研究[J]. , 2005, 42(4): 557-562.

PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4045

相关话题/数据 计算 环境 西安交通大学 实验

领限时大额优惠券,享本站正版考研考试资料!
优惠券领取后72小时内有效，10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材，产品类型包含电子书、题库、全套资料以及视频，无论您是考研复习、考证刷题，还是考前冲刺等，不同类型的产品可满足您学习上的不同需求。 ...
考试优惠券本站小编 Free壹佰分学习网 2022-09-19
机会移动社交网络中基于群组构造的数据分发机制
李婕1,洪韬1,王兴伟1,黄敏2,郭静11(东北大学计算机科学与工程学院沈阳110819);2(东北大学信息科学与工程学院沈阳110819)(lijie@mail.neu.edu.cn)出版日期:2019-11-12基金资助:国家自然科学基金项目(61502092，61872073)；辽宁省高校创新 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
云环境下支持可更新加密的分布式数据编码存储方案
严新成1,陈越1,巴阳1,贾洪勇2,朱彧11(战略支援部队信息工程大学郑州450001)；2(郑州大学软件与应用科技学院郑州450001)(imtodshine@163.com)出版日期:2019-10-16基金资助:国家自然科学基金项目(61702549)；河南省科技攻关计划基金项目(172102 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
基于数据纵向分布的隐私保护逻辑回归
宋蕾1,马春光2,段广晗1,袁琪31(哈尔滨工程大学计算机科学与技术学院哈尔滨150001)；2(山东科技大学计算机科学与工程学院山东青岛266590)；3(齐齐哈尔大学通信与电子工程学院黑龙江齐齐哈尔161006)(songl@hrbeu.edu.cn)出版日期:2019-10-16基金资助:国家 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
面向绿色数据中心的能耗有效查询优化技术
邢宝平1,吕梦圆1,金培权1,2,黄国锐3,岳丽华1,21(中国科学技术大学计算机科学与技术学院合肥230027);2(中国科学院电磁空间信息重点实验室合肥230027);3(中国人民解放军31002部队北京100081)(lmys@mail.ustc.edu.cn)出版日期:2019-09-10基 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
机器学习化数据库系统研究综述
孟小峰,马超红,杨晨(中国人民大学信息学院北京100872)(xfmeng@ruc.edu.cn)出版日期:2019-09-10基金资助:国家自然科学基金项目(61532016，61532010，91846204，91646203，61762082)；国家重点研发计划项目(2016YFB100060 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
基于生成式对抗网络的结构化数据表生成模型
宋珂慧1,张莹1,张江伟2,袁晓洁11(南开大学计算机学院天津300350);2(新加坡国立大学计算机学院新加坡117417)(songkehui@dbis.nankai.edu.cn)出版日期:2019-09-10基金资助:国家自然科学基金项目(61772289,U1836109)AGenerat ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
数据中心能耗模型及能效算法综述
王继业1,周碧玉2,张法3,石翔3,曾楠1,刘志勇31(国家电网公司北京100031);2(中国科学院信息工程研究所北京100089);3(中国科学院计算技术研究所北京100190)(jiyewang@sgcc.com.cn)出版日期:2019-08-01基金资助:国家重点研发计划项目(2017YF ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
基于边缘计算的可信执行环境研究
宁振宇,张锋巍,施巍松(韦恩州立大学计算机科学系美国密歇根州底特律48202)(zhenyu.ning@wayne.edu)出版日期:2019-07-01AStudyofUsingTEEonEdgeComputingNingZhenyu,ZhangFengwei,ShiWeisong(Departm ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
基于动态策略学习的关键内存数据访问监控
冯馨玥1,2,杨秋松1,石琳1,王青1,2,3,李明树11(中国科学院软件研究所基础软件国家工程研究中心北京100190);2(中国科学院大学北京100049);3(计算机科学国家重点实验室(中国科学院软件研究所)北京100190)(xinyue@nfs.iscas.ac.cn)出版日期:2019- ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01
一种最大化内存共享与最小化运行时环境的超轻量级容器
张礼庆1,2,郭栋1,2,吴绍岭1,2,崔海波3,4,王伟1,2,41(同济大学计算机科学与技术系上海200092);2(嵌入式系统与服务计算教育部重点实验室(同济大学)上海200092);3(湖北大学计算机与信息工程学院武汉430062);4(湖北省教育信息化工程技术研究中心(湖北大学)武汉430 ...
中科院计算技术研究所本站小编 Free考研考试 2022-01-01