基于历史梯度平均方差缩减的协同参数更新方法

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2022-01-03

谢涛^1,,,
张春炯²,
徐永健³
1.西南大学教育学部智慧教育研究院重庆 400715
2.同济大学电子与信息工程学院上海 201804
3.西南大学计算机与信息科学学院重庆 400715
基金项目:国家自然科学基金(61807027)

详细信息

作者简介:谢涛：男，1983年生，博士，副教授，研究方向为数据挖掘、自适应推荐系统、机器学习
张春炯：男，1990年生，博士生，研究方向为机器学习、无线传感网络、分布式鲁棒优化
徐永健：男，1997年生，硕士生，研究方向为图像检索、分布式系统

通讯作者:谢涛　xietao@swu.edu.cn

中图分类号:TP391

计量

文章访问数:900
HTML全文浏览量:326
PDF下载量:46
被引次数:0

出版历程

收稿日期:2020-01-16
修回日期:2020-06-20
网络出版日期:2020-07-23
刊出日期:2021-04-20

Collaborative Parameter Update Based on Average Variance Reduction of Historical Gradients

Tao XIE^1,,,
Chunjiong ZHANG²,
Yongjian XU³
1. Wisdom Education Institute of College of Education, Southwest University, Chongqing 400715, China
2. College of Electronics and Information Engineering, Tongji University, Shanghai 201804, China
3. College of Computers and Information Science, Southwest University, Chongqing 400715, China
Funds:The National Natural Science Foundation of China (61807027)

摘要
摘要:随机梯度下降算法(SGD)随机使用一个样本估计梯度，造成较大的方差，使机器学习模型收敛减慢且训练不稳定。该文提出一种基于方差缩减的分布式SGD，命名为DisSAGD。该方法采用历史梯度平均方差缩减来更新机器学习模型中的参数，不需要完全梯度计算或额外存储，而是通过使用异步通信协议来共享跨节点的参数。为了解决全局参数分发存在的“更新滞后”问题，该文采用具有加速因子的学习速率和自适应采样策略：一方面当参数偏离最优值时，增大加速因子，加快收敛速度；另一方面，当一个工作节点比其他工作节点快时，为下一次迭代采样更多样本，使工作节点有更多时间来计算局部梯度。实验表明：DisSAGD显著减少了循环迭代的等待时间，加速了算法的收敛，其收敛速度比对照方法更快，在分布式集群中可以获得近似线性的加速。
关键词:梯度下降/
机器学习/
分布式集群/
自适应采样/
方差缩减
Abstract:The Stochastic Gradient Descent (SGD) algorithm randomly picks up a sample to estimate gradients, creating big variance which reduces the convergence speed and makes the training unstable. A Distributed SGD based on Average variance reduction, called DisSAGD is proposed. The method uses the average variance reduction based on historical gradients to update parameters in the machine learning model, requiring little gradient calculation and additional storage, but using the asynchronous communication protocol to share parameters across nodes. In order to solve the “update staleness” problem of global parameter distribution, a learning rate with an acceleration factor and an adaptive sampling strategy are included: on the one hand, when the parameter deviates from the optimal value, the acceleration factor is increased to speed up the convergence; on the other hand, when one work node is faster than the other ones, more samples are sampled for the next iteration, so that the node has more time to calculate the local gradient. Experiments show that the DisSAGD reduces significantly the waiting time of loop iterations, accelerates the convergence of the algorithm being faster than that of the controlled methods, and obtains almost linear acceleration in distributed cluster environments.
Key words:Gradient descent/
Machine learning/
Distributed cluster/
Adaptive sampling/
Variance reduction

PDF全文下载地址:

https://jeit.ac.cn/article/exportPdf?id=1e03f394-9e6a-45f4-9311-d83d57d90754

相关话题/工作 西南大学 系统 计算 重庆

领限时大额优惠券,享本站正版考研考试资料!
优惠券领取后72小时内有效，10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材，产品类型包含电子书、题库、全套资料以及视频，无论您是考研复习、考证刷题，还是考前冲刺等，不同类型的产品可满足您学习上的不同需求。 ...
考试优惠券本站小编 Free壹佰分学习网 2022-09-19
基于大通讯时滞的二阶多智能体系统的一致性分析
晋守博,,魏章志,李耀红宿州学院数学与统计学院宿州234000基金项目:国家自然科学基金(61876073)；安徽省高校自然科学研究重点项目(KJ2019A0666,KJ2019A0672,KJ2018A0452)详细信息作者简介:晋守博：男，1980年生，硕士，副教授，研究方向为多智能体系统魏章志 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
多服务低速率数字光载射频系统中的新型自动增益控制算法设计
李文1,2,,,陈爱新1,王学锋2,陈远航2,刘晓滨2,姚宜东21.北京航空航天大学北京1001912.北京航天控制仪器研究所北京100094基金项目:中国航天科技集团公司科技研发项目(天科研[2017]893号)详细信息作者简介:李文：男，1988年生，博士生，研究方向为无线通信、数字信号处理陈爱 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
正交多载波降噪差分混沌键控通信系统
贺利芳,吴雪霜,,张天骐重庆邮电大学通信与信息工程学院重庆400065基金项目:国家自然科学基金(61771085,61371164)，重庆市教育委员会科研项目(KJ1600407,KJQN201900601)详细信息作者简介:贺利芳：女，1979年生，硕士，副教授，研究方向为混沌保密通信、微弱信号 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
旋转相控阵雷达区域威胁度计算及调度技术研究
李纪三,南京船舶雷达研究所南京210000详细信息作者简介:李纪三：男，1981年生，高级工程师，研究方向为相控阵雷达资源调度及数据处理通讯作者:李纪三　lijisan145@163.com中图分类号:TN953计量文章访问数:367HTML全文浏览量:191PDF下载量:40被引次数:0出版历程收 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于稀疏贝叶斯学习的空间紧邻信号DOA估计算法
王琦森1,2,余华3,2,1,李杰3,,,董超2,4,季飞3,1,陈焱琨2,41.华南理工大学土木与交通学院广州5106402.自然资源部海洋环境探测技术与应用重点实验室广州5103003.华南理工大学电子与信息学院广州5106404.国家海洋局南海调查技术中心广州510300基金项目:国家自然科学 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于扩展路径识别算法的水声OFDM系统低复杂度迭代稀疏信道估计
赵世铎,鄢社锋,1.中国科学院声学研究所北京1001902.中国科学院大学北京100049基金项目:国家自然科学基金(61725106)详细信息作者简介:赵世铎：男，1994年生，博士生，研究方向为OFDM水声通信技术鄢社锋：男，1978年生，教授，博士生导师，研究方向为阵列信号处理、水声通信等通讯 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
非理想条件下基于矢量水听器阵列的一种快速方位估计算法
王彪1,陈宇1,,,徐千驰1,高世杰1,张岑21.江苏科技大学镇江2120022.南京中海达海洋信息技术有限公司南京211800基金项目:国家自然科学基金(52071164)详细信息作者简介:王彪：男，1980年生，教授，研究方向为水声通信陈宇：男，1995年生，硕士生，研究方向为水下目标定位徐千驰 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
一种改进的水声正交频分复用稀疏信道时延估计算法
强夕竹,乔钢,周锋,1.哈尔滨工程大学水声技术重点实验室哈尔滨1500012.工业和信息化部海洋信息获取与安全工信部重点实验室(哈尔滨工程大学)哈尔滨1500013.哈尔滨工程大学水声工程学院哈尔滨150001基金项目:国家自然科学基金(61771152,11774074)详细信息作者简介:强夕竹： ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
脉冲噪声环境下基于相关熵的多径TDOA估计算法
李森,,王基福,林彬大连海事大学信息科学技术学院大连116026基金项目:国家自然科学基金(61971083)，中央高校基本科研业务费(3132019341)详细信息作者简介:李森：女，1973年生，教授，主要研究方向为非高斯信号处理、通信信号处理、统计信号处理王基福：男，1995年生，硕士生，研究 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
一个新多涡卷混沌系统的设计及在图像加密中的应用
摆玉龙,杨阳,,唐丽红西北师范大学物理与电子工程学院兰州730070基金项目:国家自然科学基金(41861047,41461078)，西北师范大学青年教师科研能力提升计划(NWNU-LKQN-17-6)详细信息作者简介:摆玉龙：男，1973年生，教授，博士生导师，研究方向为控制理论与应用杨阳：女，1 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03