删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

一种三参数统一化动量方法及其最优收敛速率

本站小编 Free考研考试/2022-01-01

丁成诚1,陶蔚2,陶卿1
1(中国人民解放军陆军炮兵防空兵学院信息工程系 合肥 230031);2(中国人民解放军陆军工程大学指挥控制工程学院 南京 210007) (dcc18851507462@163.com)
出版日期: 2020-08-01


基金资助:国家自然科学基金项目(61673394);安徽省自然科学基金项目(1908085MF193)

A Unified Momentum Method with Triple-Parameters and Its Optimal Convergence Rate

Ding Chengcheng1, Tao Wei2, Tao Qing1
1(Department of Information Engineering, Army Academy of Artillery and Air Defense of PLA, Hefei 230031);2(College of Command and Control Engineering, Army Engineering University of PLA, Nanjing 210007)
Online: 2020-08-01


Supported by:This work was supported by the National Natural Science Foundation of China (61673394) and the Natural Science Foundation of Anhui Province (1908085MF193).




摘要/Abstract


摘要: 动量方法由于能够改善SGD(stochastic gradient descent)的收敛性能而倍受机器学习研究者的关注.随着其在深度学习的成功应用,动量方法出现了众多形式的变体.特别地,产生了SUM(stochastic unified momentum)和QHM(quasi-hyperbolic momentum)两种统一框架.但是,即使是对非光滑凸优化问题,其最优平均收敛性的获得仍然存在着固定迭代步数和无约束等不合理限制.为此,提出了一种更一般的含三参数的统一化动量方法TPUM(triple-parameters unified momentum),能够同时包含SUM和QHM;其次,针对约束的非光滑凸优化问题,在采取时变步长的条件下,证明了所提出的TPUM具有最优的平均收敛速率,并将其推广到随机情况,从而保证了添加动量不会影响标准梯度下降法的收敛性能以及动量方法对机器学习问题的可应用性.典型的L1范数约束hinge损失函数优化问题实验验证了理论分析的正确性.






[1]吴宗友, 白昆龙, 杨林蕊, 王仪琦, 田英杰. 电子病历文本挖掘研究综述[J]. 计算机研究与发展, 2021, 58(3): 513-527.
[2]陈晋音, 陈奕芃, 陈一鸣, 郑海斌, 纪守领, 时杰, 程瑶. 面向深度学习的公平性研究综述[J]. 计算机研究与发展, 2021, 58(2): 264-280.
[3]于畅, 王雅文, 林欢, 宫云战. 基于故障检测上下文的等价变异体识别算法[J]. 计算机研究与发展, 2021, 58(1): 83-97.
[4]李双峰. TensorFlow Lite:端侧机器学习框架[J]. 计算机研究与发展, 2020, 57(9): 1839-1853.
[5]陈珂锐, 孟小峰. 机器学习的可解释性[J]. 计算机研究与发展, 2020, 57(9): 1971-1986.
[6]贺一笑, 庞明, 姜远. 蒙德里安深度森林[J]. 计算机研究与发展, 2020, 57(8): 1594-1604.
[7]李冬梅, 张扬, 李东远, 林丹琼. 实体关系抽取方法研究综述[J]. 计算机研究与发展, 2020, 57(7): 1424-1448.
[8]陶涛, 孙玉娥, 陈冬梅, 杨文建, 黄河, 罗永龙. 一种基于智能手机传感器数据的地图轮廓生成方法[J]. 计算机研究与发展, 2020, 57(7): 1490-1507.
[9]郭羽含, 张宇, 沈学利, 于俊宇. 即时车辆共乘问题的多策略解空间图搜索算法[J]. 计算机研究与发展, 2020, 57(6): 1269-1283.
[10]蓝天, 彭川, 李森, 叶文政, 李萌, 惠国强, 吕忆蓝, 钱宇欣, 刘峤. 单声道语音降噪与去混响研究综述[J]. 计算机研究与发展, 2020, 57(5): 928-953.
[11]刘辰屹, 徐明伟, 耿男, 张翔. 基于机器学习的智能路由算法综述[J]. 计算机研究与发展, 2020, 57(4): 671-687.
[12]周文, 张世琨, 丁勇, 陈曦. 面向低维工控网数据集的对抗样本攻击分析[J]. 计算机研究与发展, 2020, 57(4): 736-745.
[13]王艳, 李念爽, 王希龄, 钟凤艳. 编码技术改进大规模分布式机器学习性能综述[J]. 计算机研究与发展, 2020, 57(3): 542-561.
[14]刘俊旭, 孟小峰. 机器学习的隐私保护研究综述[J]. 计算机研究与发展, 2020, 57(2): 346-362.
[15]程光, 钱德鑫, 郭建伟, 史海滨, 吴桦, 赵玉宇. 基于散度的网络流概念漂移分类方法[J]. 计算机研究与发展, 2020, 57(12): 2673-2682.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4227
相关话题/计算机 优化 数据 陆军工程大学 车辆

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于随机投影的高维数据流聚类
    朱颖雯1,2,3,陈松灿1,21(南京航空航天大学计算机科学与技术学院南京211106);2(模式分析与机器智能工业和信息化部重点实验室(南京航空航天大学)南京211106);3(三江学院计算机科学与工程学院南京210012)(yingwen.zhu@nuaa.edu.cn)出版日期:2020-08 ...
    本站小编 Free考研考试 2022-01-01
  • 一种基于智能手机传感器数据的地图轮廓生成方法
    陶涛1,孙玉娥2,5,陈冬梅1,杨文建1,黄河1,3,罗永龙4,51(苏州大学计算机科学与技术学院江苏苏州215006);2(苏州大学轨道交通学院江苏苏州215131);3(中国科学技术大学苏州研究院江苏苏州215123);4(安徽师范大学计算机与信息学院安徽芜湖241002);5(网络与信息安全安 ...
    本站小编 Free考研考试 2022-01-01
  • 计算机体系结构前沿技术2020专题前言
    刘志勇1,窦勇21(中国科学院计算技术研究所北京100190);2(国防科技大学长沙410073)出版日期:2020-06-01Online:2020-06-01摘要/Abstract摘要:我们高兴地向读者推出本刊“计算机体系结构前沿技术”专题!本专题收录的6篇文章既包含不同技术领域和方向的综述,也 ...
    本站小编 Free考研考试 2022-01-01
  • 面向飞腾多核处理器的Winograd快速卷积算法优化
    王庆林,李东升,梅松竹,赖志权,窦勇(国防科技大学并行与分布处理国防科技重点实验室长沙410073)(国防科技大学计算机学院长沙410073)(wangqinglin@nudt.edu.cn)出版日期:2020-06-01基金资助:“核高基”国家科技重大专项基金项目(2018ZX01028101)O ...
    本站小编 Free考研考试 2022-01-01
  • 一种基于强化学习的混合缓存能耗优化与评价
    范浩1,2,徐光平1,2,薛彦兵1,2,高赞1,2,张桦31(天津理工大学计算机科学与工程学院天津300384);2(智能计算及软件新技术天津市重点实验室(天津理工大学)天津300384);3(天津中德应用技术大学天津300350)(fan-h@outlook.com)出版日期:2020-06-01 ...
    本站小编 Free考研考试 2022-01-01
  • 基于Spark的大数据访存行为跨层分析工具
    许丹亚1,王晶1,2,王利3,张伟功2,31(首都师范大学信息工程学院北京100048);2(高可靠嵌入式技术北京市工程研究中心(首都师范大学)北京100048);3(北京成像理论与技术高精尖创新中心(首都师范大学)北京100048)(xudanya@cnu.edu.cn)出版日期:2020-06- ...
    本站小编 Free考研考试 2022-01-01
  • 面向高通量计算机的图算法优化技术
    张承龙1,2,曹华伟1,王国波1,2,郝沁汾1,张洋1,叶笑春1,范东睿1,21(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190);2(中国科学院大学计算机与控制学院北京100049)(caohuawei@ict.ac.cn)出版日期:2020-06-01基金资助:国家重点 ...
    本站小编 Free考研考试 2022-01-01
  • 通用图形处理器缓存子系统性能优化方法综述
    张军1,2,谢竟成2,沈凡凡5,谭海3,汪吕蒙4,何炎祥41(东华理工大学江西省放射性地学大数据技术工程实验室南昌330013);2(东华理工大学信息工程学院南昌330013);3(东华理工大学创新创业学院南昌330013);4(武汉大学计算机学院武汉430072);5(南京审计大学南京211815 ...
    本站小编 Free考研考试 2022-01-01
  • 基于多视角RGB-D图像帧数据融合的室内场景理解
    李祥攀1,张彪1,孙凤池2,刘杰31(南开大学计算机学院天津300750);2(南开大学软件学院天津300750);3(南开大学人工智能学院天津300750)(xiangpan.li@qq.com)出版日期:2020-06-01基金资助:国家自然科学基金项目(61873327)IndoorScene ...
    本站小编 Free考研考试 2022-01-01
  • 即时车辆共乘问题的多策略解空间图搜索算法
    郭羽含,张宇,沈学利,于俊宇(辽宁工程技术大学软件学院辽宁葫芦岛125100)(guoyuhan@lntu.edu.cn)出版日期:2020-06-01基金资助:国家自然科学基金项目(61404069);辽宁省自然科学基金项目(2019-ZD-0048);辽宁省教育厅基础研究项目(LJ2019JL0 ...
    本站小编 Free考研考试 2022-01-01