删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于图片问答的静态重启随机梯度下降算法

本站小编 Free考研考试/2022-01-01

李胜东1,2,吕学强3
1(中国人民大学信息学院 北京 100872); 2(廊坊燕京职业技术学院计算机工程系 河北廊坊 065200); 3(网络文化与数字传播北京市重点实验室(北京信息科技大学) 北京 100101) (lsd@ruc.edu.cn)
出版日期: 2019-05-01


基金资助:国家自然科学基金项目(61671070);国家语委十三五科研规划2017年度重点项目(ZDI135-53);网络文化与数字传播北京市重点实验室开放课题(ICDD201505)

Static Restart Stochastic Gradient Descent Algorithm Based on Image Question Answering

Li Shengdong1,2, Lü Xueqiang3
1(School of Information, Renmin University of China, Beijing 100872); 2(Department of Computer Engineering, Langfang Yanjing Vocational Technical College, Langfang, Hebei 065200); 3(Beijing Key Laboratory of Internet Culture and Digital Dissemination Research(Beijing Information Science and Technology University), Beijing 100101)
Online: 2019-05-01







摘要/Abstract


摘要: 图片问答是计算机视觉与自然语言处理交叉的多模态学习任务.为了解决该任务,研究人员提出堆叠注意力网络(stacked attention networks, SANs).研究发现该模型易陷入不好的局部最优解,引发较高的问答错误率.为了解决该问题,提出基于图片问答的静态重启随机梯度下降算法.实验结果和分析表明:它的准确率比基准算法提高0.29%,但其收敛速度慢于基准算法.为了验证改善性能的显著性,对实验结果进行统计假设检验.T检验结果证明它的改善性能是极其显著的.为了验证它在同类算法中的有效性,将该算法和当前最好的一阶优化算法进行有效性实验,实验结果和分析证明它更有效.为了验证它的泛化性能和推广价值,在经典的Cifar-10数据集上进行图像识别实验.实验结果和T检验结果证明:它具有良好的泛化性能和较好的推广价值.






[1]丁成诚, 陶蔚, 陶卿. 一种三参数统一化动量方法及其最优收敛速率[J]. 计算机研究与发展, 2020, 57(8): 1571-1580.
[2]程禹嘉,陶蔚,刘宇翔,陶卿. Heavy-Ball型动量方法的最优个体收敛速率[J]. 计算机研究与发展, 2019, 56(8): 1686-1694.
[3]纪泽宇,张兴军,付哲,高柏松,李靖波. 分布式深度学习框架下基于性能感知的DBS-SGD算法[J]. 计算机研究与发展, 2019, 56(11): 2396-2409.
[4]贺敏,杜攀,张瑾,刘悦,程学旗. 基于动量模型的微博突发话题检测方法[J]. 计算机研究与发展, 2015, 52(5): 1022-1028.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3934
相关话题/实验 计算机 网络 检验 传播

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 纠删码存储系统中基于网络计算的高效故障重建方法
    唐英杰,王芳,谢燕文(武汉光电国家研究中心(华中科技大学)武汉430074)(信息存储系统教育部重点实验室(华中科技大学)武汉430074)(深圳华中科技大学研究院广东深圳518000)(tangyingjie@mail.hust.edu.cn)出版日期:2019-04-01基金资助:国家自然科学基 ...
    本站小编 Free考研考试 2022-01-01
  • 基于带权词格的循环神经网络句子语义表示建模
    张祥文1,2,陆紫耀1,杨静1,林倩1,卢宇1,王鸿吉1,苏劲松1,21(厦门大学福建厦门361000);2(江苏省计算机信息处理技术重点实验室(苏州大学)江苏苏州215006)(xwzhang@stu.xmu.edu.cn)出版日期:2019-04-01基金资助:国家自然科学基金项目(615201 ...
    本站小编 Free考研考试 2022-01-01
  • 基于网络节点聚类的目标IP城市级定位方法
    李明月1,2,罗向阳1,2,柴理想1,2,袁福祥1,2,甘勇31(中国人民解放军战略支援部队信息工程大学郑州450001);2(数学工程与先进计算国家重点实验室(中国人民解放军战略支援部队信息工程大学)郑州450001);3(郑州轻工业大学计算机与通信工程学院郑州450001)(lmypretty@ ...
    本站小编 Free考研考试 2022-01-01
  • 硬件加速神经网络综述
    陈桂林,马胜,郭阳(国防科技大学计算机学院长沙410073)(cglnudt@163.com)出版日期:2019-02-01基金资助:国家自然科学基金项目(61672526);国防科技大学科研计划项目(ZK17-03-06)SurveyonAcceleratingNeuralNetworkwithH ...
    本站小编 Free考研考试 2022-01-01
  • 基于多目标演化聚类的大规模动态网络社区检测
    李赫,印莹,李源,赵宇海,王国仁(东北大学计算机科学与工程学院沈阳110819)(15040107713@163.com)出版日期:2019-02-01基金资助:国家自然科学基金项目(61772124,61332014);中央高校基本科研业务费专项资金(N150404008,N150402002)L ...
    本站小编 Free考研考试 2022-01-01
  • 移动蜂窝网络流量的时延特征识别方法研究
    魏松杰,吴超,罗娜,张功萱(南京理工大学计算机科学与工程学院南京210094)(swei@njust.edu.cn)出版日期:2019-02-01基金资助:国家自然科学基金项目(61472189);赛尔网络下一代互联网技术创新项目(NGII20160105,NGII20160601);空中交通管理系 ...
    本站小编 Free考研考试 2022-01-01
  • 主编寄语--纪念《计算机研究与发展》创刊六十周年
    徐志伟(中国科学院计算技术研究所北京100190)出版日期:2019-01-01Online:2019-01-01摘要/Abstract摘要:时光荏苒,《计算机研究与发展》已经走过六十年,其前身为《电子计算机动态》,创刊于1958年12月,是我国第一个计算机刊物。当时我国的计算机事业刚刚起步,《电子 ...
    本站小编 Free考研考试 2022-01-01
  • 祝贺《计算机研究与发展》创刊六十周年
    陈熙霖(中国科学院计算技术研究所北京100190)出版日期:2019-01-01Online:2019-01-01摘要/Abstract摘要:今年是改革开放四十周年,也是《计算机研究与发展》创刊六十周年。《计算机研究与发展》见证了中国计算机事业从无到有、从小到大的全过程。作为国内最早的,甚至在很长一 ...
    本站小编 Free考研考试 2022-01-01
  • 和《计算机研究与发展》一起成长
    陆汝钤(中国科学院数学与系统科学研究院)出版日期:2019-01-01Online:2019-01-01摘要/Abstract摘要:每年金秋总有两个节日紧随一起:中秋节和国庆节(按时间先后)。今年可不寻常,徐主编告诉我《计算机研究与发展》(以下简称《研发》)创刊60周年了。这是我国的第一个计算机刊物 ...
    本站小编 Free考研考试 2022-01-01
  • 基于深度神经网络的图像碎片化信息问答算法
    王一蕾,卓一帆,吴英杰,陈铭钦(福州大学数学与计算机科学学院福州350108)(yilei@fzu.edu.cn)出版日期:2018-12-01基金资助:福建省自然科学基金项目(2018J01779)QuestionAnsweringAlgorithmonImageFragmentationInfo ...
    本站小编 Free考研考试 2022-01-01