删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

图像描述生成研究进展

本站小编 Free考研考试/2022-01-01

李志欣1,魏海洋1,张灿龙1,马慧芳2,史忠植3
1(广西多源信息挖掘与安全重点实验室(广西师范大学) 广西桂林 541004);2(西北师范大学计算机科学与工程学院 兰州 730070);3(中国科学院智能信息处理重点实验室(中国科学院计算技术研究所) 北京 100190) (lizx@gxnu.edu.cn)
出版日期: 2021-09-01


基金资助:国家自然科学基金项目(61966004,61663004,61866004,61762078);广西自然科学基金项目(2019GXNSFDA245018,2018GXNSFDA281009,2017GXNSFAA198365)

Research Progress on Image Captioning

Li Zhixin1, Wei Haiyang1, Zhang Canlong1, Ma Huifang2, Shi Zhongzhi3
1(Guangxi Key Laboratory of Multi-Source Information Mining and Security (Guangxi Normal University), Guilin, Guangxi 541004);2(College of Computer Science and Engineering, Northwest Normal University, Lanzhou 730070);3(Key Laboratory of Intelligent Information Processing (Institute of Computing Technology, Chinese Academy of Sciences), Chinese Academy of Sciences, Beijing 100190)
Online: 2021-09-01


Supported by:This work was supported by the National Natural Science Foundation of China (61966004, 61663004, 61866004, 61762078) and the Guangxi Natural Science Foundation (2019GXNSFDA245018, 2018GXNSFDA281009, 2017GXNSFAA198365).




摘要/Abstract


摘要: 图像描述生成结合了计算机视觉和自然语言处理2个研究领域,不仅要求完备的图像语义理解,还要求复杂的自然语言表达,是进一步研究符合人类感知的视觉智能的关键任务.对图像描述生成的研究进展做了回顾.首先,归纳分析了当前基于深度学习的图像描述生成方法涉及的5个关键技术,包括整体架构、学习策略、特征映射、语言模型和注意机制.然后,按照发展进程将现有的图像描述生成方法分为四大类,即基于模板的方法、基于检索的方法、基于编码器-解码器架构的方法和基于复合架构的方法,并阐述了各类方法的基本概念、代表性方法和研究现状,重点讨论了基于编码器-解码器架构的各种方法及其创新思路,如多模态空间、视觉空间、语义空间、注意机制、模型优化等.接着,从实验的角度给出图像描述生成的常用数据集和评估措施,并在2个基准数据集上比较了一些典型方法的性能.最后,以提升图像描述的准确性、完整性、新颖性、多样性为依据,展示了图像描述生成的未来发展趋势.






[1]王磊, 熊于宁, 李云鹏, 刘媛媛. 一种基于增强图卷积神经网络的协同推荐模型[J]. 计算机研究与发展, 2021, 58(9): 1987-1996.
[2]吴欣欣, 欧焱, 李文明, 王达, 张浩, 范东睿. 基于粗粒度数据流架构的稀疏卷积神经网络加速[J]. 计算机研究与发展, 2021, 58(7): 1504-1517.
[3]刘雁孝, 吴萍, 孙钦东. 基于区域卷积神经网络的图像秘密共享方案[J]. 计算机研究与发展, 2021, 58(5): 1065-1074.
[4]李腾, 乔伟, 张嘉伟, 高怿旸, 王申奥, 沈玉龙, 马建峰. 隐私保护的基于图卷积神经网络的攻击溯源方法[J]. 计算机研究与发展, 2021, 58(5): 1006-1020.
[5]李若南, 李金宝. 一种无源被动室内区域定位方法的研究[J]. 计算机研究与发展, 2020, 57(7): 1381-1392.
[6]邢新颖, 冀俊忠, 姚垚. 基于自适应多任务卷积神经网络的脑网络分类方法[J]. 计算机研究与发展, 2020, 57(7): 1449-1459.
[7]于海涛, 杨小汕, 徐常胜. 基于多模态输入的对抗式视频生成方法[J]. 计算机研究与发展, 2020, 57(7): 1522-1530.
[8]卢海峰, 顾春华, 罗飞, 丁炜超, 杨婷, 郑帅. 基于深度强化学习的移动边缘计算任务卸载研究[J]. 计算机研究与发展, 2020, 57(7): 1539-1554.
[9]王庆林, 李东升, 梅松竹, 赖志权, 窦勇. 面向飞腾多核处理器的Winograd快速卷积算法优化[J]. 计算机研究与发展, 2020, 57(6): 1140-1151.
[10]刘烨, 黄金筱, 马于涛. 基于混合神经网络和注意力机制的软件缺陷自动分派方法[J]. 计算机研究与发展, 2020, 57(3): 461-473.
[11]杜鹏, 丁世飞. 基于混合词向量深度学习模型的DGA域名检测方法[J]. 计算机研究与发展, 2020, 57(2): 433-446.
[12]朱兆坤, 李金宝. 多特征信息融合LSTM-RNN检测OSA方法[J]. 计算机研究与发展, 2020, 57(12): 2547-2555.
[13]程艳, 尧磊波, 张光河, 唐天伟, 项国雄, 陈豪迈, 冯悦, 蔡壮. 基于注意力机制的多通道CNN和BiGRU的文本情感倾向性分析[J]. 计算机研究与发展, 2020, 57(12): 2583-2595.
[14]刘奇旭, 刘心宇, 罗成, 王君楠, 陈浪平, 刘嘉熹. 基于双向循环神经网络的安卓浏览器指纹识别方法[J]. 计算机研究与发展, 2020, 57(11): 2294-2311.
[15]贺周雨, 冯旭鹏, 刘利军, 黄青松. 面向大规模图像检索的深度强相关散列学习方法[J]. 计算机研究与发展, 2020, 57(11): 2375-2388.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4494
相关话题/计算机 图像 空间 信息 视觉

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于K阶互信息估计的位置感知网络表征学习
    储晓恺1,2,范鑫鑫2,毕经平21(中国科学院大学北京100049);2(中国科学院计算技术研究所北京100190)(chuxiaokai@ict.ac.cn)出版日期:2021-08-01基金资助:国家自然科学基金项目(62077044,61702470,62002343)Position-Awa ...
    本站小编 Free考研考试 2022-01-01
  • 基于融合多尺度标记信息的深度交互式图像分割
    丁宗元1,孙权森1,王涛1,王洪元21(南京理工大学计算机科学与技术学院南京210094);2(常州大学计算机与人工智能学院江苏常州213164)(dzyha2011@163.com)出版日期:2021-08-01基金资助:国家自然科学基金项目(61802188,61673220,61976028) ...
    本站小编 Free考研考试 2022-01-01
  • 网络信息生态系统中的虚假信息:检测、缓解与挑战
    Amrita,Bhattacharjee1,舒凯2,高旻3,刘欢11(亚利桑那州立大学计算机科学与工程系美国亚利桑那州坦佩85281);2(伊利诺伊理工大学计算机科学系美国伊利诺伊州芝加哥60616);3(重庆大学大数据与软件学院重庆400044)(abhatt43@asu.edu)出版日期:202 ...
    本站小编 Free考研考试 2022-01-01
  • 虚假信息检测专题前言
    出版日期:2021-07-01Online:2021-07-01摘要/Abstract摘要:虚假信息检测旨在综合应用自然语言处理、社交挖掘、跨模态分析等智能处理手段,发现并利用信息的内在特征、产生机理与传播规律,为以假新闻为代表的虚假、伪造信息的识别与干预提供理论和技术支持.《Science》在20 ...
    本站小编 Free考研考试 2022-01-01
  • 基于模体度的社交网络虚假信息传播机制研究
    徐铭达1,张子柯2,3,许小可11(大连民族大学信息与通信工程学院辽宁大连116600);2(浙江大学传媒与国际文化学院杭州310058);3(杭州师范大学阿里巴巴复杂科学研究中心杭州311121)(854655253@qq.com)出版日期:2021-07-01基金资助:国家自然科学基金项目(61 ...
    本站小编 Free考研考试 2022-01-01
  • 融合源信息和门控图神经网络的谣言检测研究
    杨延杰,王莉,王宇航(太原理工大学大数据学院山西晋中030600)(yangyanjie1073@link.tyut.edu.cn)出版日期:2021-07-01基金资助:国家自然科学基金项目(61872260)RumorDetectionBasedonSourceInformationandGat ...
    本站小编 Free考研考试 2022-01-01
  • 社交网络信息传播预测与特定信息抑制
    曹玖新1,高庆清1,夏蓉清2,刘伟佳1,朱雪林1,刘波21(东南大学网络空间安全学院南京211189);2(东南大学计算机科学与工程学院南京211189)(jx.cao@seu.edu.cn)出版日期:2021-07-01基金资助:国家自然科学基金项目(61772133,61972087);国家社会 ...
    本站小编 Free考研考试 2022-01-01
  • 计算机芯片关键技术前沿与进展专题前言
    出版日期:2021-06-01Online:2021-06-01摘要/Abstract摘要:“计算机体系结构前沿技术2021”专题———“计算机芯片关键技术前沿与进展”,集中介绍计算机芯片设计、测试、验证方面的新理论、新技术,以及新型部件和新型芯片系统.本专题包括关于处理器芯片敏捷设计和类脑计算的2 ...
    本站小编 Free考研考试 2022-01-01
  • 基于预测误差自适应编码的图像加密可逆数据隐藏
    杨尧林1,和红杰1,陈帆1,原长琦21(西南交通大学信息科学与技术学院成都611756);2(北京电子技术应用研究所北京100091)(ylyangwr@foxmail.com)出版日期:2021-06-01基金资助:国家自然科学基金项目(61872303,U1936113);四川省科技厅科技创新人 ...
    本站小编 Free考研考试 2022-01-01
  • 基于区域卷积神经网络的图像秘密共享方案
    刘雁孝1,2,吴萍,孙钦东11(西安理工大学计算机科学与工程学院西安710048);2(广西可信软件重点实验室(桂林电子科技大学)广西桂林541004)(liuyanxiao@xaut.edu.cn)出版日期:2021-05-01基金资助:陕西省自然科学基础研究计划项目(2019JQ-736);陕西 ...
    本站小编 Free考研考试 2022-01-01