删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

标签增强的中文看图造句

本站小编 Free考研/2020-04-17

文献详情
标签增强的中文看图造句
外文标题:Improving Chinese Image Captioning by Tag Prediction
文献类型:期刊
期刊名称:计算机学报
年:2019
卷:42
期:1
页码:136-148
ISSN:0254-4164
关键词:图像句子生成;中文模型;中文标签预测;深度学习;机器翻译
所属部门:信息学院;数据工程与知识工程教育部重点实验室
链接地址:http://d.oldg.wanfangdata.com.cn/Periodical_jsjxb201901010.aspx
摘要:图像数据飞速增多,而计算机与人对图像数据的理解间存在语义鸿沟.如何有效地理解、管理和组织图像数据是学术界和工业界面临的一个重大挑战.利用计算机自动生成能够描述图像内容的自然语言描述有助于弥合语义鸿沟,从而提升对图像数据的理解.现有工作致力于英文句子生成.与之不同的是,该文实现了一个面向中文的看图造句系统.通过大规模机器翻译克服了中文训练数据缺乏的问题,同时提出了结合中文标签自动预测,对深度模型预测句子进行重排序的增强方法,改善句子生成质量.在两个中文图像句子数据集Flickr8k-cn和Flickr30k-cn上的实验表明,该文提出的标签增强方法可以有效改善现有两种看图造句模型(Google模型和Attention模型)所生成句子的质量.标签增强使得Google模型在Flickr8k-cn测试集上的CIDEr指标从0.474提高到0.503,Flickr30k-cn测试集上的CIDEr指标从0.325提高到0.356.通过标签增强,Attention模型在这两个数据集上的CIDEr分别从0.510提高到0.536,从0.392提高到到0.411.
DOI:10.11897/SP.J.1016.2019.00136
百度学术:标签增强的中文看图造句
语言:中文
人气指数:4
浏览次数:4
基金:国家自然科学基金项目"面向中文的看图造句若干关键问题研究"; "基于社会网络计算的企业舆情管理新理论新方法"
作者其他论文



一种具备裸眼3D显示装置的家用智能机器人.杨刚, 周文淇,.2019.
超低信噪比冷冻电镜图像的深度学习去噪算法—DWT-CAE.刘小晴, 左清曈, 刘青, et al. .小型微型计算机系统. 2019, 40(6), 1340-1345.
基于软近邻投票的图像标签相关性计算.李锡荣;许洁萍;薛盛博,等.计算机学报.2014,37(6),1365-1371.
我国投资银行在当前企业并购中的作用与业务定位.王晓旭.卷宗.2014,229-229,230.
一种基于眼部识别的信息采集系统及其应用.杨刚;吴少辉.2013.

相关话题/中文 图像