基于主题约束的篇章级文本生成方法
黄炎1,2, 孙海丽1, 徐科1,3, 余晓阳1, 王同洋1,?, 张新访1, 路松峰1,2 1. 华中科技大学计算机科学与技术学院, 武汉 4300742. 深圳华中科技大学研究院, 深圳 5180633. 中南民族大学计算机科学学院, 武汉 430074
收稿日期:
2019-05-22修回日期:
2019-09-23出版日期:
2020-01-20基金资助:
深圳市科技计划基础研究项目(JCYJ20180306124612893, JCYJ20170818160208570, JCYJ20170307160458368)资助Discourse-Level Text Generation Method Based on Topical Constraint
HUANG Yan1,2, SUN Haili1, XU Ke1,3, YU Xiaoyang1, WANG Tongyang1,?, ZHANG Xinfang1, LU Songfeng1,2 1. School of Computer Science and Technology, Huazhong University of Science and Technology, Wuhan 4300742. Shenzhen Huazhong University of Science and Technology Research Institute, Shenzhen 5180633. School of Computer Science, South-Central University for Nationalities, Wuhan 430074Received:
2019-05-22Revised:
2019-09-23Published:
2020-01-20
可视化
0复制本文网址
1. 探讨2016版国际胰瘘研究小组定义和分级系统对胰腺术后患者胰瘘分级的影响.PDF(500KB)
-->
摘要/Abstract
摘要: 针对计算机自动生成的文本缺乏主题思想这一问题, 提出一种基于主题约束的篇章级文本自动生成方法。该方法围绕用户输入的主题描述语句提取若干主题词; 然后对主题词进行扩展和主题聚类, 形成文章主题规划; 最后利用每个聚类中的关键词信息约束每个段落的文本生成。该模型从文本主题分布、注意力评分方法和主题覆盖生成3个方面对现有基于注意力机制的循环神经网络文本生成模型进行了改进。在3个真实数据集上分别与Char-RNN, SC-LSTM和MTA-LSTM基准模型进行对比, 并对3个方面的改进进行独立验证。实验结果表明, 所提方法在人工评判和BLEU自动评测上均优于基准模型, 生成的文本能更好地贴合主题。
引用本文
黄炎, 孙海丽, 徐科, 余晓阳, 王同洋, 张新访, 路松峰. 基于主题约束的篇章级文本生成方法[J]. 北京大学学报自然科学版, 2020, 56(1): 9-15.
HUANG Yan, SUN Haili, XU Ke, YU Xiaoyang, WANG Tongyang, ZHANG Xinfang, LU Songfeng. Discourse-Level Text Generation Method Based on Topical Constraint[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(1): 9-15.
PDF全文下载地址:
http://xbna.pku.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3427