使用有序词语移动距离特征进行中文文本蕴含识别
谭咏梅, 王敏达, 牛少彰北京邮电大学 计算机学院, 北京 100876
收稿日期:
2016-09-07出版日期:
2017-10-28发布日期:
2017-11-21作者简介:
谭咏梅(1975-),女,副教授,硕士生导师,E-mail:ymtan@bupt.edu.cn.基金资助:
国家自然科学基金项目(U1536121,61370195)Chinese Textual Entailment Recognition Via Ordered Word Mover Distance
TAN Yong-mei, WANG Min-da, NIU Shao-zhangSchool of Computer Science, Beijing University of Posts and Telecommunications, Beijing 100876, China
Received:
2016-09-07Online:
2017-10-28Published:
2017-11-21摘要/Abstract
摘要: 提出了一种基于有序词语移动距离的中文文本蕴含识别方法,该方法基于word2vec词向量计算有序词语移动距离特征,进而利用有序词语移动距离特征和传统语言学特征通过支持向量机生成分类模型,然后使用分类模型进行蕴含识别,最终得到蕴含结果.该方法在RITE-VAL评测任务的CS数据上的MacroF1为0.629,超过RITE-VAL的最优评测结果(BUPTTeam,0.615).实验结果表明,该方法可以提升中文文本蕴含识别系统的性能.
中图分类号:
TN911.22
引用本文
谭咏梅, 王敏达, 牛少彰. 使用有序词语移动距离特征进行中文文本蕴含识别[J]. 北京邮电大学学报, 2017, 40(5): 123-128.
TAN Yong-mei, WANG Min-da, NIU Shao-zhang. Chinese Textual Entailment Recognition Via Ordered Word Mover Distance[J]. JOURNAL OF BEIJING UNIVERSITY OF POSTS AND TELECOM, 2017, 40(5): 123-128.
PDF全文下载地址:
https://journal.bupt.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3156