通过检测语义分歧识别无答案问题
刘咏彬1, 王小捷1, 袁彩霞1, 易炼21. 北京邮电大学 计算机院, 北京 100876;
2. 阿里巴巴(北京)软件服务有限公司, 北京 100022
收稿日期:
2019-09-28出版日期:
2019-12-28发布日期:
2019-11-15作者简介:
刘咏彬(1977-),女,讲师,E-mail:liuyb@bupt.edu.cn.基金资助:
中央高校基本科研业务费专项资金项目(500419302)Unanswerable Questions Recognition by Semantic Discrepancy Detection
LIU Yong-bin1, WANG Xiao-jie1, YUAN Cai-xia1, YI Lian21. School of Telecommunication Engineering, Beijing University of Posts and Telecommunications, Beijing 100876, China;
2. Alibaba(Beijing) Software Services Company Limited, Beijing 100022, China
Received:
2019-09-28Online:
2019-12-28Published:
2019-11-15摘要/Abstract
摘要: 机器阅读理解中存在无法仅从给定文档中获取问题答案的特殊情况,为此,基于语义冲突检测的机器阅读理解网络(SCDNet)提出应通过检测问题与文档内容之间的语义分歧来识别这种情况.经分析发现,文档无法为问题提供答案的根本原因主要分为两类:一是文档中不包含问题所需的语义信息;二是二者包含的语义成分之间存在分歧.据此推断,可以通过检测文档语义信息是否全面涵盖问题所需的信息来识别问题是否可由文档信息给出回答.此外,通过在损失函数中加入答案文本长度惩罚项,网络优化目标函数更接近评测指标,系统性能得到提升.网络模型使用联合训练模型建模无答案的问题识别与答案抽取2个子任务,并使用端到端的方式训练.实验结果证明,其对无答案问题类别预测的正确率超过了性能先进的基线模型SAN2.0,在SQuAD2.0数据集上取得了72.43的F1值和76.96的无答案问题识别正确率.
中图分类号:
TN929.53
引用本文
刘咏彬, 王小捷, 袁彩霞, 易炼. 通过检测语义分歧识别无答案问题[J]. 北京邮电大学学报, 2019, 42(6): 126-133,141.
LIU Yong-bin, WANG Xiao-jie, YUAN Cai-xia, YI Lian. Unanswerable Questions Recognition by Semantic Discrepancy Detection[J]. JOURNAL OF BEIJING UNIVERSITY OF POSTS AND TELECOM, 2019, 42(6): 126-133,141.
PDF全文下载地址:
https://journal.bupt.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4600