特定领域问答系统中基于语义检索的非事实型问题研究
仇瑜1,2,3, 程力1,2,3,†, Daniyal Alghazzawi4 1. 中国科学院新疆理化技术研究所, 乌鲁木齐 8300112. 中国科学院大学, 北京 100049
3. 新疆民族语音语言信息处理实验室, 乌鲁木齐 830011
4. 阿卜杜勒阿齐兹国王大学计算机和信息技术学院, 吉达 21493
收稿日期:
2018-06-29修回日期:
2018-08-10出版日期:
2019-01-20基金资助:
中国科学院“西部之光”人才培养计划基金(2017-XBZG-BR-001)、国家“****”项目(Y32H251201)和中国科学院新疆理化技术研究所所长基金(2015RC007)资助Semantic Search on Non-Factoid Questions for Domain-Specific Question Answering Systems
QIU Yu1,2,3, CHENG Li1,2,3,†, Daniyal Alghazzawi4 1. Xinjiang Technical Institute of Physics & Chemistry, Chinese Academy of Sciences, Urumqi 8300112. University of Chinese Academy of Sciences, Beijing 100049
3. Xinjiang Laboratory of Minority Speech and Language Information Processing, Urumqi 830011
4. Faculty of Computing and Information Technology, King Abdulaziz University, Jeddah 21493
Received:
2018-06-29Revised:
2018-08-10Published:
2019-01-20RichHTML
1可视化
0复制本文网址
1. 探讨2016版国际胰瘘研究小组定义和分级系统对胰腺术后患者胰瘘分级的影响.PDF(500KB)
-->
摘要/Abstract
摘要: 面向财税领域非事实型问题, 提出基于语义检索的方法来抽取答案。首先使用领域知识库对问题及领域文档进行语义标注, 引入语义相似度特征提高法规及案例的检索准确率; 其次使用排序学习算法融合领域文本的多种特征对法规检索结果优化; 最后使用法规特征对案例检索结果进行筛选, 并从相似案例中抽取相应答案。在真实数据集上的测试结果表明, 该方法在准确率和效率上比基准方法有显著提升。
引用本文
仇瑜, 程力, Daniyal Alghazzawi. 特定领域问答系统中基于语义检索的非事实型问题研究[J]. 北京大学学报自然科学版, 2019, 55(1): 55-64.
QIU Yu, CHENG Li, Daniyal Alghazzawi. Semantic Search on Non-Factoid Questions for Domain-Specific Question Answering Systems[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2019, 55(1): 55-64.
PDF全文下载地址:
http://xbna.pku.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3301