1(同济大学电子与信息工程学院 上海 201804); 2(嵌入式系统与服务计算教育部重点实验室(同济大学) 上海 201804); 3(德岛大学工学部 日本德岛 7708506) (1990hanzhao@tongji.edu.cn)
出版日期:
2018-05-01基金资助:
国家自然科学基金项目(61673301,61273304,61573255);高等学校博士学科点专项基金项目(20130072130004);安徽省高校优秀青年人才基金项目(gxyq2017056)Rough Set Knowledge Discovery Based Open Domain Chinese Question Answering Retrieval
Han Zhao1,2,3, Miao Duoqian1,2, Ren Fuji3,Zhang Hongyun1,21(College of Electronic and Information Engineering, Tongji University, Shanghai 201804); 2(Key Laboratory of Embedded System and Service Computing (Tongji University), Ministry of Education, Shanghai 201804); 3(The Faculty of Engineering, Tokushima University, Tokushima, Japan 7708506)
Online:
2018-05-01摘要/Abstract
摘要: 基于信息检索的开放领域问答系统,其主要原理是先使用语义分析工具和知识库获得确定性的语义和知识等信息,然后再进行问答句匹配度计算.但在实际的中文问答系统应用中,由于中文语言表达的不确定性和中文知识表达的不确定性大量存在,现有的匹配度计算方法不适合大量不确定性存在的应用场景.针对这一问题,提出了一种基于粗糙集知识发现的中文问答检索方法,利用粗糙集的属性约简方法和上近似概念从已标注的问答语料库中发现并表示知识,再结合传统的句子相似度方法对问句和候选句进行匹配度计算.实验结果表明:相对传统的问答检索方法,该方法在MAP和MRR两个评测指标上均有提升.
参考文献
相关文章 15
[1] | 侯朋朋, 张珩, 武延军, 于佳耕, 邰阳, 苗玉霞. 基于多标签的内核配置图及其应用[J]. 计算机研究与发展, 2021, 58(3): 651-667. |
[2] | 张莹莹, 钱胜胜, 方全, 徐常胜. 基于多模态知识感知注意力机制的问答方法[J]. 计算机研究与发展, 2020, 57(5): 1037-1045. |
[3] | 李金海, 李玉斐, 米允龙, 吴伟志. 多粒度形式概念分析的介粒度标记方法[J]. 计算机研究与发展, 2020, 57(2): 447-458. |
[4] | 佟威,汪飞,刘淇,陈恩红. 数据驱动的数学试题难度预测[J]. 计算机研究与发展, 2019, 56(5): 1007-1019. |
[5] | 何云,李彤,王炜,李响,兰微. 一种面向软件特征定位问题的语义相似度集成方法[J]. 计算机研究与发展, 2019, 56(2): 394-409. |
[6] | 王念, 彭政红, 崔莉. EasiFFRA:一种基于邻域粗糙集的属性快速约简算法[J]. 计算机研究与发展, 2019, 56(12): 2578-2588. |
[7] | 谢秦,张清华,王国胤. 基于相似度量的自适应三支垃圾邮件过滤器[J]. 计算机研究与发展, 2019, 56(11): 2410-2423. |
[8] | 郭嘉丰,范意兴. 深度学习检索框架的前沿探索[J]. 计算机研究与发展, 2018, 55(9): 1987-1999. |
[9] | 吴伟志,杨丽,谭安辉,徐优红. 广义不完备多粒度标记决策系统的粒度选择[J]. 计算机研究与发展, 2018, 55(6): 1263-1272. |
[10] | 姚晟,徐风,赵鹏,纪霞. 基于自适应邻域空间粗糙集模型的直觉模糊熵特征选择[J]. 计算机研究与发展, 2018, 55(4): 802-814. |
[11] | 周艳红,张贤勇,莫智文. 粒化单调的条件邻域熵及其相关属性约简[J]. 计算机研究与发展, 2018, 55(11): 2395-2405. |
[12] | 李智恒,桂颖溢,杨志豪,林鸿飞,王健. 基于生物医学文献的化学物质致病关系抽取[J]. 计算机研究与发展, 2018, 55(1): 198-206. |
[13] | 查正军,郑晓菊. 多媒体信息检索中的查询与反馈技术[J]. 计算机研究与发展, 2017, 54(6): 1267-1280. |
[14] | 陈忆群,周如旗,朱蔚恒,李梦婷,印鉴. 挖掘专利知识实现关键词自动抽取[J]. 计算机研究与发展, 2016, 53(8): 1740-1752. |
[15] | 付志耀,高岭,孙骞,李洋,高妮. 基于粗糙集的漏洞属性约简及严重性评估[J]. 计算机研究与发展, 2016, 53(5): 1009-1017. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3685