基于文档内位置关系的伪相关反馈方法
王雪彦1,2,3,何婷婷1,2,3*,黄翔4,王俊美5,潘敏61.人工智能与智慧学习湖北省重点实验室, 湖北 武汉 430070;2.华中师范大学计算机学院, 湖北 武汉 430070;3.国家语言资源监测与研究网络媒体中心, 湖北 武汉 430070;4.华中师范大学国家数字化学习工程研究技术中心, 湖北 武汉 430070;5.华中师范大学数学与统计学学院, 湖北 武汉 430070;6.湖北师范大学计算机与信息工程学院, 湖北 黄石 435000
发布日期:
2021-05-13作者简介:
王雪彦(1995— ),女,硕士研究生,研究方向为信息检索. E-mail:xueyanwang@mails.ccnu.edu.cn*通信作者简介:何婷婷(1964— ),女,博士,教授,研究方向为自然语言处理、信息检索和网络媒体监测. E-mail:tthe@mail.ccnu.edu.cn基金资助:
国家自然科学基金资助项目(61532008,61932008);武汉市科技计划项目(2019010701011392);国家语委科研中心项目(ZDI135-135);湖北省重点研发计划项目(2020BAB017)Pseudo-relevance feedback method based on locational relationship in document
WANG Xue-yan1,2,3, HE Ting-ting1,2,3*, HUANG Xiang4, WANG Jun-mei5, PAN Min61. Hubei Provincial Key Laboratory of Artificial Intelligence and Smart Learning, Wuhan 430070, Hubei, China;
2. School of Computer, Central China Normal University, Wuhan 430070, Hubei, China;
3. National Language Resources Monitor &
Research Center for Network Media, Wuhan 430070, Hubei, China;
4. National Engineering Research Center for E-Learning, Central China Normal University, Wuhan 430070, Hubei, China;
5. School of Mathematics and Statistics, Central China Normal University, Wuhan 430070, Hubei, China;
6. School of Computer and Information Engineering, Hubei Normal University, Huangshi 435000, Hubei, China
Published:
2021-05-13摘要/Abstract
摘要: 提出了一种基于文档内位置关系的伪相关反馈框架LRoc(location-based Rocchio framework)。该框架采用不同的核函数对候选词项在反馈文档中的位置进行建模,得到候选扩展词的位置重要度,并将其应用到经典的Rocchio模型中。该方法在选择和评估候选扩展词时,不仅考虑了词频,也考虑了词项位置的影响,有助于获取与查询更可能相关的扩展词。最后,在5种TREC数据集的实验结果表明:基于LRoc框架提出的3种模型(LRoc1、LRoc2和LRoc3)对比基线模型在MAP和P@20指标上具有显著提升。
PDF全文下载地址:
http://lxbwk.njournal.sdu.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3448