一种基于知识库的查询分面生成方法
文献类型:专利
发明人:窦志成[1]
机构:中国人民大学
申请人:中国人民大学
专利类型:发明专利
年度:2015
专利申请日期:2015-12-07
专利公开日期:2016-05-04
专利公开号:CN105550226A
专利申请号:CN201510888652.8
国家或地区:北京
摘要:本发明公开了一种基于知识库的查询分面生成方法,该方法包括如下步骤:1)对于给定查询q,从搜索引擎中获取前T个检索结果,组成查询结果集合D;2)基于QDMiner算法获取一系列初始查询分面f,一系列所述初始查询分面f组成集合F;3)对每一个所述初始查询分面f进行扩展;4)对扩展后的所述初始查询分面f利用检索文档进行过滤,以保证扩展结果的准确率;利用扩展之后的初始查询分面f生成最终的查询分面。本发明使用知识库生成查询分面,可以有效解决现有方法依赖于检索结果的局限性。通过利用知识库中高质量的信息对初始分面进行扩展,检索结果中没有出现或未被抽取的分面词项可以被准确定位,从而提高查询分面的准确性和覆盖率。
作者其他论文
Shared-nothing并行数据库系统查询优化技术.文继荣;陈红;王珊.计算机学报.2000,23(1),28-38.
并行数据库系统PBASE/2的查询优化机制.陈红;文继荣;王珊.计算机工程.2000,26(7),11-12,187.
高适应性并行数据库系统PBASE的总体结构与关键技术.王珊;陈红;文继荣,等.863计划智能计算机主题学术会议.2001,226-241.
嵌套查询在并行数据库中的实现.周胜;文继荣;王珊.第十五届全国数据库学术会议.1998,274-277.
大数据时代的互联网分析引擎.窦志成;文继荣.大数据.2015,36-47.