平衡IO和CPU的XML关键词检索技术
文献类型:会议
作者:李求实[1]
机构:[1]数据工程与知识工程 教育部重点实验室(中国人民大学),北京 10087中国人民大学 信息学院,北京 100872
[2]数据工程与知识工程 教育部重点实验室(中国人民大学),北京 10087中国人民大学 信息学院,北京 100872
[3]数据工程与知识工程 教育部重点实验室(中国人民大学),北京 10087中国人民大学 信息学院,北京 100872
年:2009
会议名称:NDBC2009第26届中国数据库学术会议
会议论文集:NDBC2009第26届中国数据库学术会议论文集
页码范围:378-390
会议地点:南昌
会议开始日期:2009-10-15
所属部门:信息学院
人气指数:2
浏览次数:2
语言:中文
关键词:结构化检索;语言模型;关键词检索
摘要:由于当前XML在数据交换和数据存储中的普遍应用,基于XML文档的信息检索研究已经成为新的研究热点。XML文档本身含有结构信息可以使其检索精度得到相当大的提高。但相应地,XML检索中使用的更复杂的评分模型(如组合语言模型和推理网络的结构化评分模型)和更细的返回结果粒度(由文档转变为元素或者段落),也使得传统的信息检索由I/O密集型应用转变为CPU密集型应用。针对上述应用特点的转变,我们提出了一种新的检索处理模型,即保存数据的两种索引形式,根据系统的状态动态调整任务的调度,平衡I/O和CPU的处理,以达到减少单个查询的平均响应时间。
作者其他论文
内存OLAP多核并行查询优化技术研究.焦敏;张延松;王珊,等.计算机学报.2014,1895-1910.
一个基于三元组存储的列式OLAP查询执行引擎.朱阅岸;张延松;周烜,等.软件学报.2014,25(4),753-767.
面向大规模机群的可扩展OLAP查询技术.王会举;覃雄派;王珊,等.计算机学报.2015,38(1),45-58.
内存数据仓库集群技术研究.张延松;王珊;周烜.华东师范大学学报(自然科学版).2014,117-132.
Co-OLAP:CPU&GPU混合平台上面向星形模型基准的协同OLAP.张宇;张延松;张兵,等.华东师范大学学报(自然科学版).2014,240-251.