平衡IO和CPU的XML关键词检索技术
文献类型:会议
作者:李求实[1]
机构: 数据工程与知识工程教育部重点实验室(中国人民大学);中国人民大学信息学院
年:2009
会议名称:第26届中国数据库学术会议
会议论文集: 第26届中国数据库学术会议论文集(A辑)
页码范围:13
会议地点:中国江西南昌
会议开始日期:2009-10-15
所属部门:信息学院;数据工程与知识工程教育部重点实验室
语言:中文
关键词:XML;结构化检索;I/O;语言模型
摘要:由于当前XML在数据交换和数据存储中的普遍应用,基于XML文档的信息检索研究已经成为新的研究热点。XML文档本身含有结构信息可以使其检索精度得到相当大的提高。但相应地,XML检索中使用的更复杂的评分模型(如组合语言模型和推理网络的结构化评分模型)和更细的返回结果粒度(由文档转变为元素或者段落),也使得传统的信息检索由I/O密集型应用转变为CPU密集型应用。针对上述应用特点的转变,我们提出了一种新的检索处理模型,即保存数据的两种索引形式,根据系统的状态动态调整任务的调度,平衡I/O和CPU的处理,以达到减少单个查询的平均响应时间。
作者其他论文
内存OLAP多核并行查询优化技术研究.焦敏;张延松;王珊,等.计算机学报.2014,1895-1910.
一个基于三元组存储的列式OLAP查询执行引擎.朱阅岸;张延松;周烜,等.软件学报.2014,25(4),753-767.
面向大规模机群的可扩展OLAP查询技术.王会举;覃雄派;王珊,等.计算机学报.2015,38(1),45-58.
内存数据仓库集群技术研究.张延松;王珊;周烜.华东师范大学学报(自然科学版).2014,117-132.
Co-OLAP:CPU&GPU混合平台上面向星形模型基准的协同OLAP.张宇;张延松;张兵,等.华东师范大学学报(自然科学版).2014,240-251.