网页信息处理方法及装置
文献类型:专利
发明人:张孝[1]
机构:中国人民大学
申请人:中国人民大学
专利类型:发明专利
年度:2015
专利申请日期:2015-05-07
专利公开日期:2015-07-22
专利公开号:CN104794237A
专利申请号:CN201510229707.4
国家或地区:北京
人气指数:3
浏览次数:3
摘要:本发明提供一种网页信息处理方法及装置,所述方法包括:获取待检索网页的时间间隔信息;根据所述待检索网页的时间间隔信息将所述待检索网页的集合划分为多个区域,通过线段树结构将所述时间间隔信息构成的时间间隔集合划分成至少两个单元时间间隔;基于所述单元时间间隔为每个区域添加倒排线段树索引;根据查询时间间隔以及每个区域的倒排线段树索引分别对每个区域内的待检索网页进行检索,确定与所述查询时间间隔关联的第一候选网页;从所述第一候选网页中确定包含查询关键字的第二候选网页;输出所述第二候选网页。
作者其他论文
内存OLAP多核并行查询优化技术研究.焦敏;张延松;王珊,等.计算机学报.2014,1895-1910.
一个基于三元组存储的列式OLAP查询执行引擎.朱阅岸;张延松;周烜,等.软件学报.2014,25(4),753-767.
面向大规模机群的可扩展OLAP查询技术.王会举;覃雄派;王珊,等.计算机学报.2015,38(1),45-58.
内存数据仓库集群技术研究.张延松;王珊;周烜.华东师范大学学报(自然科学版).2014,117-132.
Co-OLAP:CPU&GPU混合平台上面向星形模型基准的协同OLAP.张宇;张延松;张兵,等.华东师范大学学报(自然科学版).2014,240-251.