基于分段保序哈希的日志数据分片方法及装置
文献类型:专利
发明人:覃雄派[1]
机构:中国人民大学
申请人:中国人民大学
专利类型:发明专利
年度:2015
专利申请日期:2015-07-16
专利公开日期:2015-12-02
专利公开号:CN105117402A
专利申请号:CN201510420017.7
国家或地区:北京
摘要:本发明提供一种基于分段保序哈希的日志数据分片方法及装置。本发明基于分段保序哈希的日志数据分片方法包括:将日志数据的多个属性字段的值域分别划分成N个分段;N为大于1的整数;按照所述N个分段的顺序建立每个所述属性字段对应的所述N个分段与哈希值的映射关系;所述哈希值为连续排列的整数,所述哈希值的排列顺序与所述N个分段的顺序一致;将每个所述哈希值对应的日志数据划分到一个存储单元中。本发明通过哈希函数的保序性,保证了相邻的日志数据被划分到相邻的存储单元,以便支持范围查询能够快速寻找到相关数据。
作者其他论文
面向大规模机群的可扩展OLAP查询技术.王会举;覃雄派;王珊,等.计算机学报.2015,38(1),45-58.
Spark上的等值连接优化.卞昊穹;陈跃国;杜小勇,等.华东师范大学学报(自然科学版).2014,263-270,280.
一种电子文件管理系统的自动化测试方法.朝乐门;杜小勇;薛四新.2014.
一种能力属性增强的Web服务信任评估模型.李海华;杜小勇;田萱.计算机学报.2008,31(8),1471-1477.
基于划分的集合相似连接.荣垂田;徐天任;杜小勇.计算机研究与发展.2012,49(10),2066-2076.