一种面向哈希连接的数据存储优化方法
文献类型:专利
发明人:张延松[1]
机构:中国人民大学
申请人:中国人民大学
专利类型:发明专利
年度:2014
专利申请日期:2014-05-12
专利公开日期:2014-07-23
专利公开号:CN103942343A
专利申请号:CN201410199090.1
国家或地区:北京
摘要:本发明涉及一种面向哈希连接的数据存储优化方法,步骤:选择事实表上radix哈希存储的外键属性,确定维表;设置n位radix基数,确定2<sup>n</sup>个哈希分区存储;设置2<sup>n</sup>个radix哈希分区队列;事实表和维表采用页面链表存储;页面内采用PAX列存储;记录插入时将记录的哈希分区属性值按低n位进行radix哈希,并存储于相应页面中;当某个radix哈希分区页面被记录填满后动态地申请新的页面;按连接键的哈希值直接访问指定的radix哈希分区队列,按队列中存储的页面地址访问该radix哈希分区的所有记录;全表扫描时按表的原始物理页面链接顺序访问;较小的表R和大表S进行分区存储;数据仓库中哈希连接时事实表采用列式连接方法;增加或减少radix哈希分区的位数实现哈希分区的动态增减。
作者其他论文
内存OLAP多核并行查询优化技术研究.焦敏;张延松;王珊,等.计算机学报.2014,1895-1910.
一个基于三元组存储的列式OLAP查询执行引擎.朱阅岸;张延松;周烜,等.软件学报.2014,25(4),753-767.
面向大规模机群的可扩展OLAP查询技术.王会举;覃雄派;王珊,等.计算机学报.2015,38(1),45-58.
内存数据仓库集群技术研究.张延松;王珊;周烜.华东师范大学学报(自然科学版).2014,117-132.
Co-OLAP:CPU&GPU混合平台上面向星形模型基准的协同OLAP.张宇;张延松;张兵,等.华东师范大学学报(自然科学版).2014,240-251.