云环境下的Max/Min在线聚集技术研究
外文标题:Max/Min Online Aggregation in the Cloud
文献类型:期刊
作者:汪凤鸣[1]
机构:[1]中国人民大学信息学院,北京,100872
[2]中国人民大学信息学院,北京,100872
[3]中国人民大学信息学院,北京,100872
年:2015
期刊名称:小型微型计算机系统
卷:36
期:10
页码范围:2177-2182
增刊:正刊
收录情况:中文核心期刊要目总览
所属部门:信息学院
语言:中文
ISSN:1000-1220
链接地址:http://d.g.wanfangdata.com.cn/Periodical_xxwxjsjxt201510001.aspx
人气指数:3
浏览次数:3
基金:国家自然科学基金项目; 国家“八六三”高技术研究发展计划项目; 高等学校博士学科点专项科研基金课题项目; 中国人民大学科学研究基金项目
关键词:在线聚集;云计算;切比雪夫不等式;中心极限定理
摘要:数据探索作为数据分析的一个重要环节,必须能够高效的获取数据集的关键性指标,比如最大/最小值、均值等.关系数据库中这些指标可以通过SQL语句的聚集函数得到.为了实现海量数据下的高效聚集,关系数据库领域学者提出了在线聚集.在大数据时代,云环境下的在线聚集技术开始得到重视.但是目前云环境下的在线聚集研究基本是针对Count、Sum等聚集函数,尚未有针对Max/Min在线聚集的研究.本文利用切比雪夫不等式和中心极限定理,通过分位数来衡量Max/Min在线聚集的精确度.实验证明,该方法能够很好的适应大数据环境下的在线聚集,并具有良好的扩展性.
作者其他论文
差分隐私保护下一种精确挖掘top-k频繁模式方法.张啸剑;王淼;孟小峰.计算机研究与发展.2014,51(1),104-114.
大规模图数据可达性索引技术:现状与展望.富丽贞;孟小峰.计算机研究与发展.2015,52(1),116-129.
海量高维向量的并行Top-k连接查询.马友忠;慈祥;孟小峰.计算机学报.2015,38(1),86-98.
基于小数据的在线用户兴趣长程演化研究.李勇;孟小峰;刘继,等.计算机研究与发展.2015,779-788.
云数据管理索引技术研究.马友忠;孟小峰.软件学报.2015,26(1),145-166.