大数据与OLAP系统
文献类型:期刊
作者:杜小勇[1]
机构:[1]中国人民大学信息学院数据工程与知识工程教育部重点实验室
[2]中国人民大学信息学院数据工程与知识工程教育部重点实验室
[3]中国人民大学信息学院数据工程与知识工程教育部重点实验室
年:2015
期刊名称:大数据
期:01
页码范围:55-67
增刊:增刊
所属部门:数据工程与知识工程教育部重点实验室
语言:中文
ISSN:2096-0271
人气指数:8
浏览次数:8
关键词:大数据;OLAP;SQL分析;SQL on Hadoop
摘要:OLAP(online analytical processing,在线联机分析处理)是关系数据基础上实现商业智能的核心技术。在大数据时代,人们迫切希望在由普通机器组成的大规模集群上能实现高性能的OLAP,然而系统性能的挑战巨大。可喜的是,近年来进展迅速,涌现了很多以Hadoop上的数据进行OLAP的所谓SQL on Hadoop系统,并且系统性能不断提升。在综述OLAP技术发展的基础上,重点对几个有代表性的SQL on Hadoop系统进行了测试分析,并展示了这类系统的性能特点。可以预见,未来在低成本的大数据OLAP市场,这类系统会占有重要位置。
作者其他论文
面向大规模机群的可扩展OLAP查询技术.王会举;覃雄派;王珊,等.计算机学报.2015,38(1),45-58.
Spark上的等值连接优化.卞昊穹;陈跃国;杜小勇,等.华东师范大学学报(自然科学版).2014,263-270,280.
一种电子文件管理系统的自动化测试方法.朝乐门;杜小勇;薛四新.2014.
一种能力属性增强的Web服务信任评估模型.李海华;杜小勇;田萱.计算机学报.2008,31(8),1471-1477.
基于划分的集合相似连接.荣垂田;徐天任;杜小勇.计算机研究与发展.2012,49(10),2066-2076.