删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

Spark上的等值连接优化

中国人民大学 辅仁网/2017-07-05

文献详情
Spark上的等值连接优化
外文标题:Equi-join optimization on spark
文献类型:期刊
作者:卞昊穹[1]陈跃国[2]杜小勇[3]高彦杰[4]
机构:数据工程与知识工程教育部重点实验室(中国人民大学);中国人民大学信息学院,北京 100872

年:2014
期刊名称:华东师范大学学报(自然科学版)
期:5
页码范围:263-270,280
增刊:增刊
收录情况:CSCD(CSCD:5251106)
所属部门:信息学院;数据工程与知识工程教育部重点实验室
语言:中文
ISSN:1000-5641
链接地址:http://d.g.wanfangdata.com.cn/Periodical_hdsfdxxb201405023.aspx
DOI:10.3969/j.issn.1000-5641.2014.05.023
人气指数:37
浏览次数:37
基金:中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)
关键词:Spark;SQL;大数据分析;等值连接;内存计算
摘要:等值连接作为数据分析中最常用、代价最高的操作之一,在Spark上的实现和优化与传统并行数据库有很大的差别,传统并行数据仓库中基于数据预划分的连接算法在Spark上难以实现,而目前被广泛采用的Broadcast Join和Repartition Join性能较差,如何提高连接性能成为基于Spark的海量数据分析的关键.本研究将Simi-Join与Partition Join的优势相结合,并基于Spark上的特性提出了一种优化的等值连接算法.代价分析和实验表明本算法比现有基于Spark的数据分析系统中的连接算法性能提升1~2倍.
作者其他论文



一种电子文件管理系统的自动化测试方法.朝乐门;杜小勇;薛四新.2014.
一种能力属性增强的Web服务信任评估模型.李海华;杜小勇;田萱.计算机学报.2008,31(8),1471-1477.
基于划分的集合相似连接.荣垂田;徐天任;杜小勇.计算机研究与发展.2012,49(10),2066-2076.
自适应双向菌群优化算法.胡桂武;陈建超;杜小勇.计算机应用研究.2012,29(10),3645-3647,3668.
本体学习研究综述.杜小勇;李曼;王珊.软件学报.2006,17(9),1837-1847.

相关话题/数据 优化 工程 中国人民大学 基金

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 大数据下基于异步累积更新的高效P-Rank计算方法
    文献详情大数据下基于异步累积更新的高效P-Rank计算方法外文标题:High-EfficiencyP-RankComputationThroughAsynchronousAccumulativeUpdatesinBigDataEnvironment文献类型:期刊作者:王旭丛[1]李翠平[2]陈红[3 ...
    中国人民大学 辅仁网 2017-07-05
  • 内存数据仓库集群技术研究
    文献详情内存数据仓库集群技术研究外文标题:Researchonin-memorydatawarehouseclustertechnologies文献类型:期刊作者:张延松[1]王珊[2]周烜[3]机构:[1]中国人民大学DEKE实验室[2]中国人民大学信息学院[3]中国人民大学中国调查与数据中心年: ...
    中国人民大学 辅仁网 2017-07-05
  • 内存OLAP多核并行查询优化技术研究
    文献详情内存OLAP多核并行查询优化技术研究外文标题:Researchonmulticoreparallelqueryprocessingtechniquesformain-memoryOLAP文献类型:期刊作者:焦敏[1]张延松[2]王珊[3]陈红[4]机构:中国人民大学数据工程与知识工程教育部重 ...
    中国人民大学 辅仁网 2017-07-05
  • 西藏流动人口状况与特点--基于"全国第六次人口普查"数据的分析
    文献详情西藏流动人口状况与特点--基于"全国第六次人口普查"数据的分析文献类型:期刊作者:石人炳[1]石玲[2]机构:华中科技大学社会学系湖北武汉430074;中国人民大学人口与发展研究中心北京100872年:2014期刊名称:西南民族大学学报(人文社科版)卷:35期:7页码范围:49-52增刊:增 ...
    中国人民大学 辅仁网 2017-07-05
  • 消费者情境的发掘--大数据时代广告投放的新水平
    文献详情消费者情境的发掘--大数据时代广告投放的新水平外文标题:TheExplorationoftheConsumerSituation:aNewLevelofAdvertisingintheAgeofBigData文献类型:期刊作者:张辉锋[1]吴文汐[2]机构:[1]中国人民大学新闻学院[2]东 ...
    中国人民大学 辅仁网 2017-07-05
  • 高等教育资源利用效率与高校"985工程"实施绩效分析
    文献详情高等教育资源利用效率与高校"985工程"实施绩效分析外文标题:HigherEducationResourcesUtilizationEfficiencyand985ProjectPerformanceAnalysis文献类型:期刊作者:李红宇[1]曾孟夏[2]吕艳[3]机构:中国人民大学发展 ...
    中国人民大学 辅仁网 2017-07-05
  • 信息资源产业消费结构的演化规律与优化策略研究
    文献详情信息资源产业消费结构的演化规律与优化策略研究文献类型:期刊作者:冯惠玲[1]朝乐门[2]机构:中国人民大学信息资源管理学院,北京100872;数据工程与知识工程教育部重点实验室(中国人民大学),北京100872年:2014期刊名称:情报理论与实践卷:37期:5页码范围:17-22增刊:增刊收 ...
    中国人民大学 辅仁网 2017-07-05
  • 基于计算机仿真和数据统计的飞机设计质量控制模型
    文献详情基于计算机仿真和数据统计的飞机设计质量控制模型外文标题:DesignQualityControlModelforAircraftBasedonComputerSimulationandStatistics文献类型:期刊作者:袁聪聪[1]张传超[2]机构:[1]中航航空电子有限公司[2]中国人 ...
    中国人民大学 辅仁网 2017-07-05
  • 面板数据聚类的有监督学习算法探讨
    文献详情面板数据聚类的有监督学习算法探讨文献类型:期刊作者:彭非[1]杨娟[2]谢远涛[3]机构:[1]中国人民大学应用统计科学研究中心[2]中国人民大学统计学院[3]对外经济贸易大学保险学院年:2014期刊名称:统计与决策期:6页码范围:4-7增刊:增刊收录情况:中文核心期刊要目总览CSSCI(4 ...
    中国人民大学 辅仁网 2017-07-05
  • 新型农村社会养老保险基金的拓展渠道
    文献详情新型农村社会养老保险基金的拓展渠道外文标题:NewRuralSocialPensionInsuranceFundtoExpandtheChannelsAnalysis文献类型:期刊作者:董小红[1]李哲[2]机构:安徽财经大学,安徽蚌埠233041;中国人民大学,北京100872;中国人民大 ...
    中国人民大学 辅仁网 2017-07-05