云计算环境中面向OLTP应用的数据分布研究
外文标题:Survey on OLTP Application Oriented Data Distribution in Cloud Computing
文献类型:期刊
作者:王晓燕[1]
机构:[1]中国人民大学数据工程与知识工程教育部重点实验室 北京 100872;最高人民法院信息中心 北京 100745;中国人民大学信息学院 北京100872
[2]中国人民大学数据工程与知识工程教育部重点实验室 北京 100872
[3]中国人民大学数据工程与知识工程教育部重点实验室 北京 100872;中国人民大学信息学院 北京100872;北京航空航天大学软件开发环境国家重点实验室 北京 100191
通讯作者:Du, Xiao-Yong(duyong@ruc.edu.cn)
年:2016
期刊名称:计算机学报
卷:39
期:2
页码范围:253-269
增刊:增刊
收录情况:EI(20161102091771)
所属部门:信息学院;数据工程与知识工程教育部重点实验室
语言:中文
ISSN:0254-4164
链接地址:http://d.g.wanfangdata.com.cn/Periodical_jsjxb201602003.aspx
DOI:10.11897/SP.J.1016.2016.00253
人气指数:5
浏览次数:5
基金:the State Key Laboratory of Software Development Environment Open Fund under Grant No.SKLSDE-2012KF-09, and the National Natural Science Foundation of China under Grant No.61003086 and No.61170010.本课题得到软件开发环境国家重点实验室开放基金; 国家自然科学基金
关键词:数据分布;三角架构;数据分片;数据分配;OLTP;大数据
摘要:云计算为大型OLTP应用中分布式数据的高效存储和管理带来了新的机遇,大数据则对分布式数据的存储与管理提出了新的挑战,自动数据分布逐渐成为分布式系统中的研究重点和难点.该文对影响数据分布问题的三要素数据、负载和节点进行分析,将该问题抽象为数据分片、数据分配和负载执行3个相互关联的子问题,提出了数据分布问题的三角架构DaWN.由于不同的系统有不同的应用需求,DaWN架构以代价模型为枢纽,对特定应用需要达到的效能目标和资源限制进行调配,并提出了数据分布问题所面临的技术挑战.该文对DaWN架构中以顶点为代表的3个基本要素进行详细分析,着重对以边为代表的3条关联关系进行阐释,并据此对云环境中大规模OLTP应用的数据分片、数据分配和负载执行3个数据分布子问题的研究成果和进展进行归纳和总结.基于以上分析,该文以数据分片、数据分片和负载执行为变量,使用真值表覆盖数据分布问题中的8种类型,并采用三维立体坐标系的方式对相关工作的分布进行归纳总结和呈现.最后,该文从代价模型研究、测试基准研究、自动化数据分布技术研究、特定应用研究等4个角度,对数据分布问题的未来发展方向进行展望.
作者其他论文
Spark上的等值连接优化.卞昊穹;陈跃国;杜小勇,等.华东师范大学学报(自然科学版).2014,263-270,280.
一种电子文件管理系统的自动化测试方法.朝乐门;杜小勇;薛四新.2014.
一种能力属性增强的Web服务信任评估模型.李海华;杜小勇;田萱.计算机学报.2008,31(8),1471-1477.
基于划分的集合相似连接.荣垂田;徐天任;杜小勇.计算机研究与发展.2012,49(10),2066-2076.
自适应双向菌群优化算法.胡桂武;陈建超;杜小勇.计算机应用研究.2012,29(10),3645-3647,3668.