删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

一种基于条带的一致性散列数据放置算法

本站小编 Free考研考试/2022-01-01

魏征1,2,窦禹1,2,高艳珍1,2,马捷1,孙凝晖1,邢晶1
1(计算机体系结构国家重点实验室(中国科学院计算技术研究所) 北京 100190);2(中国科学院大学 北京 100190) (weizheng@ncic.ac.cn)
出版日期: 2021-04-01


基金资助:国家重点发展计划项目(2018YFC0809300);国家自然科学基金项目(61502454);联想研究院ECR团队分布式闪存项目

A Consistent Hash Data Placement Algorithm Based on Stripe

Wei Zheng1,2, Dou Yu1,2, Gao Yanzhen1,2, Ma Jie1, Sun Ninghui1, Xing Jing1
1(State Key Laboratory of Computer Architecture (Institute of Computing Technology,Chinese Academy of Sciences),Beijing 100190);2(University of Chinese Academy of Sciences,Beijing 100190)
Online: 2021-04-01


Supported by:This work was supported by the National Key Research and Development Program of China (2018YFC0809300), the National Natural Science Foundation of China (61502454), and the Distributed Full Flash Project of ECR Team of Lenovo Research Institute.




摘要/Abstract


摘要: 分布式存储系统作为数据存储的载体,广泛应用于大数据领域.纠删码存储方式相对副本方式,既具有较高的空间利用效率,又能保证数据存储的可靠性,因此被越来多的应用于存储系统当中.在EB级大规模纠删码分布式存储系统中,元数据管理成本较大,位置信息等元数据查询效率影响了I/O时延和吞吐量.基于位置信息记录的有中心数据放置算法需要频繁访问元数据服务器,导致性能优化受限,基于Hash映射的无中心数据放置算法越来越多地得到应用.但面向纠删码的无中心放置算法,在节点变更和数据恢复过程中,存在位置变更困难、迁移数据量大、数据恢复和迁移并发度低等问题.提出了一种基于条带的一致性Hash数据放置算法(consistent Hash data placement algorithm based on stripe, SCHash),SCHash以条带为单位放置数据,通过把数据块到节点的映射转化为条带到节点组的映射过程,减少节点变动过程中的数据迁移量,从而在恢复过程中降低了变动数据的比例,加速了恢复带宽.并基于SCHash算法设计了一种基于条带的并发I/O调度恢复策略,通过避免选取同一节点的数据块进行I/O操作,提升了I/O并行度,通过调度恢复I/O和迁移I/O的执行顺序,减少了数据恢复的执行时间.相比APHash数据放置算法,SCHash在数据恢复过程中,减少了46.71%~85.28%数据的迁移.在条带内重建时,恢复带宽提升了48.16%,在条带外节点重建时,恢复带宽提升了138.44%.






[1]蒲勇霖, 于炯, 鲁亮, 李梓杨, 国冰磊, 廖彬. 基于Storm平台的数据恢复节能策略[J]. 计算机研究与发展, 2021, 58(3): 479-496.
[2]徐光伟, 史春红, 冯向阳, 罗辛, 石秀金, 韩松桦, 李玮. 基于多级网络编码的多副本云数据存储[J]. 计算机研究与发展, 2021, 58(2): 293-304.
[3]李乾, 胡玉鹏, 叶振宇, 肖叶, 秦拯. 基于蚁群优化算法的纠删码存储系统数据更新方案[J]. 计算机研究与发展, 2021, 58(2): 305-318.
[4]陈茂棠, 郑圣安, 游理通, 王晶钰, 闫田, 屠要峰, 韩银俊, 黄林鹏. 一种基于RDMA多播机制的分布式持久性内存文件系统[J]. 计算机研究与发展, 2021, 58(2): 384-396.
[5]陈波, 陆游游, 蔡涛, 陈游旻, 屠要峰, 舒继武. 一种分布式持久性内存文件系统的一致性机制[J]. 计算机研究与发展, 2020, 57(3): 660-667.
[6]包涵, 王意洁, 许方亮. 基于生成矩阵变换的跨数据中心纠删码写入方法[J]. 计算机研究与发展, 2020, 57(2): 291-305.
[7]张耀, 储佳佳, 翁楚良. 纠删码存储系统数据更新方法研究综述[J]. 计算机研究与发展, 2020, 57(11): 2419-2431.
[8]唐英杰,王芳,谢燕文. 纠删码存储系统中基于网络计算的高效故障重建方法[J]. 计算机研究与发展, 2019, 56(4): 767-778.
[9]傅颖勋,文士林,马礼,舒继武. 纠删码存储系统单磁盘错误重构优化方法综述[J]. 计算机研究与发展, 2018, 55(1): 1-13.
[10]卞建超,查雅行,罗守山,李伟. 一种基于磁盘内和磁盘间冗余的混合编码方案[J]. 计算机研究与发展, 2016, 53(9): 1906-1917.
[11]毛波,叶阁焰,蓝琰佳,张杨松,吴素贞. 一种基于重复数据删除技术的云中云存储系统[J]. 计算机研究与发展, 2015, 52(6): 1278-1287.
[12]肖中正, 陈宁江, 魏峻, 张文博. 一种面向海量存储系统的高效元数据集群管理方案[J]. 计算机研究与发展, 2015, 52(4): 929-942.
[13]周 江, 王伟平, 孟 丹, 马 灿, 古晓艳, 蒋 杰,. 面向大数据分析的分布式文件系统关键技术[J]. 计算机研究与发展, 2014, 51(2): 382-394.
[14]王强, 李雄飞, 王婧. 云计算中的数据放置与任务调度算法[J]. 计算机研究与发展, 2014, 51(11): 2416-2426.
[15]朱 夏 罗军舟 宋爱波 东 方. 云计算环境下支持复杂查询的多维数据索引机制[J]. , 2013, 50(8): 1592-1603.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4408
相关话题/数据 计算机 计算 方案 优化

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于PPR模型的稀疏矩阵向量乘及卷积性能优化研究
    谢震1,2,3,谭光明1,2,孙凝晖1,21(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190);2(中国科学院计算技术研究所北京100190);3(中国科学院大学计算机与控制学院北京100049)(xiezhen@ncic.ac.cn)出版日期:2021-03-01基金资助 ...
    本站小编 Free考研考试 2022-01-01
  • 面向高性能图计算的高效高层次综合方法
    汤嘉武,郑龙,廖小飞,金海(华中科技大学计算机科学与技术学院武汉430074);(大数据技术与系统国家地方联合工程研究中心(华中科技大学)武汉430074);(服务计算技术与系统教育部重点实验室(华中科技大学)武汉430074);(集群与网格计算湖北省重点实验室(华中科技大学)武汉430074)(j ...
    本站小编 Free考研考试 2022-01-01
  • 基于双向位图的CSR大规模图存储优化
    甘新标,谭雯,刘杰(国防科技大学计算机学院长沙430017)(xinbiaogan@nudt.edu.cn)出版日期:2021-03-01基金资助:国家数值风洞项目(NNW2019ZT6-B21,NNW2019ZT6-B20,NNW2019ZT5-A10);国家重点研发计划项目(2018YFB020 ...
    本站小编 Free考研考试 2022-01-01
  • 基于Storm平台的数据恢复节能策略
    蒲勇霖1,于炯1,鲁亮2,李梓杨1,国冰磊1,廖彬31(新疆大学信息科学与工程学院乌鲁木齐830046);2(中国民航大学计算机科学与技术学院天津300300);3(新疆财经大学统计与数据科学学院乌鲁木齐830012)(puyonglin1991@foxmail.com)出版日期:2021-03-0 ...
    本站小编 Free考研考试 2022-01-01
  • 基于深度集成学习的类极度不均衡数据信用欺诈检测算法
    刘颖1,杨轲21(吉林财经大学管理科学与信息工程学院长春130117);2(吉林财经大学税务学院长春130117)(lyaihua1995@163.com)出版日期:2021-03-01基金资助:国家社会科学基金项目(20BTJ062)CreditFraudDetectionforExtremely ...
    本站小编 Free考研考试 2022-01-01
  • 一种联合检测命名数据网络中攻击的方法
    吴志军,张入丹,岳猛(中国民航大学电子信息与自动化学院天津300300)(zjwu@cauc.edu.cn)出版日期:2021-03-01基金资助:国家自然基金委员会与中国民航局联合基金项目(U1933108);天津市教委科研计划项目(2019KJ117);中央高校基本科研业务费专项资金(31220 ...
    本站小编 Free考研考试 2022-01-01
  • 基于维度分组降维的高维数据近似k近邻查询
    李松,胡晏铭,郝晓红,张丽平,郝忠孝(哈尔滨理工大学计算机科学与技术学院哈尔滨150080)(lisongbeifen@163.com)出版日期:2021-03-01基金资助:国家自然科学基金项目(61872105);黑龙江省自然科学基金项目(LH2020F047);黑龙江省留学归国人员科学基金项目 ...
    本站小编 Free考研考试 2022-01-01
  • 基于直方图的隐私键-值数据收集算法
    张啸剑1,徐雅鑫1,付楠1,孟小峰21(河南财经政法大学计算机与信息工程学院郑州450002);2(中国人民大学信息学院北京100872)(xjzhang82@ruc.edu.cn)出版日期:2021-03-01基金资助:国家自然科学基金项目(61502146,91646203,91746115,6 ...
    本站小编 Free考研考试 2022-01-01
  • 基于区块链的数据透明化:问题与挑战
    孟小峰1,刘立新1,21(中国人民大学信息学院北京100872);2(内蒙古科技大学信息工程学院内蒙古包头014010)(xfmeng@ruc.edu.cn)出版日期:2021-02-01基金资助:国家自然科学基金项目(91646203,61941121,61532010,91846204,6153 ...
    本站小编 Free考研考试 2022-01-01
  • 数据治理与数据透明专题前言
    孟小峰1,冯登国21(中国人民大学北京100872);2(中国科学院软件研究所北京100190)出版日期:2021-02-01Online:2021-02-01摘要/Abstract摘要:2020年4月,中共中央国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,提出要加快培育数据要素市场 ...
    本站小编 Free考研考试 2022-01-01