删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

面向键值存储的日志结构合并树优化技术

本站小编 Free考研考试/2022-01-01

吴尚宇,谢婧雯,王毅
(深圳大学计算机与软件学院 广东深圳 518060) (shangyuwu1006@gmail.com)
出版日期: 2020-11-01


基金资助:国家自然科学基金项目(61972259);广东省自然科学基金-****基金项目(2019B151502055);广东省自然科学基金项目(2017B030314073);深圳市基础研究项目(JCYJ20170817100300603)

Optimization of LSM-Tree for Key-Value Stores

Wu Shangyu, Xie Jingwen, Wang Yi
(College of Computer Science and Software Engineering, Shenzhen University, Shenzhen, Guangdong 518060)
Online: 2020-11-01


Supported by:This work was supported by the National Natural Science Foundation of China (61972259), the Guangdong Natural Science Foundation-Distinguished Young Scholars (2019B151502055), the Guangdong Natural Science Foundation (2017B030314073), and the Shenzhen Natural Science Foundation (JCYJ20170817100300603).




摘要/Abstract


摘要: 日志结构合并树(log-structured merge tree, LSM-Tree)是一种针对写优化的数据结构,广泛应用于当代主流键值存储系统之中,用于处理当今世界海量多样化的数据.LSM-Tree通过批量处理的方式将随机写请求转换为顺序写请求,以保持极高的写效率.但LSM-Tree仍存在2个不足:一是数据的流动方向是单向的且固定不变.存储在LSM-Tree底部的数据将被一直保留底部,直到它们成为旧数据被压缩操作删除.访问这些数据将使读放大问题变得更加严重.二是LSM-Tree中的数据分布并未考虑访问频率的影响,这将导致访问延迟不平衡的问题.访问高频的低层数据将产生更高的访问延迟.提出了一种基于访问频率分布的上浮式键值存储结构(floating key-value, FloatKV).FloatKV首先在内存中提出了一种新的数据存储结构(LRU and FIFO, LRFO),其次在外存中设计了一种基于访问频率分布的上浮式键值存储策略.FloatKV记录外存中数据的访问频率,并根据访问频率来调整数据的存储位置,以减少访问延迟.为了验证FloatKV的可行性以及性能,使用标准数据库性能测试工具YSCB(yahoo! cloud serving benchmark)来进行评估,并将FloatKV与当前主流的技术进行比较.实验结果表明,FloatKV能够显著地提高读效率,并有效地减少了读放大问题.






[1]韩书楷, 熊子威, 蒋德钧, 熊劲. 基于持久化内存的索引设计重新思考与优化[J]. 计算机研究与发展, 2021, 58(2): 356-370.
[2]安仲奇, 张云尧, 邢晶, 霍志刚. 基于用户级融合I/O的Key-Value存储系统优化技术研究[J]. 计算机研究与发展, 2020, 57(3): 649-659.
[3]王海涛,李战怀,张晓,赵晓南. 一种基于LSM树的键值存储系统性能优化方法[J]. 计算机研究与发展, 2019, 56(8): 1792-1802.
[4]方荣强,王晶,姚治成,刘畅,张伟功. 多层神经网络算法的计算特征建模方法[J]. 计算机研究与发展, 2019, 56(6): 1170-1181.
[5]陈游旻,陆游游,罗圣美,舒继武. 基于RDMA的分布式存储系统研究综述[J]. 计算机研究与发展, 2019, 56(2): 227-239.
[6]游理通,王振杰,黄林鹏. 一个基于日志结构的非易失性内存键值存储系统[J]. 计算机研究与发展, 2018, 55(9): 2038-2049.
[7]蒋捷,杨仝,张梦瑜,代亚非,黄亮,郑廉清. DCuckoo:基于片内摘要的高性能散列表[J]. 计算机研究与发展, 2017, 54(11): 2508-2515.
[8]何炎祥,沈凡凡,张军,江南,李清安,李建华. 新型非易失性存储器架构的缓存优化方法综述[J]. 计算机研究与发展, 2015, 52(6): 1225-1241.
[9]李玮,张大方,谢鲲,黎文伟,何杰. 一种面向闪存键值存储的矩阵索引布鲁姆过滤器[J]. 计算机研究与发展, 2015, 52(5): 1210-1222.
[10]田杭沛 高德远 樊晓桠 朱怡安. 面向实时流处理的多核多线程处理器访存队列[J]. , 2009, 46(10): 1634-1641.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4299
相关话题/计算机 数据 优化 结构 设计

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 密码学与数据隐私保护研究专题前言
    曹珍富1,徐秋亮2,张玉清3,董晓蕾11(华东师范大学上海200062);2(山东大学软件学院济南250101);3(中国科学院大学北京101408)出版日期:2020-10-01Online:2020-10-01摘要/Abstract摘要:社会的信息化给人们的工作和生活带来极大变革,各种业务平台、 ...
    本站小编 Free考研考试 2022-01-01
  • 基于模格的密钥封装方案的比较分析与优化
    王洋1,3,沈诗羽2,赵运磊2,王明强1,31(山东大学数学学院济南250100);2(复旦大学计算机科学技术学院上海200433);3(密码技术与信息安全教育部重点实验室(山东大学)济南250100)(wyang1114@email.sdu.edu.cn)出版日期:2020-10-01基金资助:国 ...
    本站小编 Free考研考试 2022-01-01
  • 互联网数据传输协议QUIC研究综述
    李学兵1,2,3,陈阳1,2,3,周孟莹1,2,王新1,21(复旦大学计算机科学技术学院上海201203);2(上海市智能信息处理重点实验室(复旦大学)上海201203);3(鹏城实验室广东深圳518066)(xbli16@fudan.edu.cn)出版日期:2020-09-01InternetDa ...
    本站小编 Free考研考试 2022-01-01
  • HDM网络架构与混合式数据分发策略
    周玉轩1,4,杨絮1,2,秦传义1,杨志伟3,朱一峰1,2,段锦1,21(长春理工大学电子信息工程学院长春130022);2(空地激光通信技术国防重点学科实验室(长春理工大学)长春130022);3(吉林大学计算机科学与技术学院长春130012);4(扬州通信设备有限公司江苏扬州225012)(zh ...
    本站小编 Free考研考试 2022-01-01
  • 异构模式中关联数据的一致性规则发现方法
    杜岳峰,李晓光,宋宝燕(辽宁大学信息学院沈阳110136)(duyuefeng@lnu.edu.cn)出版日期:2020-09-01基金资助:国家自然科学基金项目(U1811261);辽宁公共舆情与网络安全大数据系统工程实验室专项资金;辽宁省自然科学基金项目DiscoveringConsistenc ...
    本站小编 Free考研考试 2022-01-01
  • 基于元数据逻辑无关片断的结构完整性检测方法
    赵晓非1,2,史忠植3,刘建伟31(天津工业大学计算机科学与技术学院天津300387);2(江苏省计算机信息处理技术重点实验室(苏州大学)江苏苏州215006);3(中国科学院计算技术研究所智能信息处理重点实验室北京100190)(zhaoxiaofei1978@hotmail.com)出版日期:2 ...
    本站小编 Free考研考试 2022-01-01
  • 数据挖掘与知识发现专题前言
    陈恩红1,梁吉业2,张敏灵31(中国科学技术大学合肥230027);2(山西大学太原030006);3(东南大学南京210096)出版日期:2020-08-01ChenEnhong1,LiangJiye2,ZhangMinling3Online:2020-08-01摘要/Abstract摘要:数据挖 ...
    本站小编 Free考研考试 2022-01-01
  • 基于随机投影的高维数据流聚类
    朱颖雯1,2,3,陈松灿1,21(南京航空航天大学计算机科学与技术学院南京211106);2(模式分析与机器智能工业和信息化部重点实验室(南京航空航天大学)南京211106);3(三江学院计算机科学与工程学院南京210012)(yingwen.zhu@nuaa.edu.cn)出版日期:2020-08 ...
    本站小编 Free考研考试 2022-01-01
  • 一种基于智能手机传感器数据的地图轮廓生成方法
    陶涛1,孙玉娥2,5,陈冬梅1,杨文建1,黄河1,3,罗永龙4,51(苏州大学计算机科学与技术学院江苏苏州215006);2(苏州大学轨道交通学院江苏苏州215131);3(中国科学技术大学苏州研究院江苏苏州215123);4(安徽师范大学计算机与信息学院安徽芜湖241002);5(网络与信息安全安 ...
    本站小编 Free考研考试 2022-01-01
  • 计算机体系结构前沿技术2020专题前言
    刘志勇1,窦勇21(中国科学院计算技术研究所北京100190);2(国防科技大学长沙410073)出版日期:2020-06-01Online:2020-06-01摘要/Abstract摘要:我们高兴地向读者推出本刊“计算机体系结构前沿技术”专题!本专题收录的6篇文章既包含不同技术领域和方向的综述,也 ...
    本站小编 Free考研考试 2022-01-01