删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于语义相似性的跨模态图文内容筛选存储机制研究

本站小编 Free考研考试/2022-01-01

刘渝1,郭婵1,冯树耀1,周可1,肖志立2
1(华中科技大学武汉光电国家研究中心 武汉 430074);2(深圳市腾讯计算机系统有限公司技术工程事业群 广东深圳 518054) (liu_yu@hust.edu.cn)
出版日期: 2021-02-01


基金资助:国家自然科学基金青年科学基金项目(61902135);国家自然科学基金创新群体项目(61821003)

Content Sifting Storage Mechanism for Cross-Modal Image and Text Data Based on Semantic Similarity

Liu Yu1, Guo Chan1, Feng Shuyao1, Zhou Ke1, Xiao Zhili2
1(Wuhan National Laboratory for Optoelectronics, Huazhong University of Science and Technology, Wuhan 430074);2(Technology and Engineering Group, Tencent Inc., Shenzhen, Guangdong 518054)
Online: 2021-02-01


Supported by:This work was supported by the National Natural Science Foundation of China for Young Scientists (61902135) and the Innovation Group Project of the National Natural Science Foundation of China (61821003).




摘要/Abstract


摘要: 随着多媒体数据的爆发式增长,云端数据呈现出大规模多模态混合并存的特性.服务于数据分析的传统存储系统因为缺乏数据的语义管理而面临读取延时超长的挑战.针对图像和文本2种模态数据,在传统存储系统之上提出一种跨模态图文数据内容筛选存储机制(cross-modal image and text content sifting storage, CITCSS),用于提供大规模在线相似性内容筛选服务,从存储系统层面缓解数据分析时必须从存储中读出所有数据的读带宽压力.机制分为离线与在线2个阶段.离线阶段中,引入基于自监督的生成对抗式Hash方法,系统利用这种方法生成语义元数据.然后,将元数据注入独立的元数据空间.最后,根据相似性Hash码间汉明距离能够度量语义距离的特点,利用Neo4j图数据库构建Hash元数据图谱,并在语义图谱中建立Hash码与存储路径之间的映射.在线阶段中,用户发送与分析相关的图像或文本,存储系统首先转化数据为Hash码.然后,在筛选半径内通过Hash元数据图谱寻找相似节点,进而找到相似文件的底层存储路径返回筛选数据.实验结果表明,与传统语义存储系统相比,CITCSS在召回率超过98%的性能下,读取延迟相对降低了99.07%~99.77%.






[1]龙赛琴, 黄金娜, 李哲涛, 裴廷睿, 夏元清. 面向云网融合的数据中心能效评估方法[J]. 计算机研究与发展, 2021, 58(6): 1248-1260.
[2]杨尧林, 和红杰, 陈帆, 原长琦. 基于预测误差自适应编码的图像加密可逆数据隐藏[J]. 计算机研究与发展, 2021, 58(6): 1340-1350.
[3]冯云, 刘宝旭, 张金莉, 汪旭童, 刘潮歌, 申明喆, 刘奇旭. 一种无监督的窃密攻击及时发现方法[J]. 计算机研究与发展, 2021, 58(5): 995-1005.
[4]李明慧, 江沛佩, 王骞, 沈超, 李琦. 针对深度学习模型的对抗性攻击与防御[J]. 计算机研究与发展, 2021, 58(5): 909-926.
[5]周纯毅, 陈大卫, 王尚, 付安民, 高艳松. 分布式深度学习隐私与安全攻击研究进展与挑战[J]. 计算机研究与发展, 2021, 58(5): 927-943.
[6]张颖君, 陈恺, 周赓, 吕培卓, 刘勇, 黄亮. 神经网络水印技术研究进展[J]. 计算机研究与发展, 2021, 58(5): 964-976.
[7]宋蕊, 李童, 董鑫, 丁治明. 基于元路径嵌入的移动应用需求偏好分析方法[J]. 计算机研究与发展, 2021, 58(4): 749-762.
[8]屈凌峰, 和红杰, 陈帆, 张善俊. 基于块调制-置乱的图像加密算法安全性分析[J]. 计算机研究与发展, 2021, 58(4): 849-861.
[9]魏征, 窦禹, 高艳珍, 马捷, 孙凝晖, 邢晶. 一种基于条带的一致性散列数据放置算法[J]. 计算机研究与发展, 2021, 58(4): 888-903.
[10]谢震, 谭光明, 孙凝晖. 基于PPR模型的稀疏矩阵向量乘及卷积性能优化研究[J]. 计算机研究与发展, 2021, 58(3): 445-457.
[11]甘新标, 谭雯, 刘杰. 基于双向位图的CSR大规模图存储优化[J]. 计算机研究与发展, 2021, 58(3): 458-466.
[12]吴宗友, 白昆龙, 杨林蕊, 王仪琦, 田英杰. 电子病历文本挖掘研究综述[J]. 计算机研究与发展, 2021, 58(3): 513-527.
[13]廖海斌, 徐斌. 基于性别和年龄因子分析的鲁棒性人脸表情识别[J]. 计算机研究与发展, 2021, 58(3): 528-538.
[14]刘颖, 杨轲. 基于深度集成学习的类极度不均衡数据信用欺诈检测算法[J]. 计算机研究与发展, 2021, 58(3): 539-547.
[15]徐坤浩, 聂铁铮, 申德荣, 寇月, 于戈. 基于CPU-GPU异构体系结构的并行字符串相似性连接方法[J]. 计算机研究与发展, 2021, 58(3): 598-608.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4349
相关话题/数据 计算机 图像 优化 华中科技大学

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于持久化内存的索引设计重新思考与优化
    韩书楷,熊子威,蒋德钧,熊劲(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190)(中国科学院大学北京100049)(hanshukai@ict.ac.cn)出版日期:2021-02-01基金资助:国家重点研发计划项目(2018YFB1003303);中国科学院战略性先导科技专 ...
    本站小编 Free考研考试 2022-01-01
  • 基于XDR数据分析的OTT视频服务感知质量评估方法
    黄鹂声1,冉金也1,罗静1,张翔引21(电子科技大学计算机科学与工程学院成都611731);2(电子科技大学航空航天学院成都611731)(lsh@uestc.edu.cn)出版日期:2021-02-01基金资助:国家重点研发计划项目(2018YFB0804505);国家电网公司科学技术项目(522 ...
    本站小编 Free考研考试 2022-01-01
  • 基于语义分割的红外和可见光图像融合
    周华兵1,2,侯积磊1,2,吴伟1,2,张彦铎1,2,吴云韬1,2,马佳义31(武汉工程大学计算机科学与工程学院武汉430205);2(智能机器人湖北省重点实验室(武汉工程大学)武汉430205);3(武汉大学电子信息学院武汉430072)(zhouhuabing@gmail.com)出版日期:20 ...
    本站小编 Free考研考试 2022-01-01
  • 命名数据网络中的视频传输研究综述
    胡晓艳1,2,3,4,童钟奇1,徐恪5,张国强6,郑少琦1,赵丽侠1,程光1,2,3,龚俭1,2,31(东南大学网络空间安全学院南京211189);2(计算机网络和信息集成教育部重点实验室(东南大学)南京211189);3(网络空间国际治理研究基地(东南大学)南京211189);4(网络通信与安全紫 ...
    本站小编 Free考研考试 2022-01-01
  • 教育大数据中认知跟踪模型研究进展
    胡学钢,刘菲,卜晨阳(大数据知识工程教育部重点实验室(合肥工业大学)合肥230601)(合肥工业大学计算机与信息学院合肥230601)(合肥工业大学大知识科学研究院合肥230601)(jsjxhuxg@hfut.edu.cn)出版日期:2020-12-01基金资助:国家重点研发计划项目(2016YF ...
    本站小编 Free考研考试 2022-01-01
  • 基于超图的EBSN个性化推荐及优化算法
    于亚新,张文超,李振国,李莹(东北大学计算机科学与工程学院沈阳110169)(医学影像智能计算教育部重点实验室(东北大学)沈阳110169)(yuyx@mail.neu.edu.cn)出版日期:2020-12-01基金资助:国家自然科学基金项目(61871106,61973059);国家重点研发计划 ...
    本站小编 Free考研考试 2022-01-01
  • 飞腾处理器上向量三角函数的设计实现与优化
    沈洁,龙标,姜浩,黄春(国防科技大学计算机学院长沙410073)(j.shen@nudt.edu.cn)出版日期:2020-12-01基金资助:“核高基”国家科技重大专项基金项目(2018ZX01029-103);国家自然科学基金项目(61902407);湖南省自然科学基金资助项目(2018JJ36 ...
    本站小编 Free考研考试 2022-01-01
  • 基于SMT求解器的微处理器指令验证数据约束生成技术
    谭坚,罗巧玲,王丽一,胡夏晖,范昊,徐占(江南计算技术研究所江苏无锡214083)(tanjian131@163.com)出版日期:2020-12-01基金资助:国家重点研发计划项目(2017YFB0202703)DataConstraintGenerationTechnologyforMicrop ...
    本站小编 Free考研考试 2022-01-01
  • 一种分布式异构带宽环境下的高效数据分区方法
    马卿云1,季航旭1,赵宇海1,毛克明2,王国仁31(东北大学计算机科学与工程学院沈阳110169);2(东北大学软件学院沈阳110169);3(北京理工大学计算机学院北京100081)(maqy1995@163.com)出版日期:2020-12-01基金资助:国家重点研发计划项目(2018YFB10 ...
    本站小编 Free考研考试 2022-01-01
  • 基于多尺度滤波器的空域图像隐写增强算法
    吴俊锜,翟黎明,王丽娜,方灿铭,吴畑(空天信息安全与可信计算教育部重点实验室,武汉大学国家网络安全学院武汉430072)(jqwu@whu.edu.cn)出版日期:2020-11-01基金资助:国家自然科学基金重点项目(U1536204);国家自然科学基金项目(U1836112,61876134)E ...
    本站小编 Free考研考试 2022-01-01