删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

捕获局部语义结构和实例辨别的无监督哈希

本站小编 Free考研考试/2022-01-02

摘要:由于具有低存储成本、高效检索、低标注成本等方面的优势,无监督的哈希技术已经引起了学术界越来越多的关注,并且已经广泛地应用到大规模数据库检索问题中.先前的无监督方法大部分依靠数据集本身的语义结构作为指导信息,要求在哈希空间中,数据的语义信息能够得到保持,从而完成哈希编码的学习.因此,如何精确地表示语义结构以及哈希编码成为了无监督哈希方法成功的关键.提出一种新的基于自监督学习的策略进行无监督哈希编码学习.具体来讲,首先利用对比学习在目标数据集上对网络进行学习,从而能够构建准确的语义相似性结构;接着,提出一个新的目标损失函数,期望在哈希空间中,数据的局部语义相似性结构能够得到保持,同时,哈希编码的辨识力能够得到提升,提出的网络框架是端到端可训练的;最后,提出的算法在两个大规模图像检索数据集上进行了测试,大量的实验验证了所提出算法的有效性.



Abstract:Recently, unsupervised Hashing has attracted much attention in the machine learning and information retrieval communities, due to its low storage and high search efficiency. Most of existing unsupervised Hashing methods rely on the local semantic structure of the data as the guiding information, requiring to preserve such semantic structure in the Hamming space. Thus, how to precisely represent the local structure of the data and Hashing code becomes the key point to success. This study proposes a novel Hashing method based on self-supervised learning. Specifically, it is proposed to utilize the contrast learning to acquire a compact and accurate feature representation for each sample, and then a semantic structure matrix can be constructed for representing the similarity between samples. Meanwhile, a new loss function is proposed to preserve the semantic information and improve the discriminative ability in the Hamming space, by the spirit of the instance discrimination method proposed recently. The proposed framework is end-to-end trainable. Extensive experiments on two large-scale image retrieval datasets show that the proposed method can significantly outperform current state-of-the-art methods.



PDF全文下载地址:

http://jos.org.cn/jos/article/pdf/6178
相关话题/数据 结构 网络 空间 信息

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • KGDB:统一模型和语言的知识图谱数据库管理系统
    摘要:知识图谱是人工智能的重要基石,其目前主要有RDF图和属性图两种数据模型,在这两种数据模型之上有数种查询语言.RDF图上的查询语言为SPARQL,属性图上的查询语言主要为Cypher.10年来,各个社区开发了分别针对RDF图和属性图的不同数据管理方法,不统一的数据模型和查询语言限制了知识图谱的更 ...
    本站小编 Free考研考试 2022-01-02
  • PandaDB:一种异构数据智能融合管理系统
    摘要:随着大数据应用的不断深入,对大规模结构化/非结构化数据进行融合管理和分析的需求日益凸显.然而,结构化/非结构化数据在存储管理方式、信息获取方式、检索方式方面的差异给融合管理和分析带来了技术挑战.提出了适用于异构数据融合管理和语义计算的属性图扩展模型,并定义了相关属性操作符和查询语法.接着,基于 ...
    本站小编 Free考研考试 2022-01-02
  • 用于表格事实检测的图神经网络模型
    摘要:在自然语言理解和语义表征的研究中,往往需要验证一句文本陈述是否基于给定的事实证据,这就是事实检测任务.现有的研究主要局限于处理文本事实验证,而结构化证据下的验证还有待探索,比如基于表格等形式的事实验证.TabFact作为最新的基于表格的事实验证数据集,基线方法并没有很好地利用表格的结构性特征. ...
    本站小编 Free考研考试 2022-01-02
  • 基于人工智能方法的数据库智能诊断
    摘要:数据库是一种非常重要和基础的计算机系统软件,随着数据库在各行各业的广泛应用,越来越多的人开始关注数据库运行的稳定性.由于各种各样内部或是外部作用的影响,数据库在实际运行的过程中会出现性能异常,而这可能会带来巨大的经济损失.人们大多通过观察监控指标信息来进行数据库异常诊断,但是关于数据库监控指标 ...
    本站小编 Free考研考试 2022-01-02
  • 基于信息检索的软件缺陷定位方法综述
    摘要:基于信息检索的软件缺陷定位方法是当前软件缺陷定位领域中的一个研究热点.该方法主要分析缺陷报告文本和程序模块代码,通过计算缺陷报告和程序模块间的相似度,选取与缺陷报告相似度最高的若干程序模块,将其推荐给开发人员.对近些年国内外研究人员在该综述主题上取得的成果进行了系统的梳理和总结.首先,给出研究 ...
    本站小编 Free考研考试 2022-01-02
  • GPU数据库核心技术综述
    摘要:GPU以其超高速计算能力和超大数据处理带宽受到数据库厂商及研究人员的青睐,以GPU计算为核心的数据库分支(GDBMS)蓬勃发展,以其吞吐量大、响应时间短、成本低廉、易于扩展的特点,与人工智能、时空数据分析、数据可视化、商务智能交互融合能力,彻底改变了数据分析领域的格局.将对GDBMS的四大核心 ...
    本站小编 Free考研考试 2022-01-02
  • 数据中心负载均衡方法研究综述
    摘要:随着云计算的发展,数据中心网络成为近年来学术界和工业界关注的研究热点.现代数据中心网络通常采用胖树等多根树拓扑结构,存在多条可用路径来提供高对分带宽.由于等价多路径路由等传统的负载均衡方法无法适应数据中心网络中高动态和强突发的流量特性,多种针对数据中心的负载均衡方法不断涌现.围绕数据中心中负载 ...
    本站小编 Free考研考试 2022-01-02
  • 下一代网络处理器及应用综述
    摘要:网络处理器作为能够完成路由查找、高速分组处理以及QoS保障等主流业务的网络设备核心计算芯片,可以结合自身可编程性完成多样化分组处理需求,适配不同网络应用场景.面向超高带宽及智能化终端带来的网络环境转变,高性能可演进的下一代网络处理器设计是网络通信领域的热点问题,受到****们的广泛关注.融合不 ...
    本站小编 Free考研考试 2022-01-02
  • 基于事件社会网络推荐系统综述
    摘要:基于事件社会网络(event-basedsocialnetwork,简称EBSN)是一种结合了线上网络和线下网络的新型社会网络,近年来得到了越来越多的关注,已有许多国内外重要研究机构的研究者对其进行研究并取得了许多研究成果.在EBSN推荐系统中,一个重要的任务就是设计出更好、更合理的推荐算法以 ...
    本站小编 Free考研考试 2022-01-02
  • 网络断层扫描:理论与算法
    摘要:网络测量为网络设计者与管理者提供网络内部细粒度的运行状态信息,是对网络进行高效管理与优化的基础.网络断层扫描是网络测量领域的一个研究热点,是一种端到端的网络测量方法.与传统网络内部测量方法不同,网络断层扫描利用端到端的测量信息计算和推断网络内部性能和状态,从而实现与网络组成和协议无关的网络测量 ...
    本站小编 Free考研考试 2022-01-02