删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于注意力机制的规范化矩阵分解推荐算法

本站小编 Free考研考试/2022-01-02

摘要:近年来,矩阵分解(MF)技术因其有效性和简便性在推荐系统中得到广泛应用.但是,数据稀疏和冷启动问题导致MF学习到的用户特征向量不能准确地代表用户的偏好以及反映用户间的相似关系,影响了模型的性能.为了解决该问题,规范化矩阵分解(RMF)技术引起了研究者的关注.挖掘用户间可靠的相似关系,是RMF需要解决的问题.此外,MF将目标用户特征向量和目标项目特征向量的内积作为目标用户对目标项目的评分,这种简单的线性关系忽略了用户对项目各个属性特征不同的关注度.如何分析用户对项目属性特征的关注度,获取用户更准确的偏好,仍然是一个挑战.针对上述问题,提出了基于注意力机制的规范化矩阵分解模型(ARMF).具体地,为了获取用户间可靠的相似关系解决数据稀疏和冷启动问题,该模型同时依据用户信任网络和评分记录构建用户-项目异构网络,并基于该异构网络挖掘用户间的相似关系;为了进一步提升模型性能,通过在MF中引入注意力机制,分析用户对项目各个属性特征不同的关注度来获取用户更准确的偏好.最后,在两个真实数据集上对比ARMF与现有工作,实验结果证明,ARMF有更好的准确性和健壮性.



Abstract:In recent years, matrix factorization (MF) has been exploited commonly in recommender system because of its capability and simplification. However, data sparsity and cold-start problems make the latent feature of users learned by MF cannot represent the users' preferences and the similarity relation among users exactly, which limits the performance of MF. To remedy it, the regularized matrix factorization (RMF) draws researchers' attention. And the problem demanding prompt solution in RMF is capturing the reliable similarity relation among users. Besides, MF simply regards the inner product between the latent features of both target user and target item as the score that target user may rate the target item, ignoring the user's different attentions on various features of the item. How to analyze the user's attention on item's features and capture more accurate preference of the user is still a challenge. To address these issues, a model is put forward named attention-based regularized matrix factorization, abbreviated as ARMF. Specifically, to settle the problems of data sparsity and cold-start and obtain reliable similar relationships among users, the model builds a user-item heterogeneous network according to the social network and the rating record, and the similarities among users can be obtained based on it. Incorporating attention mechanism into MF allows us to analyze the attention of users on different item's features and capture moreaccurate preferences of users, which improves the precision of MF further. At last, the proposed model is compared with the state-of-the-art models on two real-world datasets and the result demonstrates the better precision and robustness of ARMF.



PDF全文下载地址:

http://jos.org.cn/jos/article/pdf/5913
相关话题/数据 网络 技术 实验 工作

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 轩辕:AI原生数据库系统
    摘要:大数据时代下,数据库系统主要面临3个方面的挑战:首先,基于专家经验的传统优化技术(如代价估计、连接顺序选择、参数调优)已经不能满足异构数据、海量应用和大规模用户对性能的需求,可以设计基于学习的数据库优化技术,使数据库更智能;其次,AI时代,很多数据库应用需要使用人工智能算法,如数据库中的图像搜 ...
    本站小编 Free考研考试 2022-01-02
  • 学习式数据库系统:挑战与机遇
    摘要:通用的数据库系统为不同的应用需求与数据类型提供统一的处理方式,在取得了巨大成功的同时,也暴露了一定的局限性:由于没有结合具体应用的数据分布与工作负载,系统往往难以保证性能的最优.为了解决这一问题,"学习式数据库系统"成为了目前数据库领域的研究热点,它利用机器学习技术有效捕获负载与数据的特性,从 ...
    本站小编 Free考研考试 2022-01-02
  • 数据集成方法发展与展望
    摘要:数据集成在数据管理与分析领域起着重要的作用.尽管从学术界首次提出并开始研究数据集成问题已经过去30多年,但在各个领域仍然存在着大量与数据集成问题密切相关的问题亟待解决.对数据集成领域从2001年开始到现在相关工作的发展脉络进行了梳理与总结.通过追踪数据集成方法的发展轨迹,不仅可以了解前人在解决 ...
    本站小编 Free考研考试 2022-01-02
  • 数据标注研究综述
    摘要:数据标注是大部分人工智能算法得以有效运行的关键环节.数据标注越准确、标注的数据量越大,算法的性能就越好.数据标注行业的发展带动了中国许多城市和城镇的就业,促使中国逐渐成为世界数据标注的中心.阐述了数据标注的发展概况,包括起源、应用场景、分类和任务;列举了目前常用的标注数据集、开源的数据标注工具 ...
    本站小编 Free考研考试 2022-01-02
  • 基于符号语义的不完整数据聚集查询处理算法
    摘要:研究了基于符号语义的不完整数据聚集查询处理问题.不完整数据又称为缺失数据,缺失值包括可填充的和不可填充的两种类型.现有的缺失值填充算法不能保证填充后查询结果的准确度,为此,给出了不完整数据聚集查询结果的区间估计.在符号语义中扩展了传统关系数据库模型,提出了一种通用不完整数据库模型.该模型可以处 ...
    本站小编 Free考研考试 2022-01-02
  • 用户可动态撤销及数据可实时更新的云审计方案
    摘要:随着云存储的出现,越来越多的用户选择将大量数据存储在远程云服务器上,以节约本地存储资源.如何验证用户远程存储在云端数据的完整性,成为近年来学术界的一个研究热点.虽然现已提出了很多云审计方案,但大多数方案都假设个人和企业在使用云存储系统的整个过程中,用户及其公私钥始终不变,且不能高效地对数据进行 ...
    本站小编 Free考研考试 2022-01-02
  • 对抗样本生成技术综述
    摘要:如今,深度学习已被广泛应用于图像分类和图像识别的问题中,取得了令人满意的实际效果,成为许多人工智能应用的关键所在.在对于模型准确率的不断探究中,研究人员在近期提出了“对抗样本”这一概念.通过在原有样本中添加微小扰动的方法,成功地大幅度降低原有分类深度模型的准确率,实现了对于深度学习的对抗目的, ...
    本站小编 Free考研考试 2022-01-02
  • 大数据实时交互式分析
    摘要:实时交互式分析针对多目标和多角度的分析任务,通过多轮次的用户-数据库交互过程,逐步明确分析任务与分析目标,全方位地了解相关领域信息,最终得到科学的、全面的分析结果.相比传统数据库“提交查询-返回结果”的单轮次交互查询方式,实时交互式分析更强调交互的实时性与查询结果的时效性.对实时交互式分析的研 ...
    本站小编 Free考研考试 2022-01-02
  • HDFS 存储和优化技术研究综述
    摘要:HDFS(Hadoopdistributedfilesystem)作为面向数据追加和读取优化的开源分布式文件系统,具备可移植、高容错和可大规模水平扩展的特性.经过10余年的发展,HDFS已经广泛应用于大数据的存储.作为存储海量数据的底层平台,HDFS存储了海量的结构化和非结构化数据,支撑着复杂 ...
    本站小编 Free考研考试 2022-01-02
  • 软件定义网络中的异常流量检测研究进展
    摘要:软件定义网络(softwaredefinednetworking,简称SDN)是一种新型的网络架构.SDN将控制层从数据层分离并开放网络接口,以实现网络集中控制并提高网络的可扩展性和编程性.但是SDN也面临诸多的网络安全威胁.异常流量检测技术可以保护网络安全,防御恶意流量攻击.对SDN异常流量 ...
    本站小编 Free考研考试 2022-01-02