删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

一种潜在特征同步学习和偏好引导的推荐方法

本站小编 Free考研考试/2022-01-02

摘要:根据用户的历史评分数据为用户提供推荐的商品列表,是目前推荐系统研究的主流.研究者发现,随着用户参与度的不断提高,将反映用户偏好的评论文本与评分数据结合,可以进一步提高推荐的质量.提出了基于潜在特征同步学习和偏好引导的商品推荐方法,将评论文本的主题与用户的"打分偏好"进行关联,同步学习用户评论文本的潜在主题、评分矩阵的用户潜在因子和商品潜在因子,并将潜在主题作为用户个人偏好引导来约束推荐方法对商品的预测打分.该方法对推荐质量的优化主要体现在两个方面:一是在评论文本的潜在主题和评分数据的两种潜在因子之间建立映射关系,同步求解主题模型和矩阵分解模型;二是将从评论文本中学习得到的潜在主题作为用户对商品的个性偏好引入到矩阵分解中,进一步优化推荐方法.在来自Amazon网站的28组真实数据集上进行实验,以均方误差为评价指标,与已有的模型进行了对比分析.实验结果表明,该方法有效减少了推荐误差,与已有的TopicMF方法相比,均方误差在数据子集上最大减少了3.32%,平均减少了0.92%.



Abstract:It is a popular way that makes use of users' rating data to recommend products or items to users. Currently, more and more users have contributed their reviews to recommender system for better online shopping experiences. Researchers have become interested in using review texts as extra information to improve recommendation quality. It is argued that reviews written by a user implicitly represent his/her preferences. In this study, a preference guidance recommendation approach is proposed that simultaneously learns latent factors from rating data and latent topics from review texts. More specifically, the learned latent topics are assumed to be positively correlated with both of the corresponding user factors and item factors, which can further improve the accuracy of recommendation prediction. The proposed approach has two advantages. One is that in order to capture such a dependent correlation, a transformation function is used for simultaneously learning latent features, i.e., latent factors and latent topics. The other is that the predicted ratings of items are influenced by the implicit tastes of users, i.e., the latent topics from review texts. Experiments are conducted on the data from Amazon consisting of 28 categories. Experimental results show that the proposed approach obtains 3.32% improvement than the recent TopicMF approach in some category dataset and the average improvement is 0.92% in terms of mean square error.



PDF全文下载地址:

http://jos.org.cn/jos/article/pdf/5542
相关话题/推荐 数据 实验 质量 优化

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于超图随机游走标签扩充的微博推荐方法
    摘要:向微博用户推荐对其有价值和感兴趣的内容,是改善用户体验的重要途径.通过分析微博特点以及现有微博推荐算法的缺陷,利用标签信息表征用户兴趣,提出一种结合标签扩充与标签概率相关性的微博推荐方法.首先,考虑到大部分微博用户未给自己添加任何标签或添加标签过少,视用户发布微博为超边,微博中的词视为超点来构 ...
    本站小编 Free考研考试 2022-01-02
  • 多用户眼动跟踪数据的可视化共享与协同交互
    摘要:随着数字图像处理技术的发展,以及计算机支持的协同工作研究的深入,眼动跟踪开始应用于多用户协同交互.但是已有的眼动跟踪技术主要针对单个用户,多用户眼动跟踪计算架构不成熟、标定过程复杂,眼动跟踪数据的记录、传输以及可视化共享机制都有待深入研究.为此,建立了基于梯度优化的协同标定模型,简化多用户的眼 ...
    本站小编 Free考研考试 2022-01-02
  • 区块链数据管理专题前言
    摘要:近几十年来,数据管理技术取得了飞速发展并在很多重要领域广泛应用.传统的数据库管理系统(包括分布式数据库)往往由单一机构进行管理和维护,该机构对整个数据库具有最高权限.这种模式并不适用于由非完全互信的多个机构共同管理数据,在互联网应用环境中该问题尤为突出.区块链作为一种去中心化、不可篡改、可追溯 ...
    本站小编 Free考研考试 2022-01-02
  • 基于区块链的大数据访问控制机制
    摘要:针对大数据资源来源广泛、动态性强且呈现出分布式管理的特点,当前主流集中式访问控制机制存在权限管理效率低、灵活性不足、扩展性差等不足.基于此,以ABAC模型为基础,提出一种基于区块链的大数据访问控制机制:首先,对区块链技术的基本原理进行描述,并对基于属性的访问控制模型进行形式化的定义;然后提出基 ...
    本站小编 Free考研考试 2022-01-02
  • 基于区块链的档案数据保护与共享方法
    摘要:针对现有档案数据管理中普遍存在的数据中心化存储、安全性差和防篡改性弱等问题,提出一种基于区块链的档案数据保护与共享方法:通过智能合约和数字签名技术,实现了数字档案馆的身份认证和档案所有权的确定;通过智能合约和星际文件系统(IPFS)等技术,实现了数字档案的保护、验证、恢复与共享;通过公有链与联 ...
    本站小编 Free考研考试 2022-01-02
  • 决策空间定向搜索的高维多目标优化策略
    摘要:传统的多目标进化算法(MOEA)对于低维连续的多目标优化问题已经具有良好的性能,但是随着优化问题目标维数的增加,优化难度也将剧增,主要原因是算法本身搜索能力不足,维数增加时选择压力变小,收敛性和分布性冲突难以平衡.利用连续多目标优化问题的特性,针对高维多目标优化的难点所在,提出了一种在决策空间 ...
    本站小编 Free考研考试 2022-01-02
  • 区块链数据库:一种可查询且防篡改的数据库
    摘要:随着比特币、以太币等一系列加密货币的兴起,其底层的区块链技术受到越来越广泛的关注.区块链有防篡改、去中心化的特性.以太坊利用区块链技术来构建新一代去中心化的应用平台.BigchainDB将区块链技术与传统的分布式数据库相结合,利用基于联盟投票的共识机制改进传统Pow机制中的节点全复制问题,提高 ...
    本站小编 Free考研考试 2022-01-02
  • PUseqClust:一种RNA-seq数据聚类分析方法
    摘要:基因的聚类分析是基因表达数据分析研究的重要技术,它按照表达谱相近原则将基因表达数据归类,探究未知的基因功能.近年来,RNA-seq技术广泛应用于测量基因表达水平,产生了大量的读段数据,为基因表达聚类分析提供了充分条件.由于读段非均匀分布的特性,对读段计数一般采用负二项分布进行建模.现有的负二项 ...
    本站小编 Free考研考试 2022-01-02
  • 数据治理技术
    摘要:随着信息技术的普及,人类产生的数据量正在以指数级的速度增长,如此海量的数据就要求利用新的方法来管理.数据治理是将一个机构(企业或政府部门)的数据作为战略资产来管理,需要从数据收集到处理应用的一套管理机制,以期提高数据质量,实现广泛的数据共享,最终实现数据价值最大化.目前,各行各业对大数据的研究 ...
    本站小编 Free考研考试 2022-01-02
  • 融合多种数据信息的餐馆推荐模型
    摘要:餐馆推荐可以利用用户的签到信息、时间上下文、地理上下文、餐馆属性信息以及用户的人口统计信息等挖掘用户的饮食偏好,为用户生成餐馆推荐列表.为了更加有效地融合这些数据信息,提出一种融合了多种数据信息的餐馆推荐模型,该模型首先利用签到信息和时间上下文构建“用户-餐馆-时间片”的三维张量,同时利用其他 ...
    本站小编 Free考研考试 2022-01-02