删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于信任关系和词相关关系的冷启动用户词特征重建

本站小编 Free考研考试/2022-01-02

摘要文本是社交媒体用户的重要信息之一,从文本中获取用户的词特征是实现用户主题建模、兴趣挖掘及个性化推荐等任务的基础。然而社交媒体中存在许多用户(冷启动用户)只含有少量甚至缺乏文本信息,为此该文提出一种融合用户信任关系及词相关关系的词特征重建方法。该方法通过对用户信任关系矩阵、词相关关系矩阵和用户词特征矩阵进行联合概率矩阵分解来实现对冷启动用户的词特征重建。在新浪微博和Twitter的四组数据集上的实验结果表明,该文所提出的冷启动用户词特征重建算法能够取得较好的词特征重建结果。

PDF全文下载地址:

http://jcip.cipsc.org.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=2569
相关话题/媒体 信息 推荐 实验 数据

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于深度学习的论文个性化推荐算法
    摘要该文基于学术搜索和数据挖掘平台Aminer向用户进行个性化推荐,提出了结合协同过滤推荐和基于内容推荐的混合模型,实验表明该算法可以有效解决新物品的推荐问题,即冷启动问题。其中在基于内容推荐的模型中,融合深度学习的方法,引进了词向量模型,将用户和论文映射到用词向量空间,并使用WMD(WordMov ...
    本站小编 Free考研考试 2022-01-02
  • 儿童外语学习认知数据收集的在线游戏框架
    摘要近年来,人工智能技术飞速发展,不少工作试图从人类的认知发展过程中探索前进方向,语言学习认知的过程成为了重点关注的研究领域。已有的语言认知研究工作主要集中在学龄前儿童母语的词汇学习认知方面,依赖于WordBank①等大规模语料库。然而就我们所知,目前在第二语言学习方面研究不多,尚未有大规模的第二语 ...
    本站小编 Free考研考试 2022-01-02
  • 基于社交媒体的用户情绪建模与异常检测
    摘要为了对新浪微博用户的异常情绪进行检测和分析,该文提出一种基于多元高斯模型和幂律分布的异常检测方法,根据联合概率密度值判断用户是否出现情绪异常。在实验部分,按照不同用户的异常检测准确率为83.49%,按照不同月份为87.84%。分布测试表明,单个用户的中性、快乐和悲伤情绪服从正态分布,而惊讶和愤怒 ...
    本站小编 Free考研考试 2022-01-02
  • 面向中文社交媒体语料的无监督新词识别研究
    摘要该文结合词向量技术和传统统计量,提出了一种新的无监督新词识别方法。该方法利用传统统计量获得候选新词,然后采用多种策略训练得到词向量,利用词向量构建弱成词词串集合,并使用该集合从候选新词的内部构成和外部环境两个方面对其进行过滤。此外,该文人工标注了一万条微博的分词语料作为发展语料,用于分析传统统计 ...
    本站小编 Free考研考试 2022-01-02
  • 网络传播信息内容的可信度研究进展
    摘要网络中存在着大量的谣言、偏激和虚假信息,这对网络信息的质量、可信度以及舆情的产生与发展趋势具有严重的负面影响。为实现信息可信度的准确判断与高效度量,该文在大量已有最新研究成果与文献的基础上,将不可信信息分为极端突发事件信息、网络偏激信息、网络谣言、虚假信息、误报信息和垃圾信息等类型,并分别针对这 ...
    本站小编 Free考研考试 2022-01-02
  • 基于多特征信息传播模型的微博意见领袖挖掘
    摘要在线社交网络中的意见领袖通常是指在社交网络的信息传播中具有较大社会影响力的个体。针对当前意见领袖挖掘方法中只考虑社交网络的拓扑结构和节点的个体属性,缺乏信息传播中交互特征的问题,该文提出了基于扩展独立级联模型,并融入网络结构特征、个体属性和行为特征的意见领袖挖掘模型(extendedindepe ...
    本站小编 Free考研考试 2022-01-02
  • MHW蒙古文脱机手写数据库及其应用
    摘要建立公开、权威的蒙古文手写数据库是研究和开发蒙古文手写识别系统的基础。该文在蒙古文编码、构词和语法的研究基础上,公开了一个蒙古文大词汇量脱机手写数据库MHW,其中训练集由5000个单词构成,每个词采集了20个样本,共包含10万样本,测试集Ⅰ包含5000样本,测试集Ⅱ包含14085样本。该文利用蒙 ...
    本站小编 Free考研考试 2022-01-02
  • 一种基于注意力联邦蒸馏的推荐方法
    摘要:数据隐私保护问题已成为推荐系统面临的主要挑战之一.随着《中华人民共和国网络安全法》的颁布和欧盟《通用数据保护条例》的实施,数据隐私和安全成为了世界性的趋势.联邦学习可通过不交换数据训练全局模型,不会泄露用户隐私.但是联邦学习存在每台设备数据量少、模型容易过拟合、数据稀疏导致训练好的模型很难达到 ...
    本站小编 Free考研考试 2022-01-02
  • 全委托的公共可验证的外包数据库方案
    摘要:为解决可验证外包数据库方案存在的预处理阶段开销较大及不支持公共可验证的问题,提出了一个全委托的公共可验证的外包数据库模型.给出了模型的架构及交互流程,对模型进行了形式化定义,并给出了模型的正确性定义和安全性定义.利用双线性映射及可验证外包模幂运算协议,构建了一个全委托的公共可验证外包数据库方案 ...
    本站小编 Free考研考试 2022-01-02
  • 基于动态赋权近邻传播的数据增量采样方法
    摘要:数据采样是快速提取大规模数据集中有用信息的重要手段,为更好地应对越来越大规模的数据高效处理要求,借助近邻传播算法的优异性能,通过引入分层增量处理和样本点动态赋权策略,实现了一种能够非常有效地平衡处理效率和采样质量的新方法.其中的分层增量处理策略考虑将原始的大规模数据集进行分批处理后再综合;而样 ...
    本站小编 Free考研考试 2022-01-02