删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于强化学习DQN的智能体信任增强

本站小编 Free考研考试/2022-01-01

亓法欣1,童向荣1,于雷1,2
1(烟台大学计算机与控制工程学院 山东烟台 264005);2(纽约州立大学宾汉姆顿分校计算机科学系 纽约州宾汉姆顿市 13902) (qifaxin123@163.com)
出版日期: 2020-06-01


基金资助:国家自然科学基金项目(61572418)

Agent Trust Boost via Reinforcement Learning DQN

Qi Faxin1, Tong Xiangrong1, Yu Lei1,2
1(School of Computer and Control Engineering, Yantai University, Yantai, Shandong 264005);2(Department of Computer Science, State University of New York at Binghamton, Binghamton, NY 13902)
Online: 2020-06-01


Supported by:This work was supported by the National Natural Science Foundation of China (61572418).




摘要/Abstract


摘要: 信任推荐系统是以社交网络为基础的一种重要推荐系统应用,其结合用户之间的信任关系对用户进行项目推荐.但之前的研究一般假定用户之间的信任值固定,无法对用户信任及偏好的动态变化做出及时响应,进而影响推荐效果.实际上,用户接受推荐后,当实际评价高于心理预期时,体验用户对推荐者的信任将增加,反之则下降.针对此问题,并且重点考虑用户间信任变化过程及信任的动态性,提出了一种结合强化学习的用户信任增强方法.因此,使用最小均方误差算法研究评价差值对用户信任的动态影响,利用强化学习方法deep q-learning(DQN)模拟推荐者在推荐过程中学习用户偏好进而提升信任值的过程,并且提出了一个多项式级别的算法来计算信任值和推荐,可激励推荐者学习用户的偏好,并使用户对推荐者的信任始终保持在较高程度.实验表明,方法可快速响应用户偏好的动态变化,当其应用于推荐系统时,相较于其他方法,可为用户提供更及时、更准确的推荐结果.






[1]卢海峰, 顾春华, 罗飞, 丁炜超, 杨婷, 郑帅. 基于深度强化学习的移动边缘计算任务卸载研究[J]. 计算机研究与发展, 2020, 57(7): 1539-1554.
[2]范浩, 徐光平, 薛彦兵, 高赞, 张桦. 一种基于强化学习的混合缓存能耗优化与评价[J]. 计算机研究与发展, 2020, 57(6): 1125-1139.
[3]刘辰屹, 徐明伟, 耿男, 张翔. 基于机器学习的智能路由算法综述[J]. 计算机研究与发展, 2020, 57(4): 671-687.
[4]王桂芝, 吕光宏, 贾吾财, 贾创辉, 张建申. 机器学习在SDN路由优化中的应用研究综述[J]. 计算机研究与发展, 2020, 57(4): 688-698.
[5]吴金金, 刘全, 陈松, 闫岩. 一种权重平均值的深度双Q网络方法[J]. 计算机研究与发展, 2020, 57(3): 576-589.
[6]陈红名,刘全,闫岩,何斌,姜玉斌,张琳琳. 基于经验指导的深度确定性多行动者-评论家算法[J]. 计算机研究与发展, 2019, 56(8): 1708-1720.
[7]张文韬,汪璐,程耀东. 基于强化学习的Lustre文件系统的性能调优[J]. 计算机研究与发展, 2019, 56(7): 1578-1586.
[8]章晓芳,周倩,梁斌,徐进. 一种自适应的多臂赌博机算法[J]. 计算机研究与发展, 2019, 56(3): 643-654.
[9]张凯峰,俞扬. 基于逆强化学习的示教学习方法综述[J]. 计算机研究与发展, 2019, 56(2): 254-261.
[10]白辰甲,刘鹏,赵巍,唐降龙. 基于TD-error自适应校正的深度Q学习主动采样方法[J]. 计算机研究与发展, 2019, 56(2): 262-280.
[11]王金迪,童向荣. 融合非稀疏信任网络的时间底限变动的智能体协商模型[J]. 计算机研究与发展, 2019, 56(12): 2612-2622.
[12]杜瑞忠,刘妍,田俊峰. 物联网中基于智能合约的访问控制方法[J]. 计算机研究与发展, 2019, 56(10): 2287-2298.
[13]朱斐,吴文,刘全,伏玉琛. 一种最大置信上界经验采样的深度Q网络方法[J]. 计算机研究与发展, 2018, 55(8): 1694-1705.
[14]王倩,聂秀山,尹义龙. 密集异构网络中基于强化学习的流量卸载算法[J]. 计算机研究与发展, 2018, 55(8): 1706-1716.
[15]任彦冰,李兴华,刘海,程庆丰,马建峰. 基于区块链的分布式物联网信任管理方法研究[J]. 计算机研究与发展, 2018, 55(7): 1462-1478.





PDF全文下载地址:

https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4198
相关话题/计算机 推荐 网络 智能 系统

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • RGNE:粗糙粒化的网络嵌入式重叠社区发现方法
    赵霞1,张泽华1,张晨威2,李娴11(太原理工大学信息与计算机学院太原030024);2(伊利诺伊大学芝加哥分校计算机科学学院美国芝加哥60607)(zhaoxiazzzz@163.com)出版日期:2020-06-01基金资助:国家自然科学基金项目(61503273,61702356);国家留学基 ...
    本站小编 Free考研考试 2022-01-01
  • 算礼:探索计算系统的可分析抽象
    徐志伟,王一帆,赵永威,李春典(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190)(中国科学院大学北京100049)(zxu@ict.ac.cn)出版日期:2020-05-01基金资助:国家重点研发计划项目(2016YFB1000200);国家自然科学基金重点项目(61532 ...
    本站小编 Free考研考试 2022-01-01
  • 融合多元信息的多关系社交网络节点重要性研究
    罗浩1,闫光辉1,张萌1,包峻波1,李俊成1,刘婷1,杨波2,魏军21(兰州交通大学电子与信息工程学院兰州730070);2(国网甘肃省电力公司信通公司兰州730050)(luoh382@163.com)出版日期:2020-05-01基金资助:国家自然科学基金项目(61662066,61163010 ...
    本站小编 Free考研考试 2022-01-01
  • 基于多级注意力机制网络的app流行度预测
    张艺璇,郭斌,刘佳琪,欧阳逸,於志文(西北工业大学计算机学院西安710029)(zhangyixuan2014@mail.nwpu.edu.cn)出版日期:2020-05-01基金资助:国家重点研发计划项目(2017YFB1001803);国家自然科学基金项目(61772428,61725205)a ...
    本站小编 Free考研考试 2022-01-01
  • 分布式监测系统中的重复元素检测机制
    陆乐1,孙玉娥2,3,黄河1,3,汪润枝1,曹振11(苏州大学计算机科学与技术学院江苏苏州215131);2(苏州大学轨道交通学院江苏苏州215137);3(中国科学技术大学苏州研究院江苏苏州215123)(20175227062@stu.suda.edu.cn)出版日期:2020-05-01基金资 ...
    本站小编 Free考研考试 2022-01-01
  • 2020数据驱动网络专题前言
    崔勇1,马华东2,陈凯3,俞敏岚4,刘洪强51(清华大学北京100084);2(北京邮电大学北京100876);3(香港科技大学香港999077);4(哈佛大学美国马萨诸塞州剑桥市02138);5(阿里巴巴杭州310023)出版日期:2020-04-01Online:2020-04-01摘要/Abs ...
    本站小编 Free考研考试 2022-01-01
  • 基于机器学习的智能路由算法综述
    刘辰屹,徐明伟,耿男,张翔(清华大学计算机科学与技术系北京100084)(liucheny19@mails.tsinghua.edu.cn)出版日期:2020-04-01基金资助:国家自然科学基金项目(61625203,61832013);国家重点研发计划项目(2017YFB0801701)ASur ...
    本站小编 Free考研考试 2022-01-01
  • 异构YANG模型驱动的网络领域知识图谱构建
    董永强1,3,王鑫1,刘永博1,杨望2,31(东南大学计算机科学与工程学院南京211189);2(东南大学网络空间安全学院南京211189);3(计算机网络和信息集成教育部重点实验室(东南大学)南京211189)(dongyq@seu.edu.cn)出版日期:2020-04-01基金资助:国家自然科 ...
    本站小编 Free考研考试 2022-01-01
  • 基于随机博弈与禁忌搜索的网络防御策略选取
    孙骞1,2,薛雷琦2,高岭2,3,王海2,王宇翔11(西北大学现代教育技术中心西安710127);2(西北大学信息科学与技术学院新型网络智能信息服务国家地方联合工程研究中心西安710127);3(西安工程大学计算机科学学院新型网络智能信息服务国家地方联合工程研究中心西安710600)(sq@nwu. ...
    本站小编 Free考研考试 2022-01-01
  • 基于深度神经网络burst特征分析的网站指纹攻击方法
    马陈城1,2,杜学绘1,2,曹利峰1,2,吴蓓31(战略支援部队信息工程大学郑州450001);2(河南省信息安全重点实验室(战略支援部队信息工程大学)郑州450001);3(61497部队北京100000)(machencheng07@foxmail.com)出版日期:2020-04-01基金资助 ...
    本站小编 Free考研考试 2022-01-01