基于强化学习的机器人认知情感交互模型

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2022-01-03

黄宏程^{1, 2},
李净¹,
胡敏¹,
陶洋^{1, 2,,},
寇兰¹
1.重庆邮电大学通信与信息工程学院重庆 400065
2.重庆市通信软件工程技术研究中心重庆 400065
基金项目:国家重点研发计划(2019YFB2102001)，国家自然科学基金(61871062)

详细信息

作者简介:黄宏程：男，1979年生，副教授，研究方向为认知情感计算、复杂网络与信息传播理论
李净：女，1995年生，硕士生，研究方向为认知情感计算
胡敏：女，1971年生，副教授，研究方向为信息通信网络体系结构、人机交互理论与技术应用
陶洋：男，1964年生，教授，研究方向为人工智能、大数据与计算智能
寇兰：女，1963年生，副教授，研究方向为D2D通信、人机交互理论与技术应用

通讯作者:陶洋　taoyang@cqupt.edu.cn

中图分类号:TP242.6

计量

文章访问数:608
HTML全文浏览量:159
PDF下载量:89
被引次数:0

出版历程

收稿日期:2019-12-24
修回日期:2021-02-22
网络出版日期:2021-03-17
刊出日期:2021-06-18

Cognitive Emotional Interaction Model of Robot Based on Reinforcement Learning

Hongcheng HUANG^{1, 2},
Jing LI¹,
Min HU¹,
Yang TAO^{1, 2,,},
Lan KOU¹
1. School of Communication and Information Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, China
2. Chongqing Engineering Research Center of Communication Software, Chongqing 400065, China
Funds:The National Key Research and Development Project (2019YFB2102001), The National Natural Science Foundation of China (61871062)

摘要
摘要:为增强机器人的认知情感计算能力，依据PAD情感空间建立结合即时反馈和长期趋势的机器人认知情感生成方法，该文提出一种基于强化学习的机器人认知情感交互模型。首先，依据人际交往心理学理论，模拟人类情感生成过程进行类人情感生成，并从中提取相似性、积极性、共情性3个影响因素；其次，利用强化学习的全局统筹特性，建立响应情感状态与上下文长期情感状态之间的关联关系，从而对机器人情感生成过程进行建模；然后，将3个因素纳入模型奖励机制用于交互情感状态评估，实现模型更新并得到最优情感策略；最后，利用所得最优情感策略对应的最优情感状态对机器人情感状态转移概率进行更新，并依据6种基本情感状态在空间中的情感值，将其映射到连续情感空间中得到机器人的最优响应情感值。主客观对比实验表明，该文模型能有效增加机器人情感表达的细腻性、连续性、积极性以及共情性，还能有效降低机器人对外界情感刺激的依赖性，进一步提升和谐友好的人机交互关系。
关键词:PAD情感空间/
强化学习/
情感状态转移/
认知情感生成
Abstract:In order to enhance the cognitive emotional computing ability of robot, a cognitive emotional interaction model of robot based on reinforcement learning is proposed, which combines immediate feedback and long-term trend according to PAD(Pleasure-Arousal-Dominance) emotional space. Firstly, according to the psychology theory of interpersonal communication, the human emotion generation process is simulated to generate human-like emotions, and the three influencing factors of similarity, positivity and empathy are extracted. Secondly, the relationship between the response emotion+ state and the contexted long-term emotion state is established by using the global co-ordination feature of reinforcement learning, so as to model the robot emotion generation process. Then, three factors are incorporated into the model reward mechanism for the evaluate of the interactive emotion state, to update the model and get the optimal emotional strategy. Finally, the optimal emotional state corresponding to the obtained optimal emotional strategy is used to update the robot's emotional state transition probability, and based on the sentiment values of the six basic emotional states in space, them are mapped to continuous emotional space to get the optimal response emotional value of the robot. Subjective and objective comparison experiments show that the model in this paper can effectively increase the delicateness, continuity, positivity and empathy of the robot's emotional expression, and can effectively reduce the robot's dependence on external emotional stimuli, further improving the harmonious and friendly human-computer interaction.
Key words:Pleasure-Arousal-Dominance (PAD) emotion space/
Reinforcement learning/
Emotional state transfer/
Cognitive emotion generation

PDF全文下载地址:

https://jeit.ac.cn/article/exportPdf?id=2808bebb-2d3c-452f-9847-2ed55a336cf2

相关话题/空间 计算 通信 过程 重庆

领限时大额优惠券,享本站正版考研考试资料!
优惠券领取后72小时内有效，10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材，产品类型包含电子书、题库、全套资料以及视频，无论您是考研复习、考证刷题，还是考前冲刺等，不同类型的产品可满足您学习上的不同需求。 ...
考试优惠券本站小编 Free壹佰分学习网 2022-09-19
一种集成式Beta过程最大间隔一类分类方法
张维,杜兰,西安电子科技大学雷达信号处理国家重点实验室西安710071基金项目:国家自然科学基金(61771362)，高等学校学科创新引智计划(B18039)，陕西省重点科技创新团队计划详细信息作者简介:张维：男，1992年生，博士生，研究方向为机器学习及其在雷达目标识别方面的应用杜兰：女，1980 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于NOMA的无线携能D2D通信鲁棒能效优化算法
徐勇军1,2,,,刘子腱1,李国权1,陈前斌1,林金朝11.重庆邮电大学通信与信息工程学院重庆4000652.西安邮电大学陕西省信息通信网络及安全重点实验室西安710121基金项目:国家自然科学基金(61601071)，重庆市自然科学基金(cstc2019jcyj-xfkxX0002)，陕西省信息通 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于<i>k</i>-匿名的隐私保护计算卸载方法
赵星,,彭建华,游伟,陈璐中国人民解放军战略支援部队信息工程大学郑州450001基金项目:国家重点研发计划网络空间安全专项(2016YFB0801605)，国家自然科学基金创新群体项目(61521003)，国家自然科学基金(61801515)详细信息作者简介:赵星：男，1990年生，博士生，研究方向 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
空间行波管输能窗组件贮存失效分析
王国建1,,,赵丽2,陆玉新3,田宏1,石文奇11.中国科学院空天信息创新研究院北京1001902.中国航天科工二院空间工程总体部北京1008543.天津交通职业学院天津300110基金项目:国家自然科学基金(61771454)详细信息作者简介:王国建：男，1980年生，硕士，副研究员，研究方向为微 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
双选择信道中的时间偏移广义频分复用通信
王莹,于释雄,任军,林彬,大连海事大学信息科学技术学院大连116026基金项目:国家重点研发计划(2019YFE0111600)，国家自然科学基金(61971083,51939001)，大连市科技创新基金重点学科重大课题(2019J11CY015)详细信息作者简介:王莹：男，1968年生，教授，研究 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
正交多载波降噪差分混沌键控通信系统
贺利芳,吴雪霜,,张天骐重庆邮电大学通信与信息工程学院重庆400065基金项目:国家自然科学基金(61771085,61371164)，重庆市教育委员会科研项目(KJ1600407,KJQN201900601)详细信息作者简介:贺利芳：女，1979年生，硕士，副教授，研究方向为混沌保密通信、微弱信号 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
旋转相控阵雷达区域威胁度计算及调度技术研究
李纪三,南京船舶雷达研究所南京210000详细信息作者简介:李纪三：男，1981年生，高级工程师，研究方向为相控阵雷达资源调度及数据处理通讯作者:李纪三　lijisan145@163.com中图分类号:TN953计量文章访问数:367HTML全文浏览量:191PDF下载量:40被引次数:0出版历程收 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
一种联合InISAR成像和微多普勒特征提取的空间目标转动矢量估计方法
宫蕊,汪玲,,徐楚,朱岱寅南京航空航天大学雷达成像与微波光子技术教育部重点实验室南京210016基金项目:国家自然科学基金(61871217)，航空科学基金(20182052011)详细信息作者简介:宫蕊：女，1997年生，博士生，主要研究方向为逆合成孔径雷达成像汪玲：女，1977年生，教授，博士生 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于稀疏贝叶斯学习的空间紧邻信号DOA估计算法
王琦森1,2,余华3,2,1,李杰3,,,董超2,4,季飞3,1,陈焱琨2,41.华南理工大学土木与交通学院广州5106402.自然资源部海洋环境探测技术与应用重点实验室广州5103003.华南理工大学电子与信息学院广州5106404.国家海洋局南海调查技术中心广州510300基金项目:国家自然科学 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
非理想条件下基于矢量水听器阵列的一种快速方位估计算法
王彪1,陈宇1,,,徐千驰1,高世杰1,张岑21.江苏科技大学镇江2120022.南京中海达海洋信息技术有限公司南京211800基金项目:国家自然科学基金(52071164)详细信息作者简介:王彪：男，1980年生，教授，研究方向为水声通信陈宇：男，1995年生，硕士生，研究方向为水下目标定位徐千驰 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03