通信资源调度对称MARL问题策略估计误差分析
张昕然, 孙松林1. 北京邮电大学 信息与通信工程学院, 北京 100876;
2. 北京邮电大学 可信分布式计算与服务教育部重点实验室, 北京 100876;
3. 北京邮电大学 移动互联网安全技术国家工程实验室, 北京 100876
收稿日期:
2018-06-20出版日期:
2019-04-28通讯作者:
孙松林(1974-),男,教授,博士生导师,E-mail:slsun@bupt.edu.cn.E-mail:slsun@bupt.edu.cn作者简介:
张昕然(1987-),男,博士生.基金资助:
国家自然科学基金项目(61471066)Policy Estimation Error Analysis for Symmetrical MARL Problem in Communication Resource Scheduling
ZHANG Xin-ran, SUN Song-lin1. School of Information and Communication Engineering, Beijing University of Posts and Telecommunications, Beijing 100876, China;
2. Key Laboratory of Trustworthy Distributed Computing and Service(Ministry of Education), Beijing University of Posts and Telecommunications, Beijing 100876, China;
3. National Engineering Laboratory for Mobile Network Security, Beijing University of Posts and Telecommunications, Beijing 100876, China
Received:
2018-06-20Online:
2019-04-28摘要/Abstract
摘要: 针对通信资源调度场景下的多智能体强化学习(MARL)问题,提出了对称MARL问题以及三类对称性的定义和条件,并定义了策略融合和策略误差;针对强对称MARL问题,定义了三类评价指标,并对策略估计误差进行分析,提出了强对称MARL问题的策略误差定理及推论.针对无线通信的接入控制问题建立了MARL问题,仿真结果验证了强对称MARL问题策略估计误差的特性.结果表明,可以使用低复杂度的MARL子问题对高复杂度的强对称MARL问题进行策略估计,且策略估计误差和对网络性能的影响均较小.
中图分类号:
TN929.53
引用本文
张昕然, 孙松林. 通信资源调度对称MARL问题策略估计误差分析[J]. 北京邮电大学学报, doi: 10.13190/j.jbupt.2018-121.
ZHANG Xin-ran, SUN Song-lin. Policy Estimation Error Analysis for Symmetrical MARL Problem in Communication Resource Scheduling[J]. JOURNAL OF BEIJING UNIVERSITY OF POSTS AND TELECOM, doi: 10.13190/j.jbupt.2018-121.
PDF全文下载地址:
https://journal.bupt.edu.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=4623