二维码(扫一下试试看!) | 基于Stackelberg策略的多Agent强化学习警力巡逻路径规划 | Police Patrol Path Planning Using Stackelberg Equilibrium Based Multiagent Reinforcement Learning | 投稿时间:2015-04-15 | DOI:10.15918/j.tbit1001-0645.2017.01.019 | 中文关键词:巡逻路线规划Stackelberg强均衡策略多agent强化学习 | English Keywords:patrol path planningstrong Stackelberg equilibriummultiagentreinforcement learning | 基金项目:中国人民公安大学基本科研业务费项目(2014JKF01132) | | 摘要点击次数:1028 | 全文下载次数:1937 | 中文摘要: | 为解决现有的巡逻路径规划算法仅仅能够处理双人博弈和忽略攻击者存在的问题,提出一种新的基于多agent的强化学习算法.在给定攻击目标分布的情况下,规划任意多防御者和攻击者条件下的最优巡逻路径.考虑到防御者与攻击者选择策略的非同时性,采用了Stackelberg强均衡策略作为每个agent选择策略的依据.为了验证算法,在多个巡逻任务中进行了测试.定量和定性的实验结果证明了算法的收敛性和有效性. | English Summary: | The patrol path planning has been simplified with state-of-art algorithm into two-person game in grid world, ignoring the existence of attackers. In order to deal with the problem of realistic patrol path planning, a novel multi-agent reinforcement learning algorithm was proposed. An optimum patrol path was planned in a circumstance that multiple defenders and attackers formed the multi-target configuration. Considering the asynchronism of the actions taken by many defender and attacker, a strong Stackelberg equilibrium was taken as the action selection of players in the proposed algorithm. To verify the proposed algorithm, several patrol missions were tested. The qualitative and quantitative test results prove the convergence and effectiveness of the algorithm. | 查看全文查看/发表评论下载PDF阅读器 | |
吕鹏伟,刘从新,赵一明,沈绪榜.基于动态规划的自动向量化方法[J].北京理工大学学报(自然科学版),2017,37(5):544~550.LPeng-wei,LIUCong-xin,ZHAOYi-ming,SHENXu-bang.Auto-VectorizationMethodBasedonDyna ... 北京理工大学科研学术 本站小编 Free考研考试 2021-12-21李冬妮,贾晓宇,陈琳,郑丹,陶军.基于蚁群算法和遗传规划的跨单元调度方法[J].北京理工大学学报(自然科学版),2017,37(7):704~710.LIDong-ni,JIAXiao-yu,CHENLin,ZHENGDan,TAOJun.IntercellSchedulingApproachBas ... 北京理工大学科研学术 本站小编 Free考研考试 2021-12-21沈思,朱丹浩.基于深度学习的中文地名识别研究[J].北京理工大学学报(自然科学版),2017,37(11):1150~1155.SHENSi,ZHUDan-hao.ChinesePlaceNameRecognitionBasedonDeepLearning[J].TransactionsofBeij ... 北京理工大学科研学术 本站小编 Free考研考试 2021-12-21秦汉王朝对乡里族姓的规划与管理北京师范大学历史学院出版日期:2021-11-16发布日期:2021-11-26作者简介:凌文超,北京师范大学历史学院副教授AStudyonArrangingandGoverningHouseholdsattheXiangandLiLevelsduringtheQina ... 中国人民大学科研学术 本站小编 Free考研考试 2021-12-21自动驾驶法律准入问题研究:路线、挑战与方案中国人民大学法学院出版日期:2021-11-16发布日期:2021-11-26作者简介:王莹,中国人民大学法学院刑事法律科学研究中心、未来法治研究院副教授基金资助:*本文系国家社会科学基金项目“信息刑法时代信息犯罪归责与治理模式研究”(18BFX101)阶段 ... 中国人民大学科研学术 本站小编 Free考研考试 2021-12-21北京低边界层雨滴谱的垂直分布特征唐继顺1,2,刘晓阳1,?,刘均慧1,李爱国3,王鹏飞41.北京大学物理学院大气与海洋科学系,北京1008712.91197部队,青岛2664053.中国科学院大气物理研究所大塔分部,北京1000204.北京智阳科技有限公司,北京100020收稿日期:2020-12- ... 北京大学科研学术 本站小编 Free考研考试 2021-12-20北京市公共服务设施可达性及其对住房价格的影响李然好,龚世泽,高勇?北京大学地球与空间科学学院,北京100871收稿日期:2020-08-13修回日期:2020-12-02出版日期:2021-09-20基金资助:国家自然科学基金(41971331)资助AccessibilityofPublicServ ... 北京大学科研学术 本站小编 Free考研考试 2021-12-20冬奥会申办成功对北京旅游目的地感知形象的影响丛丽1,?,徐琳琳1,2,3,方小雨11.北京林业大学园林学院旅游管理系,北京1000832.中国科学院地理科学与资源研究所,中国科学院区域可持续发展分析与模拟重点实验室,北京1001013.中国科学院大学资源与环境学院,北京100049收稿日期:2020 ... 北京大学科研学术 本站小编 Free考研考试 2021-12-20中文机器阅读理解的鲁棒性研究李烨秋1,唐竑轩1,钱锦1,邹博伟1,2,洪宇1,?1.苏州大学计算机科学与技术学院,苏州2150002.新加坡资讯通信研究院,新加坡138632收稿日期:2020-06-08修回日期:2020-08-14出版日期:2021-01-20基金资助:国家自然科学基金(6170 ... 北京大学科研学术 本站小编 Free考研考试 2021-12-20基于Transformer局部信息及语法增强架构的中文拼写纠错方法段建勇,袁阳,王昊?北方工业大学信息学院,北京100043收稿日期:2020-05-29修回日期:2020-08-13出版日期:2021-01-20基金资助:国家自然科学基金(61972003,61672040)资助ChineseSp ... 北京大学科研学术 本站小编 Free考研考试 2021-12-20
| |