删除或更新信息,请邮件至freekaoyan#163.com(#换成@)

基于Stackelberg策略的多Agent强化学习警力巡逻路径规划

本站小编 Free考研考试/2021-12-21

本文二维码信息
二维码(扫一下试试看!)
基于Stackelberg策略的多Agent强化学习警力巡逻路径规划
Police Patrol Path Planning Using Stackelberg Equilibrium Based Multiagent Reinforcement Learning
投稿时间:2015-04-15
DOI:10.15918/j.tbit1001-0645.2017.01.019
中文关键词:巡逻路线规划Stackelberg强均衡策略多agent强化学习
English Keywords:patrol path planningstrong Stackelberg equilibriummultiagentreinforcement learning
基金项目:中国人民公安大学基本科研业务费项目(2014JKF01132)
作者单位
解易中国人民公安大学 网络安全保卫学院, 北京 100038
顾益军中国人民公安大学 网络安全保卫学院, 北京 100038
摘要点击次数:1028
全文下载次数:1937
中文摘要:
为解决现有的巡逻路径规划算法仅仅能够处理双人博弈和忽略攻击者存在的问题,提出一种新的基于多agent的强化学习算法.在给定攻击目标分布的情况下,规划任意多防御者和攻击者条件下的最优巡逻路径.考虑到防御者与攻击者选择策略的非同时性,采用了Stackelberg强均衡策略作为每个agent选择策略的依据.为了验证算法,在多个巡逻任务中进行了测试.定量和定性的实验结果证明了算法的收敛性和有效性.
English Summary:
The patrol path planning has been simplified with state-of-art algorithm into two-person game in grid world, ignoring the existence of attackers. In order to deal with the problem of realistic patrol path planning, a novel multi-agent reinforcement learning algorithm was proposed. An optimum patrol path was planned in a circumstance that multiple defenders and attackers formed the multi-target configuration. Considering the asynchronism of the actions taken by many defender and attacker, a strong Stackelberg equilibrium was taken as the action selection of players in the proposed algorithm. To verify the proposed algorithm, several patrol missions were tested. The qualitative and quantitative test results prove the convergence and effectiveness of the algorithm.
查看全文查看/发表评论下载PDF阅读器
相关话题/中国人民公安大学 规划 北京 中文 路线

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 基于动态规划的自动向量化方法
    吕鹏伟,刘从新,赵一明,沈绪榜.基于动态规划的自动向量化方法[J].北京理工大学学报(自然科学版),2017,37(5):544~550.LPeng-wei,LIUCong-xin,ZHAOYi-ming,SHENXu-bang.Auto-VectorizationMethodBasedonDyna ...
    本站小编 Free考研考试 2021-12-21
  • 基于蚁群算法和遗传规划的跨单元调度方法
    李冬妮,贾晓宇,陈琳,郑丹,陶军.基于蚁群算法和遗传规划的跨单元调度方法[J].北京理工大学学报(自然科学版),2017,37(7):704~710.LIDong-ni,JIAXiao-yu,CHENLin,ZHENGDan,TAOJun.IntercellSchedulingApproachBas ...
    本站小编 Free考研考试 2021-12-21
  • 基于深度学习的中文地名识别研究
    沈思,朱丹浩.基于深度学习的中文地名识别研究[J].北京理工大学学报(自然科学版),2017,37(11):1150~1155.SHENSi,ZHUDan-hao.ChinesePlaceNameRecognitionBasedonDeepLearning[J].TransactionsofBeij ...
    本站小编 Free考研考试 2021-12-21
  • 秦汉王朝对乡里族姓的规划与管理
    秦汉王朝对乡里族姓的规划与管理北京师范大学历史学院出版日期:2021-11-16发布日期:2021-11-26作者简介:凌文超,北京师范大学历史学院副教授AStudyonArrangingandGoverningHouseholdsattheXiangandLiLevelsduringtheQina ...
    本站小编 Free考研考试 2021-12-21
  • 自动驾驶法律准入问题研究:路线、挑战与方案
    自动驾驶法律准入问题研究:路线、挑战与方案中国人民大学法学院出版日期:2021-11-16发布日期:2021-11-26作者简介:王莹,中国人民大学法学院刑事法律科学研究中心、未来法治研究院副教授基金资助:*本文系国家社会科学基金项目“信息刑法时代信息犯罪归责与治理模式研究”(18BFX101)阶段 ...
    本站小编 Free考研考试 2021-12-21
  • 北京低边界层雨滴谱的垂直分布特征
    北京低边界层雨滴谱的垂直分布特征唐继顺1,2,刘晓阳1,?,刘均慧1,李爱国3,王鹏飞41.北京大学物理学院大气与海洋科学系,北京1008712.91197部队,青岛2664053.中国科学院大气物理研究所大塔分部,北京1000204.北京智阳科技有限公司,北京100020收稿日期:2020-12- ...
    本站小编 Free考研考试 2021-12-20
  • 北京市公共服务设施可达性及其对住房价格的影响
    北京市公共服务设施可达性及其对住房价格的影响李然好,龚世泽,高勇?北京大学地球与空间科学学院,北京100871收稿日期:2020-08-13修回日期:2020-12-02出版日期:2021-09-20基金资助:国家自然科学基金(41971331)资助AccessibilityofPublicServ ...
    本站小编 Free考研考试 2021-12-20
  • 冬奥会申办成功对北京旅游目的地感知形象的影响
    冬奥会申办成功对北京旅游目的地感知形象的影响丛丽1,?,徐琳琳1,2,3,方小雨11.北京林业大学园林学院旅游管理系,北京1000832.中国科学院地理科学与资源研究所,中国科学院区域可持续发展分析与模拟重点实验室,北京1001013.中国科学院大学资源与环境学院,北京100049收稿日期:2020 ...
    本站小编 Free考研考试 2021-12-20
  • 中文机器阅读理解的鲁棒性研究
    中文机器阅读理解的鲁棒性研究李烨秋1,唐竑轩1,钱锦1,邹博伟1,2,洪宇1,?1.苏州大学计算机科学与技术学院,苏州2150002.新加坡资讯通信研究院,新加坡138632收稿日期:2020-06-08修回日期:2020-08-14出版日期:2021-01-20基金资助:国家自然科学基金(6170 ...
    本站小编 Free考研考试 2021-12-20
  • 基于Transformer局部信息及语法增强架构的中文拼写纠错方法
    基于Transformer局部信息及语法增强架构的中文拼写纠错方法段建勇,袁阳,王昊?北方工业大学信息学院,北京100043收稿日期:2020-05-29修回日期:2020-08-13出版日期:2021-01-20基金资助:国家自然科学基金(61972003,61672040)资助ChineseSp ...
    本站小编 Free考研考试 2021-12-20