(中国人民解放军战略支援部队信息工程大学 郑州 450001) (624519905@qq.com)
出版日期:
2019-05-01基金资助:
国家“八六三”高技术研究发展计划基金项目(2014AA7116082,2015AA7116040)Network Defense Decision-Making Method Based on Stochastic Game and Improved WoLF-PHC
Yang Junnan, Zhang Hongqi, Zhang Chuanfu(Zhengzhou Information Science and Technology Institute, Zhengzhou 450001)
Online:
2019-05-01摘要/Abstract
摘要: 当前运用随机博弈的网络攻防分析方法采用完全理性假设,但在实际的网络攻防对抗中攻防双方很难达到完全理性的高要求,降低了现有方法的准确性和指导价值.从网络攻防对抗实际出发,分析有限理性对攻防随机博弈的影响,在有限理性约束下构建攻防随机博弈模型.针对网络状态爆炸的问题,提出一种基于攻防图的网络状态与攻防动作提取方法,有效压缩了博弈状态空间.在上述基础上引入强化学习中的WoLF-PHC算法进行有限理性随机博弈分析并设计了具有在线学习能力的防御决策算法.该算法通过学习可以获得针对当前攻击者的最优防御策略,所得策略在有限理性下优于现有攻防随机博弈模型的纳什均衡策略.通过引入资格迹改进WoLF-PHC算法,进一步提高了防御者的学习速度.通过实验验证了所提方法的有效性与先进性.
参考文献
相关文章 2
[1] | 孙骞, 薛雷琦, 高岭, 王海, 王宇翔. 基于随机博弈与禁忌搜索的网络防御策略选取[J]. 计算机研究与发展, 2020, 57(4): 767-777. |
[2] | 姜伟, 方滨兴, 田志宏, 张宏莉,. 基于攻防随机博弈模型的防御策略选取研究[J]. , 2010, 47(10): 1714-1723. |
PDF全文下载地址:
https://crad.ict.ac.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=3922