李宏娟1, 2, 3,,,
吴大鹏1, 2, 3,
李红霞4
1.重庆邮电大学通信与信息工程学院 ??重庆 ??400065
2.重庆高校市级光通信与网络重点实验室 重庆 ??400065
3.泛在感知与互联重庆市重点实验室 重庆 ??400065
4.中国联合网络通信有限公司重庆市分公司 重庆 ??401123
基金项目:国家自然科学基金(61871062,61771082),重庆市高校创新团队建设计划资助项目(CXTDX201601020)
详细信息
作者简介:王汝言:男,1969年生,教授,博士,研究方向为泛在网络、多媒体信息处理等
李宏娟:女,1993年生,硕士生,研究方向为虚拟化、无线传感网络
吴大鹏:男,1979年生,教授,博士,研究方向为泛在无线网络、无线网络服务质量控制等
李红霞:女,1969年生,高级工程师,研究方向为光无线融合网络、无线传感网络
通讯作者:李宏娟 ilihj@foxmail.com
中图分类号:TP393计量
文章访问数:1378
HTML全文浏览量:728
PDF下载量:72
被引次数:0
出版历程
收稿日期:2019-01-07
修回日期:2019-04-16
网络出版日期:2019-05-22
刊出日期:2019-12-01
Semi-Markov Decision Process-based Resource Allocation Strategy for Virtual Sensor Network
Ruyan WANG1, 2, 3,Hongjuan LI1, 2, 3,,,
Dapeng WU1, 2, 3,
Hongxia LI4
1. School of Communication and Information Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, China
2. Optical Communication and Network Key Laboratory of Chongqing, Chongqing 400065, China
3. Key Laboratory of Ubiquitous Sensing and Networking in Chongqing, Chongqing 400065, China
4. Chongqing Branch, China Unicom, Chongqing 401123, China
Funds:The National Natural Science Foundation of China (61871062, 61771082), The Chongqing Funded Project of Chongqing University Innovation Team Construction (CXTDX201601020)
摘要
摘要:针对传统无线传感网络(WSN)中资源部署与特定任务的耦合关系密切,造成较低的资源利用率,进而给资源提供者带来较低的收益问题,根据虚拟传感网络请求(VSNR)的动态变化情况,该文提出虚拟传感网络(VSN)中基于半马尔科夫决策过程(SMDP)的资源分配策略。定义VSN的状态集、行为集、状态转移概率,考虑传感网能量受限以及完成VSNR的时间,给出奖赏函数的表达式,并使用免模型强化学习算法求解特定状态下的行为,从而最大化网络资源提供者的长期收益。数值结果表明,该文的资源分配策略能有效提高传感网资源提供者的收益。
关键词:虚拟传感网络/
资源分配/
半马尔科夫决策过程
Abstract:The close relationship between resource deployment and specific tasks in traditional Wireless Sensor Network(WSN) leads to low resource utilization and revenue. According to the dynamic changes of Virtual Sensor Network Request(VSNR), the resource allocation strategy based on Semi-Markov Decision Process(SMDP) is proposed in Virtual Sensor Network(VSN). Then, difining the state, action, and transition probability of the VSN, the expected reward is given by considering the energy and time to complete the VSNR, and the model-free reinforcement learning approach is used to maximize the long-term reward of the network resource provider. The numerical results show that the resource allocation strategy of this paper can effectively improve the revenue of the sensor network resource providers.
Key words:Virtual Sensor Network(VSN)/
Resource allocation/
Semi-Markov Decision Process(SMDP)
PDF全文下载地址:
https://jeit.ac.cn/article/exportPdf?id=d906184b-5623-45d2-ba3b-4c22be4fc494