基于改进深度强化学习的虚拟网络功能部署优化算法

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2022-01-03

唐伦^{1, 2},
贺兰钦^{1, 2,,},
连沁怡³,
谭颀^{1, 2}
1.重庆邮电大学通信与信息工程学院重庆 400065
2.重庆邮电大学移动通信技术重点实验室重庆 400065
3.三峡大学国际交流学院宜昌 443002
基金项目:国家自然科学基金(62071078)，重庆市教委科学技术研究项目(KJZD-M201800601)，重庆市重大主题专项 (cstc2019jscx-zdztzxX0006)

详细信息

作者简介:唐伦：男，1973年生，教授，博士，研究方向为下一代无线通信网络、异构蜂窝网络、软件定义无线网络等
贺兰钦：男，1995年生，硕士生，研究方向为5G网络切片、机器学习算法
谭颀：女，1995年生，硕士生，研究方向为5G网络切片、资源分配、随机优化理论

通讯作者:贺兰钦　719097886@qq.com

中图分类号:TN929.5

计量

文章访问数:473
HTML全文浏览量:177
PDF下载量:76
被引次数:0

出版历程

收稿日期:2020-04-21
修回日期:2021-01-22
网络出版日期:2021-01-29
刊出日期:2021-06-18

Virtual Network Function Placement Optimization Algorithm Based on Improve Deep Reinforcement Learning

Lun TANG^{1, 2},
Lanqin HE^{1, 2,,},
Qinyi LIAN³,
Qi TAN^{1, 2}
1. School of Communication and Information Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, China
2. Key Laboratory of Mobile Communications Technology, Chongqing University of Posts and Telecommunications, Chongqing 400065, China
3. College of International Communications, China Three Gorges University, Yichang 443002, China
Funds:The National Natural Science Foundation of China (62071078), The Science and Technology Research Program of Chongqing Municipal Education Commission (KJZD-M201800601), The Major Theme Special Projects of Chongqing (cstc2019jscx-zdztzxX0006)

摘要
摘要:针对网络功能虚拟化/软件定义网络 (NFV/SDN)架构下，网络服务请求动态到达引起的服务功能链(SFC)部署优化问题，该文提出一种基于改进深度强化学习的虚拟网络功能(VNF)部署优化算法。首先，建立了马尔科夫决策过程 (MDP)的随机优化模型，完成SFC的在线部署以及资源的动态分配，该模型联合优化SFC部署成本和时延成本，同时受限于SFC的时延以及物理资源约束。其次，在VNF部署和资源分配的过程中，存在状态和动作空间过大，以及状态转移概率未知等问题，该文提出了一种基于深度强化学习的VNF智能部署算法，从而得到近似最优的VNF部署策略和资源分配策略。最后，针对深度强化学习代理通过ε贪婪策略进行动作探索和利用，造成算法收敛速度慢等问题，提出了一种基于值函数差异的动作探索和利用方法，并进一步采用双重经验回放池，解决经验样本利用率低的问题。仿真结果表示，该算法能够加快神经网络收敛速度，并且可以同时优化SFC部署成本和SFC端到端时延。
关键词:虚拟网络功能/
深度强化学习/
服务功能链端到端时延/
服务功能链部署成本
Abstract:Considering the problem of Service Function Chain (SFC) placement optimization caused by the dynamic arrival of network service requests under the Network Function Virtualization/Software Defined Network (NFV/SDN) architecture, a Virtual Network Function (VNF) placement optimization algorithm based on improved deep reinforcement learning is proposed. Firstly, a stochastic optimization model of Markov Decision Process (MDP) is established to jointly optimizes SFC placement cost and delay cost, and is constrained by the delay of SFC, as well as the resources of common server Central Processing Unit (CPU) and physical link bandwidth. Secondly, in the process of VNF placement and resource allocation, there are problems such as too large state space, high dimension of action space, and unknown state transition probability. A VNF intelligent placement algorithm based on deep reinforcement learning is proposed to obtain an approximately optimal VNF placement strategy and resource allocation strategy. Finally, considering the problems of deep reinforcement learning agent's action exploration and utilization through ε greedy strategy, resulting in low learning efficiency and slow convergence speed, a method of action exploration and utilization based on the difference of value function is proposed, and further adopts dual experience playback pool to solve the problem of low utilization of empirical samples. Simulation results show that the algorithm can converge quickly, and it can optimize SFC placement cost and SFC end-to-end delay.
Key words:Virtual Network Function(VNF)/
Deep reinforcement learning/
Service Function Chain (SFC) end-to-end delay/
Service Function Chain (SFC) placement cost

PDF全文下载地址:

https://jeit.ac.cn/article/exportPdf?id=7c3c80bd-8e3e-4e88-94e9-8095f059ebff

相关话题/网络 优化 资源 重庆邮电大学 软件

领限时大额优惠券,享本站正版考研考试资料!
优惠券领取后72小时内有效，10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材，产品类型包含电子书、题库、全套资料以及视频，无论您是考研复习、考证刷题，还是考前冲刺等，不同类型的产品可满足您学习上的不同需求。 ...
考试优惠券本站小编 Free壹佰分学习网 2022-09-19
基于异步优势演员-评论家学习的服务功能链资源分配算法
唐伦,贺小雨,,王晓,谭颀,胡彦娟,陈前斌1.重庆邮电大学通信与信息工程学院重庆4000652.重庆邮电大学移动通信重点实验室重庆400065基金项目:重庆市教委科学技术研究项目(KJZD-M20180601)，重庆市重大主题专项(cstc2019jscx-zdztzxX0006)详细信息作者简介: ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
滤波器组多载波系统中基于双层优化的峰均比抑制算法
赵辉,,王薇,莫谨荣,孙振江,张天骐1.重庆邮电大学通信与信息工程学院重庆4000652.重庆邮电大学信号与信息处理重庆市重点实验室重庆400065基金项目:国家自然科学基金(61671095)详细信息作者简介:赵辉：女，1980年生，教授，硕士生导师，研究方向为信号与图像处理、深空光通信王薇：女， ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于多尺度增强网络的人群计数方法
徐涛,段仪浓,杜佳浩,刘才华,1.中国民航大学计算机科学与技术学院天津3003002.中国民航大学中国民航信息技术科研基地天津300300基金项目:天津市自然科学基金(18JCYBJC85100)，中央高校基本科研业务基金项目中国民航大学专项(3122018C024)，中国民航大学科研启动项目(20 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
杂波背景下基于交替方向乘子法的低截获频控阵MIMO雷达收发联合优化方法
巩朋成1,2,,,王兆彬1,谭海明1,王文钦21.湖北工业大学太阳能高效利用及储能运行控制湖北省重点实验室武汉4300682.电子科技大学通信与信息工程学院成都611731基金项目:国家自然科学基金(62071172)，湖北省自然科学基金(2018CFB545)，太阳能高效利用及储能运行控制湖北省重 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
信号相关杂波背景中极化雷达发射波形优化
孙挺1,程旭2,,1.周口师范学院网络工程学院周口4660002.中山大学电子与通信工程学院深圳518107基金项目:国家自然科学基金(61801527)，深圳市科技计划项目(KQTD20190929172704911)，电子信息系统复杂电磁环境效应国家重点实验室开放基金（CEMEE2021K020 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于NOMA的无线携能D2D通信鲁棒能效优化算法
徐勇军1,2,,,刘子腱1,李国权1,陈前斌1,林金朝11.重庆邮电大学通信与信息工程学院重庆4000652.西安邮电大学陕西省信息通信网络及安全重点实验室西安710121基金项目:国家自然科学基金(61601071)，重庆市自然科学基金(cstc2019jcyj-xfkxX0002)，陕西省信息通 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于效用最大化的无线可充电传感器网络有向充电调度方案
王杨1,,,张鑫1,赵传信1,方群1,艾世成21.安徽师范大学计算机与信息学院芜湖2410022.东南大学计算机科学与工程学院南京211189基金项目:国家自然科学基金(61871412)，安徽省自然科学基金重点项目(KJ2019A0938)，安徽省社科规划基金(AHSKY2017D42)，安徽高校 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于卡口上下文和深度置信网络的车辆轨迹预测模型研究
李暾1,,,朱耀堃1,吴欣虹1,肖云鹏1,吴海峰21.重庆邮电大学软件工程学院重庆4000652.海口市气象局海口571199基金项目:国家自然科学基金(61772098)，重庆市教委科技研究项目(KJQN201800641)，重庆邮电大学博士高端人才项目(BYJS2017004)，重庆市技术创新与 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于节点冗余容量动态控制的复杂网络鲁棒性研究
张震1,,,刘迪洋1,张进2,谢记超11.战略支援部队信息工程大学郑州4500002.网络通信与安全紫金山实验室南京210000基金项目:国家自然科学基金(61802429,61872382,61521003)，国家重点研发计划(2017YFB0803201,2017YFB0803204)详细信息作 ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03
基于用户个性化服务质量的蜂窝车联网与车载自组织网异构车联网资源分配方法
韩珍珍,周末,刘恩慧,徐川,赵国锋,重庆邮电大学通信与信息工程学院重庆400065基金项目:国家重点研发计划(2018YBF1800301,2018YBF1800304)，重庆市研究生科研创新项目(CYB18175,BYJS201803)，重庆市技术创新与应用发展专项重大主题专项(cstc2019j ...
中科院空天信息创新研究院本站小编 Free考研考试 2022-01-03