基于深度强化学习的虚拟网络功能部署及迁移优化算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:cqwsxwsx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着用户业务需求的多样化以及移动终端设备爆炸式增长,传统的网络架构明显已经不适用于当前的网络发展。在5G网络时代,采用网络功能虚拟化(Network Function Virtualization,NFV)技术和软件定义网络(Software Define Network,SDN)技术相结合,将每种网络业务请求通过一系列虚拟网络功能(Virtualized Network Function,VNF)处理,这些VNF按特定的顺序连接起来构成服务功能链(Service Function Chain,SFC),进而为不同业务提供服务,因此本文重点研究了虚拟化网络中VNF的部署和迁移问题,论文的主要研究工作和创新点总结如下:1.针对NFV/SDN架构下,服务功能链的资源需求动态变化引起的VNF迁移优化问题,本文提出了一种基于深度强化学习的VNF迁移优化算法。首先,在物理底层CPU、带宽资源和SFC端到端时延约束下,建立基于马尔科夫决策过程(Markov Decision Process,MDP)的随机优化模型,该模型联合优化网络能耗和SFC端到端时延。其次,由于本文的状态空间和动作空间是连续值集合,提出一种基于深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)的VNF智能迁移算法,从而得到近似最优的VNF迁移策略。仿真结果表明,该算法可以实现网络能耗和SFC端到端时延的折中,并提高物理网络的资源利用率。2.针对NFV/SDN架构下,网络服务请求动态到达引起的SFC部署优化问题,提出了一种基于改进深度强化学习的VNF部署优化算法。首先,建立了MDP的随机优化模型,完成SFC的在线部署以及资源的动态分配,该模型联合优化SFC部署成本和时延成本,同时受限于SFC的时延以及物理资源约束。其次,在VNF部署和资源分配的过程中,存在状态和动作空间过大,以及状态转移概率未知等问题,提出了一种基于深度强化学习的VNF智能部署算法,从而得到近似最优的VNF部署策略和资源分配策略。最后,针对深度强化学习代理通过?贪婪策略进行动作探索和利用,造成算法收敛速度慢等问题,提出了一种基于值函数差异的动作探索和利用方法,并进一步采用双重经验回放池,解决经验样本利用率低的问题。仿真结果表示,该算法能够加快神经网络收敛速度,并且可以同时优化SFC部署成本和SFC端到端时延。
其他文献
本文分析比较不同烧结烟气脱硫方法,阐明密相塔干法脱硫工艺适用于首钢矿业公司360平烧结烟气脱硫项目,并总结了密相塔干法脱硫工艺在首钢矿业公司的改进应用措施。通过实施
文章突出以读者为中心的图书馆管理和服务,阐述建立行为属性表分析不同类型读者行为的典型特征和规律及管理措施,重点探讨以读者为中心的图书馆管理和服务流程的优化,并结合
农民相互合作的动力来源于对潜在利润的追求,潜在利润能否实现受社员异质性和外部环境的双重影响。社员异质性降低是合作社实现"弱者的联合"的内部条件,市场环境、政策环境、
研究了HMB和CMB两种光学纤维面板的成分差异。按其比值关系:光纤面板CMB应特别增加TiO2;注意增加Ln2O3的量,减少SiO2、Nb2O5的量;可酌量增加一点BaO。
《3~6岁儿童学习与发展指南》颁布以来,让我们深刻地体会到游戏对幼儿的影响。但我们目前的现状是重知识教育,而忽视了游戏的重要性。本文从游戏对幼儿认知的发展和游戏对幼
本文试图通过对传统文人身份、“文人意识”概念的重新梳理与诠释,论证其在新的历史条件下随着文化语境的置换产生价值及形态转换的可能,继而提出“新文人意识”这一概念。笔
目的:(1)研究西宁地区糖尿病和非糖尿病人群患缺铁性贫血时,对糖化血红蛋白的影响(2)方法:纳入2017年1月1日到2019年8月25日间来青海省人民医院就诊的缺铁性贫血患者和处于潜
作者初查了长江船员幽门螺杆菌的感染情况,在145例有慢性胃病的船员中HP感染率为80.69%,100例和35例有慢性胃病岸地工人和机关干部中HP感染率分别为35%和25.71%。船员组与岸地组
1979年10月25日,国际奥委会在日本名古屋通过决议,恢复了中国在奥林匹克大家庭的合法权利,中国开始全面走向国际体育历史的舞台。在重返国际奥委会后,1980年我国首次派团参加
二次供水设施的广泛使用有效缓解了高层建筑供—用水矛盾,已成为城镇供水系统的重要组成部分。但是在二次供水设施处极易发生二次污染,对用户的饮水安全有潜在的威胁。二次供