论文部分内容阅读
近年来,网络技术发展迅猛,终端设备急剧增多,随之到来的是流量和用户的扩增,同时用户对网络的要求也变得更高了。针对此类问题,命名数据网络(NDN)作为一种未来网络架构被提出。NDN和当前主流的网络架构不同,它把内容和终端位置分离开来,通过订阅/发布的形式来提供各种服务。这样则将用户的关注点从终端改向内容,即用户只需要知道自己想要的内容到底是什么,而不是内容具体在哪里。NDN路由器是命名数据网络正常运行的核心设备,用于数据转发、拥塞控制、流量控制、带宽控制和缓存控制等功能。NDN的转发平面则使NDN路由器能够独立选择下一个跳转发兴趣包,NDN的转发策略是路由器中的决策者--决定接收到的兴趣包是否转发,在什么时间转发,以及向哪个端口转发。因此转发策略的研究对NDN中自适应高效的数据传输起着非常重要的作用。本文主要工作有如下几点:1、传统的NDN转发策略大多都是基于一定的理论模型来设计,其中存在很多假设和对网络模型的简化,这无法全面的模拟网络的真实环境。基于此现象,本文提出了一种基于深度增强学习的动态自适应智能转发策略(DRL-based)。该智能转发策略将NDN转发平台和深度强化学习算法融合在一起,把转发平面分为训练阶段和转发阶段,以智能算法指导NDN兴趣包的转发。在训练阶段,该策略会搜集网络状态信息和兴趣包内容信息作为特征进行训练,并将其结果用于转发阶段。2、在NDN中,兴趣包是实时大规模转发的,所以智能转发算法也应该有高速处理转发的能力。如果单纯的使用深度增强学习算法,将会花费大量时间用于获取转发决策,这会影响转发的效率。所以本文结合兴趣包转发的特点,引入了临时转发表,对基础的智能转发策略进行优化,加速了智能转发策略的决策。改进的自适应智能转发策略(DRL-W)能很好的感知网络状态和内容信息,提高了兴趣包转发效率。3、本文在现有的实验设备下搭建了一定规模的实际平台,并在其上成功部署了基于深度强化学习的动态自适应转发策略。同时,为了评估自适应智能转发策略的性能,本文选取了NDN中4种流行的转发策略作为对照策略(Best-Route策略,Multi-cast策略,NCC策略和ASF策略),设计并实施了相应的对比实验。实验结果显示,本文提出的基于深度增强学习的动态自适应智能转发策略在提高兴趣包满足率和端口吞吐量、降低RTT等发面具有更好的性能。