论文部分内容阅读
近年来,学者们将缓存引入到5G通信架构中,通过在终端、基站和核心网网关部署缓存,将热门内容缓存到离用户更近的位置,减少回程链路和骨干网的流量,降低下载时延,提升用户体验。现有的缓存方法大多关注于提高单个位置或是局部网络的缓存命中率,如,基站缓存和终端缓存。然而,终端、基站和核心网三个位置缓存的内容在时空分布上并非孤立存在,而是相互影响,互为补充。为更好地服务移动用户,不仅需要考虑在每个位置部署高效的横向缓存策略,更应部署三个位置的纵向协作缓存策略,从而提升整个网络的缓存效率。其中,内容流行度是缓存决策的重要依据,直接影响缓存性能。现有的缓存策略大多假设内容流行度已知且全网一致。为此,本文提出一种基于推荐系统的内容流行度预测模型,预测内容在不同位置的内容流行度,为实现差异化缓存提供决策依据。在此基础上,提出一种基于深度强化学习的纵向协作缓存策略,实现终端、基站和核心网网关三个位置的纵向协作,主要内容如下:1)针对内容流行度变化速度快,不同位置差异大的问题,提出一种基于推荐系统的内容流行度预测模型。首先,将核心网、基站和用户簇建模为虚拟节点,然后将历史请求信息转化为请求概率,利用聚类算法将内容在不同节点的请求概率转为节点对内容的评分,构建节点-内容评分矩阵。然后,利用交替最小二乘法对节点-内容评分矩阵降维,提取节点和内容的特征向量。最后,利用训练好的卷积神经网络预测不同节点对内容的评分,即内容流行度。通过仿真实验可以看出,本文提出的内容流行度预测模型具有较高的准确度。2)针对5G缓存纵向协同能力弱,智能化程度不高等问题,提出一种基于深度强化学习的纵向协作缓存策略,在预测内容流行度时空分布的基础上,提升整个网络缓存内容的多样性。为评估缓存性能,本文定义了缓存收益率,用于描述消耗单位缓存空间带来的时延减少量。深度强化学习的智能体以最大化缓存收益率为目标,根据网络状态和内容在不同位置的流行度决定是否需要进行内容缓存,若缓存,为缓存内容选择最佳缓存层。将内容缓存状态和内容在不同位置的内容流行度作为状态,缓存位置作为动作,下一个状态与当前状态缓存收益率之差作为智能体执行动作后获得的即时奖励。实验结果表明,与处处缓存和随机缓存策略相比,本文所提策略在缓存命中率、平均下载时延和缓存收益率等方面表现优异。