密集异构蜂窝网络中基于深度强化学习的下行链路功率分配算法

来源 :南京邮电大学学报:自然科学版 | 被引量 : 0次 | 上传用户:llljjjxxx7
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对密集异构蜂窝网络系统的下行链路,提出了一种基于深度强化学习的功率分配算法,旨在最大化系统能量效率。首先,基于蜂窝网络的下行链路模型对系统能量效率进行了建模;其次,构建了含有两层隐藏层的深度Q网络(DQN)作为行为状态值函数,用以优化系统能量效率。最后,仿真结果表明,所提的深度Q学习算法相较于贪婪算法、Q学习算法能够获得更高的系统能量效率,且在收敛速度和稳定性方面有显著提高,此外,通过改变学习速率来观察模型的性能找到了最佳学习速率。
其他文献
现代社会中,社区作为社会基础以及城乡最基层的组成单位,对于社会的稳定起到重要的维护作用。新冠肺炎疫情之后,当社会重新审视中国社区治理的现状时,发现城市社区在面对重大
探月工程的推进对月球车提出了更高的越障要求,文章基于四杆悬架机构越障能力强的特点,设计出一款新型月球车行走系统,并使用Adams进行运动学仿真,详细分析了其中震荡、侧滑与横摆、侧倾与俯仰等问题。该新型月球车行走系统具有较高的地形适应能力和通过能力,可以满足一般要求。
目的探讨益生菌治疗幽门螺杆菌(Hp)阳性胃溃疡患者中的效果及对肠道菌群分布、血清炎症因子的影响。方法选取2016年5月—2019年10月新乡医学院第一附属医院收治的Hp阳性胃溃
目的:全面的光伏系统评价体系可以有效分析分布式光伏电站的效率问题,对提升电站利用率具有重要意义。方法:结合环境影响,提出了一种基于改进三阶段DEA的分布式光伏电站效率
以PLC的运程监控系统为研究对象,提出了B/S系统的网络架构。利用运程客户端及网络组件和本地的服务器、控制器、设备层构成硬件连接。在软件方面,采取数据库和WEB Services组
2019年7月,山东省某规模化肉牛场8 d内累积出现22头犊牛死亡,死亡犊牛多集中在3月龄以内。为查找死因,遂对发病牛场的生活环境进行调查,并对场内犊牛进行早、中、晚体温检测,
随着互联网服务的快速发展,分布式的微服务应用逐渐取代传统的单体应用成为互联网应用的主要形式之一.微服务应用在具有可伸缩性、容错性、高可用性等优点的同时,也存在着构
金属打包机是废旧金属回收行业的大型核心工程设备。为了提高金属打包机箱体结构的综合性能以及实现箱体轻量化的目标,提出一种基于响应面法的轻量化设计方法。基于板壳理论
伦理理论是明辨伦理抉择论证的基石,它协助社会工作者解决伦理困境,并为抉择方案提供学理支撑。然而,无论是社会工作伦理教育抑或是社会工作伦理研究,都对伦理理论鲜有论及。