致密网络中基于深度强化学习的蜂窝关联算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:huweibo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
终端设备的数量在移动互联网技术的极速发展中呈现出几何增长的趋势,同时业务类型日益丰富,对数据流量和时延的要求也日益提高。为了满足未来无线通信的流量需求,网络将趋于致密化。致密网络即在通信场景中密集部署小蜂窝,每一个终端都可能被多个蜂窝覆盖,所以会产生复杂的关联问题。本学位论文研究的是致密网络中的蜂窝关联问题,即终端与蜂窝如何关联的问题,目标是兼顾网络的系统性能和算法耗时,快速实现蜂窝关联决策。首先提出了一种基于Q学习的蜂窝关联方法,考虑到此方法的耗时仍然较高,进一步考虑将Q学习的决策与自学习能力与深度学习的预测能力相结合提出基于深度Q学习的方法,此方法分为训练和应用两个阶段,训练阶段通过智能体与环境的交互离线训练深度Q网络来拟合的Q值函数,在应用阶段使用被训练好的神经网络自适应获取最优的动作选择策略,即得到最终的蜂窝关联结果。根据仿真结果来看,当场景中的用户数达到万级别时仍可以将耗时维持在毫秒级。进一步考虑通信场景的动态时变性,从宏观上看,实际生活中的场景总是在不断地变化,场景中的用户分布特征不会保持不变而是在动态变化,所以在持续变化的场景中使用同一个训练好的神经网络得到的蜂窝关联结果的系统性能会有较大的损失,因此我们根据相邻场景的相关性提出了一种在保证系统性能损失较小的同时可以快速进行蜂窝关联的算法。根据仿真结果来看,此方法能够在较短时间内完成系统性能较好的蜂窝关联决策。上述方法都是基于单智能体学习的方法,如今多智能体学习在众多领域有着广泛的应用,因此我们也尝试用多智能体学习来解决致密网络中的蜂窝关联问题。提出了一种基于多智能体强化学习的蜂窝关联方法,将每个用户看作是一个智能体,各自通过与环境的交互更新各自的Q表来得到蜂窝关联结果。进一步提出多智能体深度强化学习方法,每个用户维护各自的深度Q网络来指导蜂窝关联。根据仿真结果来看,此方法可以较好地利用多智能体学习方法解决蜂窝关联问题,系统性能和算法耗时与单智能体方法基本一致。
其他文献
电力变压器是电力系统重要组成部分之一,变压器的正常运行是电网安全稳定运转的必要条件。随着我国经济高速发展,变压器的数量和容量均明显增加,因此变压器故障诊断方法的研究具有重要的现实意义。由于能够实现在线实时监测,油中溶解气体分析法成为应用广泛的变压器故障诊断方法。油中溶解气体分析法理论简单,准确率较低,无法解决实际工程中变压器故障类型复杂的问题,因此现代智能方法受到广大研究人员的关注。人工神经网络是
随着工业物联网的快速发展,一种新型的基于相位敏感光时域反射计的(Phase-sensitive optical time-domain reflectometer,Φ-OTDR)分布式光纤声学传感器(Distributed Fiber Optic Acoustic Sensor,DAS)得到了广泛的研究。基于此项技术的Φ-OTDR分布式光纤声学传感器不仅具有普通光纤传感器的优点,而且具有重量轻、监
钙钛矿作为一种可与传统硅、锗等半导体相媲美的材料,由于其独特的结构与性能,引起广大科研者们的重视。目前对钙钛矿的研究主要集中在卤素钙钛矿上,而卤素钙钛矿又分为全无机钙钛矿和有机无机杂化钙钛矿,存在钙钛矿量子点、纳米线、多晶膜、单晶膜、大尺寸单晶等多种形态,拥有各自的特点。它们被广泛应用于太阳能电池、光电探测器和激光器等各种光电器件。波长传感器,能够识别颜色/光谱信息的传感器,被广泛应用于光通信、图
变电站电力设备已慢慢由传统的人力监察与摄像头远程监控模式转化成智能的管理模式,通过机器人技术实现对设备的智能识别以及通过无线通信技术与后台服务器进行实时交互,实现对变电站全方位的监察。然而目标识别的准确度以及信息交互的可靠性与实时性依旧是实现变电站智能化管理的重要问题。随着深度学习与无线通信技术的快速发展,目标识别的准确度得到了大幅提升,在与后台服务器通信,无线通信网络以其组网灵活、成本低廉等优点
随着科技的快速发展,移动机器人已经在多个领域中得到了广泛的应用,已然是社会发展中必不可少的部分。其中地面轮式移动机器人是最为常见的一种机器人,其自主导航能力是移动机器人可以完成任务的先要条件。因此路径规划是移动机器人领域中一个重要的问题,它是机器人在移动过程中避开障碍物的重要保证。当今移动机器人已逐渐变为运行在充斥着移动障碍的动态环境中,所以对移动障碍物的应对能力已成为现如今路径规划技术中的重要问
轨道电路用于自动、连续监测区段是否被车辆占用同时控制转辙装置,以保证行车安全。轨道电路出现故障会严重影响行车安全,因此提高轨道电路故障诊断的准确性、及时性十分必要。尽管现今已有许多关于轨道电路故障诊断的智能算法,但是铝电解电容劣化和轨道电路多故障分类还没有被深入研究。在这些问题中检测延迟大并且很多故障难以被准确分类。本文针对铝电解电容劣化这类渐变故障的检测、轨道电路的多故障分类问题开展了如下研究工
电磁流量传感器因其具有结构简单、测量精度高、响应速度快、无压力损失等优点,在流量测量领域得到广泛应用。电磁流量传感器的励磁磁路结构决定传感器的感应磁场分布,不仅直接影响传感器的测量性能,而且影响其系统功耗。但是,励磁磁路结构参数众多,实际应用中难以根据不同的性能要求开展电磁流量传感器磁路结构的优化设计。因此,本文将理论分析、有限元仿真、响应面法建模和遗传算法优化相结合,建立了一套完整高效的磁路结构
近年来,我国心血管疾病的发病率和致死率逐年上升。心律失常是心血管疾病早期症状的重要表现,能够及时准确的诊断出异常心电信号具有重要的医学价值和社会意义。心电图是分析心电信号最直接的工具,通过分析心电图可以诊断相应的心脏活动状态。然而,由于心电信号本身的低振幅和不规则特性,人工分析不仅需要依靠医生长期经验的积累,还浪费了医疗资源。因此本文主要利用多尺度小波变换原理和深度学习相结合的方法实现异常心拍的检
随着工业化的迅猛发展,接入电力系统低压配电侧的用电负载不断增加,导致电能质量问题日益严重。不同特性的负载会引起不同的电能质量问题,例如接入感性负载会造成输电线路传送大量的无功功率,降低功率因数;接入非线性负载会向系统注入谐波电流;接入不对称负载会导致系统三相电流不平衡等。目前,治理电能质量的主要办法是利用各种电能质量补偿装置。为了提高装置的利用率和性价比,希望电能质量补偿装置可以一机多用,即一种电
随着物流行业的飞速发展和人们对现代叉车的可操纵性需求的提升,叉车稳定性控制问题受到了人们的高度关注。越来越小的操作空间,越来越高的操作要求都对叉车的稳定性控制提出了越来越高的要求,而传统的叉车控制将叉车视为一般的车辆控制,缺乏控制对象的特殊性,尤其是没有考虑货物对于叉车稳定性的影响,有关资料表明,相当一部分叉车事故是由于所装载货物造成的,无论是货物上升高度过高导致叉车出现纵向倾覆,还是装载货物导致