基于DRQN的功率信道联合分配算法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:jaz23cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究一体化信息网络下的功率信道资源分配算法。目前5G移动通信系统处于规模商用的起步阶段,很多关键技术还需继续增强完善,尚不能满足某些特定场景下的通信需求。使人类拥有更接近“任何人在任何地方,和任何人进行任何形式的通信”目标的一体化信息网络将是下一代移动通信技术的主要研究方向。由于一体化信息网络下用户组成复杂、动态性高、对时延十分敏感,需要设计一种新的无线资源分配方法,为一体化信息网络中的用户分配功率和信道资源。深度强化学习算法在处理高维度的资源分配问题上已经取得了令人瞩目的成就,有望成为一体化信息网络中资源分配领域的支撑技术。本文将对一体化信息网络的单个簇进行建模,并使用深度强化学习算法中的深度循环Q网络算法解决该场景下的资源分配问题。首先,本文针对一体化信息网络高动态性、高复杂度的特点,将传统移动网络中小区的概念进行拓展,提出了“簇”的概念。为了研究单个“簇”内的资源分配问题,本文提出了一种三维曼哈顿网格模型。该种模型可以根据操作者的需求设计为集中式和分布式架构,并可以对单个簇内用户的通信行为进行较为真实的模拟。接着本文在阐述强化学习理论的基础上,引出了一种在解决部分观测马尔科夫过程下资源分配问题效果更好的深度循环Q网络算法。其次,在三维曼哈顿网格中设计了一种集中式的功率信道联合分配算法。我们假设环境中的感知节点的感知数据都是有噪的,将问题建模为一个部分观测马尔科夫过程。接着,根据用户的最低信干噪比门限设计奖励函数,以不同位置的感知节点的感知数据作为网络的环境状态向量,使用小批量参数学习方法反复迭代,为用户学习最优的功率信道联合分配策略。最后,在三维曼哈顿网格中设计了一种分布式的功率信道联合分配算法。我们假设模型中的用户具有一定的自主性,并拥有用户到用户和用户到基础设施两类不同服务质量需求的通信链路。接着,以两类链路干扰受限为约束条件,将问题抽象为一个多目标联合优化问题,使用离线训练模式训练深度循环Q网络,为用户学习最优的功率信道联合分配策略,并用在线测试模式对网络性能进行了比较。仿真结果表明,本文所提出的算法相比于其他算法性能提升明显。
其他文献
物联网的高速发展使得如何利用密码学技术在资源受限设备上进行安全且高效的信息传输成为研究的热点,资源受限设备指的是一类体积小、存储及处理能力弱的硬件。分组密码由于明文良好的扩展性而成为加密的主要方法,S盒对于分组密码的安全性具有关键影响,而目前算法构造的S盒性能并不出色,并且传统分组密码算法由于其计算复杂度高而使得资源受限设备无法承担,如何设计一种安全且计算复杂度低的轻量级分组密码算法具有很大的研究
运动意图是人将要执行动作时调动与运动相关的大脑资源让肌肉骨骼完成指定动作所作出的指令;运动想象是利用大脑意念想象动作,用控制器实现后续实际动作。可用运动相关皮层电位研究运动意图,用感觉运动节律研究运动想象。运动脑机接口不仅帮助病患控制身体,实现自理,还可以帮助病患恢复自身的运动能力;研究运动意图和运动想象,对运动脑机接口具有重要意义。本文对运动相关皮层电位和感觉运动节律的特征提取方法和分类识别方法
湖南新华书店集团推出湖南书香校园阅读工程整体解决方案,与湖南省内相关出版社联合编纂"四维阅读"丛书,铸湖湘阅读大观。"四维阅读"丛书之《水浒传》是"古典四大名著"之一。施耐庵在这部史诗般的小说中,汇聚了一百零八位英雄好汉,反映了时代的面貌,刻画了人性的美丑。本期,我们继续和怀化市铁路第二中学的江文欢老师一起品读《水浒传》。
期刊
在高校大学生中开展党史学习教育,既是全党面临的重大政治任务,也是高校大学生坚定马克思主义信仰,推动自身成长成才的必然需求。在高校大学生中开展党史学习教育,必须坚持以大学生为主体,发挥大学生主体性,帮助大学生学党史、信党史、行党史,将对党史的理论学习转化为实践自觉。
随着信息时代的高速发展,特别是互联网的迅速普及,传统的电子通讯系统已经逐渐难以满足人们的需求。为解决这个问题,光通信技术得到了空前发展。光调制和光偏转技术是光通信中的核心技术,实现光调制和偏转的手段与材料被人们不断地进行创新与研究。其中,电光材料由于其高响应速率和稳定性脱颖而出,基于电光材料的调制器件与偏转器件发展十分迅速。人们对各种电光材料展开了研究,如钽铌酸钾晶体、磷酸二氢钾晶体和铌酸锂晶体等
紫外(UV)辐射是指波长为10~400nm的电磁辐射。一般划分为以下几个区域:UVA(320至400 nm)、UVB(280至320 nm)、UVC(100至280 nm)和EUV(10至120 nm)。但由于大气和臭氧层吸收了大部分UVB、UVC、UVE区域的紫外辐射,所以波长小于280nm的深紫外辐射无法到达大气表面。因此,波长为200~280nm的区域通常被称为日盲区。同时,在过去的几十年里
电池管理系统芯片是保证动力电池系统安全性和工作效率的关键。高精度电池参数监测作为电池管理系统芯片的基础,完成对每节电池的电压,电流和温度等参数的监测,监测结果用于估计电池状态,以防止电池在安全操作范围之外工作,同时保证不同电池之间处于平衡状态。由于电池的各个参数均为接近直流的低频信号,用速度换取转换精度的Delta Sigma ADC以其高精度和低功耗等优点,成为用于BMS芯片中监测电池参数模数转
在现代信息化的战场中,电子侦察作为战争中的“千里眼”,起着重要的作用。无源定位技术作为电子侦察的重要功能,有着不可忽视的地位。近年来,无人机屡次出现在战场中,受到人们的关注。本文重点研究基于时差测量的无人机集群对辐射源目标定位的方法,分别从时延估计、定位解算、多目标数据关联几个角度进行研究。首先,探究利用时差观测信息求解目标位置的原理,并对时差的测量方法进行研究。对无人机集群作战场景中,可能会出现
痕量气体检测技术能够在工业生产过程中监测危险气体,保障生命安全;对空气污染物进行监测,形成环境评价体系;对人体呼出气体检测,提高疾病诊断的便捷性和准确性。光声光谱(Photoacoustic Spectroscopy,PAS)技术作为一种痕量气体检测技术,能够根据所测声信号来反演气体浓度,具有灵敏度高、选择性强、检测范围大等优点。在PAS技术中,声信号的幅值与吸收线的强度以及光功率均为正比关系,因
高频地波雷达作为一种新型的海洋监控雷达,除了能够全天候的监测视距外的飞机、舰船等目标,同时也可以根据回波反演海洋参数信息。高频地波雷达探测技术从上世纪70年代开始不断发展,其中海态反演领域取得了较大的突破。但是受到雷达外部环境的影响,尤其是电离层杂波,使海洋回波谱的质量降低,进一步导致海态反演出现范围受限,精确度不够高的问题。本文将从电离层杂波抑制、海态数据处理两个角度出发,针对如何提升高频地波雷