基于强化学习的MTC随机接入和异构网络资源分配方法研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:junhao1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在第五代移动通信(5-th Generation Mobile Communication,5G)系统中,资源受限的机器类型通信设备(Machine Type Communication Device,MTCD)数量不断增加,给蜂窝网络带来了独特的技术挑战。为了满足远程医疗,自动驾驶等场景中MTCD的严格延迟和可靠性要求,设计更加先进的随机接入技术变得尤为迫切。同时由于频谱资源稀缺,且MTCD能耗受限,因此对B5G(Beyond 5G,B5G)异构网络的频谱效率和能量效率提出了更高的要求。为了解决机器类通信系统(Machine Type Communication,MTC)接入能力不足以及资源分配问题,本文结合强化学习的思想,针对延迟容忍度低的MTCD提出了基于学习的接入策略以及异构网络下的资源分配方案,主要成果如下:(1)针对随机接入过程中因为前导码资源有限而引发前导码冲突的问题,提出了一种基于多智能体强化学习的接入方法。本文引入两步随机接入过程,基站可以得到当前接入时隙的接入数量和冲突概率。不同于传统的静态退避机制,本文首先求解最优接入数量和分析各个前导码的使用情况,然后设计包含接入流量控制和前导码资源要素的强化学习框架,定义动作-状态对,使得MTCD在接入之前可以分析当前环境,做出退避决策,同时选择合适的前导码进行接入。(2)针对深度神经网络(Deep Neural Networks,DNN)中黑匣子的缺点,提出了一种模型驱动的强化学习异构网络资源分配方案。首先将频谱效率函数作为目标优化函数,发射功率作为约束,采用交替方向乘子法迭代求出最优解;然后将迭代的过程与DNN相结合;最后构建基于模型的强化学习框架,得到当前状态下最佳的资源分配策略。(3)为了保证下行链路用户服务质量,提升异构网络的频谱效率和能量效率,提出了一种基于多智能体深度强化学习的频谱和功率联合分配算法。本文以频谱利用率和能量效率为优化目标,用户服务质量为约束,得到资源分配优化函数。然后定义多智能体用户状态空间,奖励以及动作空间通过较小的通信开销获得状态空间信息,得到一维状态空间数据,从而减少网络的输入数据量。用户以自身的信道状态信息得到状态空间,而不依赖全局信道状态信息,再根据状态空间信息得到频谱和功率分配策略。最后,通过训练深度神经网络找到最佳的资源分配策略。
其他文献
在“微时代”的影响下,微型的学习资源得到支持开发,以满足学习者个性化的学习需求。在近两年新冠疫情防控的背景下,为保障“停课不停学”,教育部更是大力发展网上教学资源,在线教育的需求进一步增大。此外,随着学习者视觉素养的提升,对在线教学视频质量的要求也不断提高。因此,关于教学视频在视觉体验上的优化研究具有重要意义。本研究以视知觉理论和多媒体认知学习理论为基础,参考成熟的视频分析量表,开发视频评价工具,
学位
高校实验室是大学生学习理论知识与实践结合的重要场所,其建设是国家教育现代化的要求,也是高等教育基本技术手段发展的必然。随着“互联网+”时代的到来,高校原有的软硬件设施不断升级改造,既为高校教学仪器设备生产厂商提供了契机,也给企业带来了新的挑战。企业要想在市场竞争日益激烈的环境中保持优势,就必须有核心竞争力,选择合适的竞争战略,同时还需要不断提升运营和风险管理水平,最终能实现企业平稳持续发展。论文通
学位
团队已成为现今多数企业的基本工作形式之一,团队情商体现了团队对情商的认识水平,与个人创新绩效和团队绩效息息相关。不同的团队因为其情商水平不同,团队成员会产生差异化的行为结果。因此,采用跨层次分析方法探讨团队层次的团队情商对个体层次的员工创新绩效的关系具有非常重要的理论和实践意义。论文以团队为研究对象,基于情商理论、社会认同理论、涌现理论等理论的基本观点和研究现状构建了团队情商对员工创新绩效的跨层次
学位
随着移动通信技术的发展,网络设备接入需求量日益上升,对移动数据流量的需要也呈爆炸式增长,传统的多址接入方案面临着巨大挑战。如何利用有限频谱资源提升系统性能并支持大规模设备接入是值得研究的问题。为了解决这个难题,非正交多址接入技术(Non-orthogonal Multiple Access,NOMA)应运而生。通过借助于新的功率域维度,NOMA可以在单个时频域资源上并发传输多个用户的信号,在提高通
学位
目的 分析我国医院循证管理与卫生技术评估的研究热点和趋势,为未来研究指明方向。方法 在中国知网、万方和维普数据库检索相关文献,共纳入548条文献记录,采用NoteExpress 3.3软件进行计量分析,采用VOSViewer 1.6.18软件进行关键词聚类分析,采用CiteSpace 5.8.R3软件进行突变词分析。结果 第一篇文献出现于2001年,2015年开始文献数量激增并总体呈增长趋势;逐步
期刊
城市交通拥堵已经成为了一个日益严重的社会问题,对于公众的出行和整个社会发展都产生了负面影响。为了缓解交通压力,提高交通效率,区域交通信号协调控制成为当前研究的热点问题。针对现有交通信号协调控制研究中的不足,本文提出了一种基于多智能体深度强化学习的交通信号控制方法。采用深度双Q网络模型,通过基于协作式多智能体深度强化学习算法实现交通信号协调控制,仿真实验结果表明,本文提出的方法能有效降低区域内车辆平
学位
进入web2.0时代,在线社交网络逐渐成为群体观点表达的重要平台。研究社交网络的观点演化具有现实意义。考虑线上线下双层耦合网络的观点演化模型,分析两类网络的性质区别和观点演化机制差异有助于从宏观层面为舆情的预警与干预提供科学依据。分析用户交互行为及其特征,构建对应的观点演化模型,可从微观层面探究社交网络的观点演化机制,为引导舆论提供坚实的理论支持。本研究通过分析线上线下社交网络的特征,构建对应的连
学位
相较于近红外一区(NIR-Ⅰ,700-1000 nm)光学成像,近红外二区(NIR-Ⅱ,1000-1700nm)光学成像具备更深穿透深度和更高信噪的优点。然而,如何通过对共轭聚合物进行分子设计,有效将NIR-Ⅱ荧光成像(FI)、光声成像(PAI)和光热治疗(PTT)结合来实现实时NIR-Ⅱ成像引导肿瘤精准治疗,仍是一个难题。本论文首先对共轭聚合物侧链的烷基链进行构象调控,获得了具备高亮度NIR-Ⅱ
学位
温度是日常生活和各种自然科学中最基本的物理参数之一,温度传感器的发展也越来越受到人们的关注。新型荧光温度传感器相比较于传统接触式温度计具有抗干扰、高空间分辨率、方便快捷、可实现远程测量等非接触式优势。有机荧光温度传感器可实现大面积、柔性、生物环境以及实时测温性能,有机薄膜温度传感器为在大面积或不规则表面上显示可逆温度变化或不可逆热历史提供了一种可靠可行的方法。然而,目前主要的瓶颈在于缺乏用于高温传
学位
基于激发态分子内质子转移(ESIPT)凝聚态强发光的材料具有斯托克斯(Stokes)位移大、光稳定性好、自猝灭低等优点,已经在物理、化学和生物科学领域引起了广泛关注。然而,目前基于ESIPT的材料往往是在蓝色和绿色区域发光。在本论文中,设计合成了两种基于ESIPT的材料,通过扩展ESIPT的π共轭结构,实现ESIPT材料的发射颜色呈现长波段的橙光和红光发射,并且它们在有机电致发光二极管(OLED)
学位