基于深度强化学习的无人机基站三维部署方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:lzhonline276
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无人机基站(unmanned aerial vehicle mounted base station,UAV-BS)可以作为地面蜂窝网络的有效补充,来缓解诸如地面基站故障、网络流量拥塞、和偏远地区弱覆盖等问题,因此被视为实现6G全球覆盖愿景的关键技术之一。相比于传统的地面基站,无人机基站具有部署迅速、建设和维护成本低、部署场景灵活等优势。此外,无人机基站能够在三维空间调整位置,从而增加与地面用户建立视距(line of sight,Lo S)通信链路的概率,这为无人机基站的部署设计带来了新的自由度,与此同时,也带来了关于其三维部署、资源分配等的优化难题。而如今火热发展的机器学习技术,因其在数据处理、智能决策等方面的强大潜力,为解决无人机基站部署设计提供了新的思路。本文主要研究基于深度强化学习的无人机基站三维部署方法,具体的研究内容如下:首先,本文研究了单无人机基站的三维部署和功率分配的联合优化。提出一种基于深度确定性策略梯度(deep deterministic policy gradient,DDPG)的方法,无人机基站可以充分利用地面用户分布和无线信道特性,在连续的状态和动作空间学习最佳的三维位置和功率分配策略。采用注水算法(water-filling,WF)为DDPG的动作空间降维从而避免训练过程中的维度不平衡问题。设计了考虑系统吞吐量和用户公平性的奖励函数,在最大化系统吞吐量的同时保障了用户公平性,并对比了离散动作空间的深度Q网络算法和传统启发式的遗传算法的性能。其次,本文研究了多无人机基站的三维部署的联合优化。首先通过兴趣点(point of interest,Po I)模拟临时热点事件的发生位置,并在Po I邻域生成异构的用户分布。然后,将各无人机基站作为智能体构建马尔科夫决策过程,采用集中式学习范式,使各智能体在训练时考虑其他智能体的状态和动作,来解决由用户接入和无人机基站之间的信号干扰引起的多智能体学习环境的不平稳问题。最后通过近端策略优化(proximal policy optimization,PPO)求解建立的模型,使各无人机基站学习到最佳的三维部署策略来最大化系统吞吐量,并对比了单维的高度优化算法PCAO和随机部署算法RD的性能。
其他文献
变压器套管作为输变电系统中的重要组成部分,是电力能源在变压器与输电线路之间的重要“中转站”。目前,油浸纸套管占全世界变压器套管总数的约70%,在国内110 k V及以上的电网系统中,油浸纸套管所占的比例高达90%。然而,作为电力变换和传输的关键枢纽,其自身的缺陷以及外部的恶劣环境都会严重影响套管的绝缘性能,近年来因其发生故障缺陷引发扩大事故的次数始终高居不下。因此,油浸纸套管在输变电系统中的安全可
学位
随着光学系统及计算机技术的发展,人们对于宽视场高分辨的成像需求日益增长,但光学系统普遍存在宽视场和高分辨率无法同时兼顾的问题。为了解这一问题,本文提出了一种内视场拼接和外视场拼接相结合的成像系统方案,设计了双CMOS图像传感器拼接靶面的相机系统,研究了改进Surf-Ransac图像拼接算法及软件,研制了宽视场高分辨率双CMOS拼接靶面相机成像系统。本文主要研究内容如下:(1)针对宽视场与高分辨率之
学位
电力公司围绕新型电力系统数字化转型建设工作提出了促进新能源并网消纳、增强配网、调度和运维自动化建设和电力市场改革等措施,随之产生的精准负控、实时现货交易和广域实时监控等业务需要高精度和高时效的数据。电能计量系统(Tele Meter Reading,TMR)作为用户和电网之间信息双向交互、数据共享的基础。现有的TMR系统具备省级几百万只电表的大规模集中采集能力,实现了日冻结和月冻结数据,然而其数据
学位
近年来,人们开始重视风能、太阳能等新能源的利用,以解决传统化石能源的枯竭以及相应的环境问题。然而,这些新能源具有出力不稳定、地理位置分散等特点,难以独立地参与电力市场。虚拟电厂(Virtual Power Plant,VPP)这一技术克服了各类分布式资源独立参与电力市场所面临的装机容量小、地理位置分散、可控性弱等缺点,能够提高整体的能源利用率,挖掘各类分布式资源参与电力市场的潜能。日前市场(Day
学位
胎儿心电信号可以反映胎儿在妊娠期的生长发育和健康状况,有助于早期诊断胎儿各类疾病。由非侵入式方法采集的信号分为有母体参考信号的组合源信号和无母体参考信号的腹部源信号,其中包含的胎儿心电信号均具有幅度低、信噪比低、受母体心电信号干扰较大的特点,阻碍了胎儿心电信号应用于临床医学诊断的进程。因此,本文重点研究了组合源和腹部源胎儿心电信号提取方法。同时,因胎儿心电信号能够提供较多的胎儿心律失常相关信息,对
学位
目前,随着我国绿色发展理念的深入,驱动系统快速向清洁化、电动化发展。永磁同步电机具有转矩密度大、效率高等优点,在工业界中得到了广泛应用。本文以永磁同步电机无位置传感器控制系统为研究对象,针对逆变器非线性导致电机电流谐波加重、位置观测算法准确性降低等问题展开研究,期望通过提出补偿策略改善永磁同步电机电流谐波问题,提升位置估算准确性及系统动态性能。首先,本文分别在自然坐标系、旋转坐标系下建立永磁同步电
学位
随着无线通信技术的快速发展,无线网络传输能耗明显增大,这使得无线网络的传输能量效率优化变得尤为重要。近年来,由于无线携能通信(Simultaneous Wireless Information and Power Transfer,SWIPT)技术可利用无线射频信号同时实现无线传能及信息传输,因此持续受到研发人员的广泛关注。大量研究将SWIPT技术应用于无线网络以优化其传输能效。然而,在现有相关研
学位
作为第五代移动通信(5th Generation,5G)关键技术之一的大规模多输入多输出(Multiple Input Multiple Output,MIMO)技术因在能量效率和频谱效率等方面表现出的诸多优势而受到学术界和工业界广泛的关注。由于大规模MIMO系统中基站天线数量巨大,基站为了精确地获取下行信道状态信息(Channel State Information,CSI)将造成极大系统开销,
学位
车载网络和相关应用的迅速发展,使得车联网中计算密集型应用对资源的需求急剧增加,对现有车载设备有限的计算资源提出了挑战。在车联网中引入移动边缘计算(Mobile Edge Computing,MEC)被认为是一种有效的解决方案,能够将计算能力扩展到车载网络边缘。但是MEC服务器的资源仍是受限的,当任务爆炸式增长时无法保证服务质量,甚至导致MEC服务器出现过载现象。因此,为缓解MEC服务器计算压力,同
学位
近年来,建设大容量卫星移动通信系统成为世界航天大国建设的重要任务,高速数据传输技术作为卫星移动通信系统的关键技术之一,正受到越来越多的关注。而宽带高速数传系统中往往伴随着器件饱和、群时延失真和环境干扰等问题,导致接收端的信号常有码间串扰现象。信道均衡作为高速数传系统中的关键技术,可以有效地消除或减弱上述问题。其中,盲均衡技术具有结构简单、复杂度低和带宽使用率高等优势,非常适用于卫星高速数传基带系统
学位