【摘 要】
:
无线通信系统的信道开放性使其极易受到外部恶意干扰、通信链路质量难以保证,针对以上问题,本文设计了一种基于深度强化学习的多域联合干扰规避决策方法。该方法联合频域、功率域、调制编码域三个域的抗干扰手段进行干扰规避,在考虑系统性能的同时实现可靠通信。首先,将联合智能干扰规避问题建模为一个马尔可夫决策过程(MDP, Markov Decision Process),动作空间包含切换信道、功率控制、改变调制
【基金项目】
:
国家自然科学基金项目(No.62001483;No.62171449);
论文部分内容阅读
无线通信系统的信道开放性使其极易受到外部恶意干扰、通信链路质量难以保证,针对以上问题,本文设计了一种基于深度强化学习的多域联合干扰规避决策方法。该方法联合频域、功率域、调制编码域三个域的抗干扰手段进行干扰规避,在考虑系统性能的同时实现可靠通信。首先,将联合智能干扰规避问题建模为一个马尔可夫决策过程(MDP, Markov Decision Process),动作空间包含切换信道、功率控制、改变调制编码方式。然后,采用基于剪裁的近端策略优化算法(PPO-Clip, Proximal Policy Optimization-Clip)求解获得系统的最优联合干扰规避策略。PPO-Clip算法在多回合训练中以小数量样本迭代更新,避免了策略梯度算法中步长难以确定和更新差异过大的问题。最后,分别在扫频干扰、随机扫频干扰和智能阻塞干扰环境下验证了所提算法的有效性和可靠性。
其他文献
目的:比较针刺十三鬼穴联合开心散与单纯开心散治疗围绝经期抑郁症的临床疗效。方法:将60例围绝经期轻度抑郁症患者随机分为中药组(30例,脱落2例)与针药组(30例)。中药组口服开心散加减治疗,每日1剂,早晚分服;针药组在中药组治疗基础上,加用针刺孙思邈十三鬼穴(水沟、少商、隐白、大陵、申脉、颊车、承浆、劳宫、上星等穴),得气后即出针,隔日1次,每周3次,两组均连续治疗12周。分别于治疗前、治疗后、治
西汉司马迁所著《史记》是我国第一部纪传体史书,这部史书以精准的细节描写和高超的艺术手法屹立于史传文学之林,尤其是司马迁对《史记》中112例“哭”的叙写,使得这部著作独步于史传文学之中。本文即以《史记》中记载的“哭”例为研究对象与切入点,针对司马迁“哭”书写的动因、“哭”的类别、“哭”的内在意蕴、“哭”叙写的表现手法、“哭”叙写对后世文学的影响五个方面进行研究,以期能为司马迁《史记》“哭”的文学书写
针对基于最长队列优先配时算法的大规模交通信号灯协同控制模式存在的诸多不足,提出了一种基于多智能体深度强化学习的大规模交通信号灯控制模型。首先形成融合经验学习集和实践应用集的高度动态复杂路段交通运行态势经验池;然后利用深度长短期神经网络建立时间正序下的大规模交通信号灯与多智能体之间的物理映射关系;最后利用深度确定性策略梯度算法实现复杂路段大规模交通信号灯最优协同控制。对模型开展了典型需求场景下的仿真
志愿服务信息管理系统是为志愿者服务队编写的一套信息管理系统,便于对志愿者的信息和服务队日常事务进行统一管理。当前志愿服务信息管理系统存在诸多问题,影响其管理效率和规范化。区块链技术具有去中心化、全网分布式处理、共识机制、集体维护、时间戳等技术特征,将区块链技术引入志愿服务信息管理系统有助于解决其信息记录混乱繁杂、信息处理信度低、信息真实性难以保证和透明度低等问题,具有必要性和可行性。应在志愿服务信
未来天基信息网络(spaceinformationnetwork,SIN)领域将面临结构复杂、环境动态、业务多样等发展趋势带来的挑战。数据驱动的深度强化学习(deep reinforcement learning,DRL)作为一种应对上述挑战的可行思路被引入SIN领域。本文首先简要介绍了DRL的基本方法,并全面回顾了其在SIN领域的研究进展。随后以星地网络场景的中继选择为例,针对大规模节点问题提出
<正>熊科动物是当今陆地上体形最大的食肉动物,它们常给人一种笨重、缓慢的印象,与大型猫科动物比起来,少了一份威武与霸气。不过,在距今1万年前的北美洲,曾经生存着一种巨熊,其外形与今天的熊科动物有很大差别,令人印象深刻。在距今3万年前的更新世末期,地球正处于第四纪冰川期,美国加利福尼亚州的气候要比今天湿润。在一座山谷中,不断传来嚎叫声,原来是一群恐狼正在围攻一头年老的长角野牛。长角野牛此时已经筋疲力
<正>股份公司第二炼钢厂机修车间根据工种多、日常检修项目多、检修环境复杂、安全管理难度大等特点,以现场为重点,不断强化职工安全意识、提高职工安全防护技能,确保检修过程中的安全作业,努力做到从人、机、环"三个"方面入手,抓好检修前、中、后"三个"环节,树立"三种"观念;确保检修安全,实现了检修零伤害的安全管理目标。一、从人、机、环三方面入手,做好安全本质化建设人员的本质化安全包括人员的安全生理、安全
欧洲志愿服务与福利国家演变历程紧密相连,贯穿其萌芽及发展各阶段。当福利国家陷入困境后,福利多元主义思潮兴起,志愿服务理论也掀起了新高潮。欧洲志愿服务在实践中弥补了福利国家部分功能,并逐渐拥有稳健的运行及支持体系。本文旨在考察福利国家及欧洲志愿服务发展的历史进程,梳理两者之间的理论联系,阐述当今欧洲志愿服务组织运行及支持体系,进而剖析其发展趋势,以期对我国志愿服务发展提供借鉴。
近年来,我国老龄化愈发严重且下肢失能患者人数逐年增多,人工护理已经无法满足需求,使用辅助机器人完成老年人及失能患者的日常生活辅助是当下研究的一个热点。当使用环境中同时存在多台辅助机器人时,多台辅助机器人的路径规划与避障是一个首要解决的问题。多机器人系统具有较高的动态性,因此传统的路径规划方法不在适用于多机器人系统中,如何让多机器人系统中的路径规划变得更智能是当今研究的重点。近年来机器学习的热度越来
天地一体化网络是近年来新兴的以天基网络为主体,地面网络为基础,结合空中网络的一体化信息网络,其可为陆、海、空、天各类用户提供随遇接入、全球覆盖、按需服务、安全可靠的信息服务。大力发展天地一体化网络信息服务能力以适应各种场景下的业务需求对于信息时代掌握全球空间资源具有战略性的经济、社会和军事意义,也是谋求新技术、新产业领先优势,实现全球化信息服务的必然选择。随着卫星通信技术及移动通信技术的快速发展,