搜索筛选:
搜索耗时0.1199秒,为你在为你在102,285,761篇论文里面共找到 9 篇相符的论文内容
发布年度:
[学位论文] 作者:宋佰霖,
来源:哈尔滨工程大学 年份:2021
...
[期刊论文] 作者:饶宁,许华,宋佰霖,
来源:空军工程大学学报(自然科学版) 年份:2021
为解决战场通信干扰决策问题,设计了一种融合动作剔除的深度竞争双Q网络智能干扰决策方法.该方法在深度双Q网络框架基础上采用竞争结构的神经网络决策最优干扰动作,并结合优...
[期刊论文] 作者:饶宁,许华,宋佰霖,
来源:哈尔滨工业大学学报 年份:2022
为进一步提升基于值函数强化学习的智能干扰决策算法的收敛速度,增强战场决策的有效性,设计了一种融合有效方差置信上界思想的改进Q学习智能通信干扰决策算法.该算法在Q学习算法的框架基础上,利用有效干扰动作的价值方差设置置信区间,从干扰动作空间中剔除置信......
[期刊论文] 作者:宋佰霖,许华,蒋磊,饶宁,
来源:西北工业大学学报 年份:2004
为解决战场通信智能抗干扰决策问题,设计了一种基于深度强化学习的通信抗干扰决策方法.该方法在DQN算法架构下引入经验回放和基于爬山策略(PHC)的动态ε机制,提出动态ε-DQN...
[期刊论文] 作者:齐子森,彭大林,许华,宋佰霖,
来源:空军工程大学学报:自然科学版 年份:2021
针对共形阵列天线信源方位与极化状态联合估计算法计算量大的问题,给出了一种基于多级维纳滤波器前向递推的柱面共形阵列天线信源方位与极化参数高效联合估计算法.新算法推导...
[期刊论文] 作者:许华,宋佰霖,蒋磊,饶宁,史蕴豪,,
来源:电子与信息学报 年份:2021
针对战场通信对抗智能决策问题,该文基于整体对抗思想提出一种基于自举专家轨迹分层强化学习的干扰资源分配决策算法(BHJM),算法针对跳频干扰决策难题,按照频点分布划分干扰频段,再基于分层强化学习模型分级决策干扰频段和干扰带宽,最后利用基于自举专家轨迹的......
[期刊论文] 作者:宋佰霖, 许华, 齐子森, 饶宁, 彭翔,
来源:电子学报 年份:2022
针对协同电子战中跳频通信干扰协同决策难题,通过构建“整体优化、逐站决策”的协同决策模型,基于深度强化学习技术,设计了在Actor-Critic算法架构下融合优势函数的决策算法,并在奖励函数中嵌入专家激励机制以提高算法的探索能力,采用集中式训练方法优化决策网络,使算......
[期刊论文] 作者:饶宁, 许华, 蒋磊, 宋佰霖, 史蕴豪,
来源:电子学报 年份:2022
针对战场通信对抗协同干扰中的干扰功率分配难题,本文基于多智能体深度强化学习设计了一种分布式协同干扰功率分配算法.具体地,将通信干扰功率分配问题构建为完全协作的多智能体任务,采用集中式训练、分布式决策的方式缓解多智能体系统环境非平稳、决策维度高的问......
[期刊论文] 作者:饶宁,许华,齐子森,宋佰霖,史蕴豪,
来源:西北工业大学学报 年份:2021
针对通信组网对抗中干扰资源分配的优化问题,提出了一种基于最大策略熵深度强化学习(MPEDRL)的干扰资源分配方法.该方法将深度强化学习思想引入到通信对抗干扰资源分配领域,并通过加入最大策略熵准则且自适应调整熵系数,以增强策略探索性加速收敛至全局最优.该......
相关搜索: