q学习相关论文
针对多无人机同时到达目标的航迹规划问题,建立战场环境模型和单无人机航迹规划的马尔可夫决策模型,基于Q学习算法解算航程最短的最......
水库优化调度问题是一个具有马尔可夫性的优化问题。强化学习是目前解决马尔可夫决策过程问题的研究热点,其在解决单个水库优化调度......
针对边缘计算应用对实时性的要求,引入软件定义网络和网络功能虚拟化技术对边缘计算网络进行重构.基于此,考虑以最大化长期平均实......
多任务粒子群优化算法(Multi-Task Particle Swarm Optimization,MTPSO)通过知识迁移学习,具有快速收敛能力,广泛应用于求解多任务多目......
聚焦当前战场机动通信系统所面临的带宽窄、低速率、时延高和联通性差等现实问题和挑战,将5G通信技术和无人机集群技术相融合受到......
针对传统强化学习中Q学习算法在机器人路径规划过程中易引发维数灾难及搜索效率低的问题,提出一种深度强化学习算法。在Q学习算法中......
在亚马逊棋评估函数模型中进行参数调试,主要由人工依靠经验反复实验来实现,效率较低且无法保证精度。针对人工调参效率低下、精确度......
无线通信技术的快速发展,不仅改变了人们的生活方式,而且改变了现代和未来的战争模式。为保障信息传输的可靠性,通信系统须具备抗......
针对均流控制方案无法保证两相交错并联直流-直流(DC-DC)变换器系统效率处于最优,从而造成能源浪费的问题,提出一种基于电流分配的效率......
随着中国经济的发展,人民逐渐富了起来,生活水平与之前相比有了很大的提高,生鲜行业也得到了快速的发展,此时一些问题逐渐显现了出......
针对无线传感器节点易受干扰和入侵的特点,为保障网络覆盖和安全性,基于信任管理和Q学习提出了一种新的自适应容侵覆盖优化方法。所......
期刊
随着当前经济全球化的不断深入和客户需求的不断变化,制造企业面临的外部环境越来越复杂多变,经典的以提高算法优化能力为核心的静......
路径规划一直是机器人领域的研究重点。已有机器人路径规划研究大多基于环境已知,但许多情况下,机器人所处环境是未知的,如何在未......
现代雷达往往需要在复杂多变的电磁环境中完成多种任务。如何提升雷达的智能化水平,使其能够适应环境变化和任务需求,已成为近年来备......
布谷鸟搜索算法(Cuckoo Search,CS)是一种新型群体智能优化算法,该算法通过模拟自然界布谷鸟寻找鸟窝寄生幼雏的行为,实现群体智能寻......
无人机自组织网络(FANET)是实现无人机自主集群的关键技术,其通过各无人机节点来完成协同通信。但节点的高机动性、网络结构的开放性......
随着无线通信的发展,频谱资源利用率低这一现象已经引发了广泛关注。为了使不可再生的频谱资源得到更充分地利用,多项技术被用来实......
在现阶段空空攻防战中,末制导律阶段由于其作为弹目最终交汇条件的判断依据,因此在控制领域中收到广泛关注。现如今,基于末制导律......
电梯群控技术在大型公共建筑中被广泛采用以优化电梯调度,在缩短用户等待时间、降低电梯运行能耗和机械损耗等方面成效显著。然而,......
5G超密集组网技术通过在宏基站范围内密集部署小基站,提升了用户体验、信号覆盖率和系统容量,但同时也导致了越发复杂的拓扑结构和......
准确的风速预测对新能源并网稳定运行具有重要意义.为提高风速预测精度,该文构建基于双重Q学习的动态风速预测模型.首先,构建由五......
我国经济的快速发展使得近年来汽车保有量迅速增加、城市交通需求激增,随之带来的交通拥堵问题已严重影响了城市的发展和居民的生......
提出一种新的基于Q学习和区块链的配网智能保护方案,可对不同类型的故障进行识别和隔离.Q学习算法被用来训练执行代理在故障识别和......
5G通信技术的快速发展和应用,加快了整个社会的信息化和智能化进程。作为智能交通系统(Intelligent Traffic System,ITS)重要组成部......
水下数据收集是水下传感器网络应用研究的基础。在水下传感器网络中,传感器节点的部署稀疏性的特点,限制了水下数据收集的范围。水......
随着人工智能、机器学习研究的深入,Q学习算法也开始应用于无线传感器网络(Wireless sensor networks,WSNs)介质访问控制(Medium acce......
利用Q学习发展出的D3QN模型来实现交通信号控制智能体,模型采用离散交通状态编码的状态集,将交叉口处车辆的位置-速度二维矩阵图经......
针对微电网的随机优化调度问题,提出了一种基于深度强化学习的微电网在线优化算法。利用深度神经网络近似状态-动作值函数,把蓄电池......
无人机集群应急通信系统面临的最大挑战为集群网络拓扑的快速变化,因此,高效的自组网路由协议是保证无人机集群应急通信系统具有稳......
基于非正交多址接入(NOMA)的Q学习(Q-Learning)随机接入方法(NORA-QL)是实现物联网中海量设备泛在接入的一项有效技术.为了解决NOR......
近些年来,深度强化学习在人工智能领域扮演着越来越重要的角色。但当面对高像素图像游戏的时候,深度强化学习的训练稳定性不佳。深......
针对捷变频雷达载频在一定频带内不断变化导致干扰方不能有效跟踪雷达频点的问题,提出了一种基于Q学习算法的捷变频雷达频点跟踪决......
为了处理探索环境中的变化和减少智能体不必要的从头学习的时间,研究了对探索环境的预处理方法,提出了运用轨迹标记的Q学习算法尝......
为了提高无刷直流电机(BLDCM)的工作稳定性,设计了一种基于Q学习算法优化的BP神经网络控制器(QBP-PID).QBP-PID利用BP神经网络(BPN......
为进一步提升基于值函数强化学习的智能干扰决策算法的收敛速度,增强战场决策的有效性,设计了一种融合有效方差置信上界思想的改进......
针对连续线性系统的无限时域最优控制的在线实现问题,在系统动态完全未知的条件下设计了一种在线Q学习算法.基于无限时域最优控制......
针对密集杂波环境下的多目标点迹-航迹关联问题,以强化学习(Reinforcement Learning, RL)方法为基础,提出了一种基于Q学习的多目标点迹-......
期刊
在长距离自由空间光(FSO)通信中,信号强度会因为受到湍流、散射、吸收等因素的影响而衰减,而大气湍流是最重要的因素。大气湍流会干......
随着近几年互联网用户数量和视频数量的增长,视频传输流量成为互联网的流量的主要组成部分。在有限的带宽资源下,满足视频传输的服......
在车辆自组织网络(Vehicular Ad-Hoc Networks,VANETs)的背景下节点的资源十分有限,节点之间难以找到一条稳定的通讯路径,传统的路由......
随着第一版5G国际标准于2018年9月正式冻结,5G的大门正式开启。5G技术的广泛应用给人们生活的方方面面带来了巨大的改变。机器类通......
通信技术发展除了满足可靠性和有效性等基本要求外,应用中还要结合实际场景考虑建设成本和复杂度等因素。无线通信技术和电力线通......
一般来说无线传感器在电源能量、通信能力以及计算和存储能力方面存在一定的条件限制,影响了网络的数据采集效率、生命周期等性能......
为解决混合overlay/underlay频谱共享方式下多用户动态频谱分配问题,构建了混合频谱共享方式下动态频谱分配模型,提出了基于Q学习......