q学习相关硕士博士期刊学术论文

q学习相关论文

基于Q学习的多无人机协同航迹规划方法

针对多无人机同时到达目标的航迹规划问题，建立战场环境模型和单无人机航迹规划的马尔可夫决策模型，基于Q学习算法解算航程最短的最......

期刊

多无人机航迹规划 Q学习时间协同碰撞避免

离散四水库问题基准下基于n步Q-learning的水库群优化调度

水库优化调度问题是一个具有马尔可夫性的优化问题。强化学习是目前解决马尔可夫决策过程问题的研究热点，其在解决单个水库优化调度......

期刊

水库优化调度强化学习 Q学习惩罚函数可行方向法

基于强化学习的边缘计算网络资源在线分配方法

针对边缘计算应用对实时性的要求,引入软件定义网络和网络功能虚拟化技术对边缘计算网络进行重构.基于此,考虑以最大化长期平均实......

期刊

边缘计算资源分配实时任务马尔可夫决策过程 Q学习深度强化学习

基于Q学习的多任务多目标粒子群优化算法

多任务粒子群优化算法（Multi-Task Particle Swarm Optimization,MTPSO）通过知识迁移学习，具有快速收敛能力，广泛应用于求解多任务多目......

期刊

多任务多目标优化粒子群优化知识迁移 Q学习柯西分布局部搜索

无人机辅助的车载自组网路由协议研究

近些年,车载自组网（Vehicular Ad Hoc Network,VANET）作为城市智能交通系统（Intelligent transportation system,ITS）的核心部分,通过......

学位

车载自组网无人机路由协议节点通信 Q学习

基于5G和无人机集群的机动通信技术研究

聚焦当前战场机动通信系统所面临的带宽窄、低速率、时延高和联通性差等现实问题和挑战,将5G通信技术和无人机集群技术相融合受到......

学位

5G 无人机集群机动通信动态分簇 Q学习路由协议

基于深度强化学习的机器人路径规划

针对传统强化学习中Q学习算法在机器人路径规划过程中易引发维数灾难及搜索效率低的问题，提出一种深度强化学习算法。在Q学习算法中......

期刊

Q学习深度强化学习机器人路径规划

Q学习实现亚马逊棋评估函数自调参

在亚马逊棋评估函数模型中进行参数调试，主要由人工依靠经验反复实验来实现，效率较低且无法保证精度。针对人工调参效率低下、精确度......

期刊

计算机博弈亚马逊棋强化学习 Q学习评估函数

基于机器学习的USRP RIO抗干扰跳频通信系统的研究

无线通信技术的快速发展,不仅改变了人们的生活方式,而且改变了现代和未来的战争模式。为保障信息传输的可靠性,通信系统须具备抗......

学位

抗干扰 USRP RIO 自适应跳频 Q学习长短期记忆网络

两相交错并联DC-DC变换器系统效率优化

针对均流控制方案无法保证两相交错并联直流-直流（DC-DC）变换器系统效率处于最优，从而造成能源浪费的问题，提出一种基于电流分配的效率......

期刊

两相交错并联DC-DC变换器效率优化电流分配支持向量回归 Q学习

基于强化学习的生鲜农产品库存优化

随着中国经济的发展,人民逐渐富了起来,生活水平与之前相比有了很大的提高,生鲜行业也得到了快速的发展,此时一些问题逐渐显现了出......

学位

强化学习 Q学习生鲜农产品库存控制订购策略

基于Q学习的无线传感网自适应容侵覆盖优化方法

针对无线传感器节点易受干扰和入侵的特点，为保障网络覆盖和安全性，基于信任管理和Q学习提出了一种新的自适应容侵覆盖优化方法。所......

期刊

无线传感器网络（WSN）信任管理 Q学习覆盖优化容侵

基于强化学习的作业车间动态调度问题研究

随着当前经济全球化的不断深入和客户需求的不断变化,制造企业面临的外部环境越来越复杂多变,经典的以提高算法优化能力为核心的静......

学位

动态调度算法调度规则 Q学习深度强化学习作业车间

未知环境下移动机器人路径规划算法研究

路径规划一直是机器人领域的研究重点。已有机器人路径规划研究大多基于环境已知,但许多情况下,机器人所处环境是未知的,如何在未......

学位

路径规划快速扩展随机树自适应人工势场 Q学习径向基神经网络

基于定向天线的无线自组网邻居发现技术研究

具备无需固定基础设施、无中心和动态网络拓扑优势的无线自组网已被广泛应用于应急、救灾和战场等特殊目的通信场景中。通过使用定......

学位

无线自组网邻居发现自适应波束天线节点冲突 Q学习

环境感知信息辅助的认知雷达波形参数智能选择

现代雷达往往需要在复杂多变的电磁环境中完成多种任务。如何提升雷达的智能化水平，使其能够适应环境变化和任务需求，已成为近年来备......

期刊

杂波环境感知认知雷达机载雷达机动目标跟踪目标检测 Q学习深度Q学习网络

基于学习的布谷鸟搜索算法研究

布谷鸟搜索算法（Cuckoo Search,CS）是一种新型群体智能优化算法,该算法通过模拟自然界布谷鸟寻找鸟窝寄生幼雏的行为,实现群体智能寻......

学位

布谷鸟搜索算法 Q学习自适应选择知识学习工程优化

基于启发式Q学习的FANET可信路由算法

无人机自组织网络（FANET）是实现无人机自主集群的关键技术，其通过各无人机节点来完成协同通信。但节点的高机动性、网络结构的开放性......

期刊

无人机自组织网络路由攻击信任模型 Q学习启发式函数

基于强化学习的多用户功率智能分配

随着无线通信的发展,频谱资源利用率低这一现象已经引发了广泛关注。为了使不可再生的频谱资源得到更充分地利用,多项技术被用来实......

学位

功率分配无线资源管理多智能体强化学习 Q学习

大规模机器类通信网络中基于干扰控制的资源分配方法研究

作为第五代移动通信系统（The Fifth Generation Mobile Communication System,5G）三大应用场景之一的大规模机器类通信（massive Machi......

学位

大规模机器类通信干扰图资源分配 Q学习功率控制

基于回溯思想的高效强化学习末制导律设计

在现阶段空空攻防战中,末制导律阶段由于其作为弹目最终交汇条件的判断依据,因此在控制领域中收到广泛关注。现如今,基于末制导律......

学位

强化学习高效强化学习末制导律 Q学习回溯式更新方法

高层住宅电梯群控系统调度研究

电梯群控技术在大型公共建筑中被广泛采用以优化电梯调度,在缩短用户等待时间、降低电梯运行能耗和机械损耗等方面成效显著。然而,......

学位

高层住宅电梯群模式识别 Q学习蚁群算法半物理仿真

基于H-CRAN的聚类及资源管理算法研究

5G超密集组网技术通过在宏基站范围内密集部署小基站,提升了用户体验、信号覆盖率和系统容量,但同时也导致了越发复杂的拓扑结构和......

学位

超密集组网 H-CRAN架构资源分配聚类算法 Q学习

基于双重Q学习的动态风速预测模型

准确的风速预测对新能源并网稳定运行具有重要意义.为提高风速预测精度,该文构建基于双重Q学习的动态风速预测模型.首先,构建由五......

期刊

风速预测 Q学习误差校正动态模型选择

基于强化学习的网络入侵检测模型研究

随着互联网技术及应用的不断发展,网络已经在商业、经济、军事等各个领域都发挥着巨大作用,而成为人类社会发展不可缺少的部分。然......

学位

入侵检测马尔科夫决策过程强化学习信用度 Q学习 Flink

基于强化学习的公交信号优先控制研究

我国经济的快速发展使得近年来汽车保有量迅速增加、城市交通需求激增,随之带来的交通拥堵问题已严重影响了城市的发展和居民的生......

学位

交通信号灯信号控制公交信号优先雾计算 Q学习

基于Q学习和区块链的配网保护方法研究

提出一种新的基于Q学习和区块链的配网智能保护方案,可对不同类型的故障进行识别和隔离.Q学习算法被用来训练执行代理在故障识别和......

期刊

Q学习配网区块链继电保护

城市环境中车辆边缘计算任务卸载策略研究

5G通信技术的快速发展和应用,加快了整个社会的信息化和智能化进程。作为智能交通系统（Intelligent Traffic System,ITS）重要组成部......

学位

车联网边缘计算任务卸载 Q学习

基于潜器协同的水下数据收集算法研究

水下数据收集是水下传感器网络应用研究的基础。在水下传感器网络中,传感器节点的部署稀疏性的特点,限制了水下数据收集的范围。水......

学位

水下传感器网络数据收集 Q学习潜器任务分配

基于Q学习的WSNs帧长自适应MAC协议

随着人工智能、机器学习研究的深入,Q学习算法也开始应用于无线传感器网络（Wireless sensor networks,WSNs）介质访问控制（Medium acce......

学位

WSNs 介质访问控制 Q学习帧长自适应

基于Q学习的智能交通信号灯优化

利用Q学习发展出的D3QN模型来实现交通信号控制智能体,模型采用离散交通状态编码的状态集,将交叉口处车辆的位置-速度二维矩阵图经......

期刊

自适应交通信号控制 Q学习相位切换马尔科夫决策过程

基于深度强化学习的微电网在线优化

针对微电网的随机优化调度问题，提出了一种基于深度强化学习的微电网在线优化算法。利用深度神经网络近似状态-动作值函数，把蓄电池......

期刊

微电网调度 Q学习在线优化蒙特卡洛深度强化学习

适用于无人机集群应急通信系统分簇路由协议

无人机集群应急通信系统面临的最大挑战为集群网络拓扑的快速变化,因此,高效的自组网路由协议是保证无人机集群应急通信系统具有稳......

期刊

无人机集群应急通信系统 Q学习分簇路由协议

一种基于NOMA的Q学习卫星通信随机接入方法

基于非正交多址接入(NOMA)的Q学习(Q-Learning)随机接入方法(NORA-QL)是实现物联网中海量设备泛在接入的一项有效技术.为了解决NOR......

期刊

卫星通信随机接入能量效率过载控制非正交多址接入 Q学习

基于Q学习的深度强化学习研究

近些年来,深度强化学习在人工智能领域扮演着越来越重要的角色。但当面对高像素图像游戏的时候,深度强化学习的训练稳定性不佳。深......

学位

深度强化学习过高估计张量分解 Q学习

基于Q学习的捷变频雷达频点跟踪与决策方法

针对捷变频雷达载频在一定频带内不断变化导致干扰方不能有效跟踪雷达频点的问题,提出了一种基于Q学习算法的捷变频雷达频点跟踪决......

期刊

捷变频雷达频点跟踪与干扰决策 Q学习强化学习

基于轨迹式的Q学习算法对探索环境预处理的研究

为了处理探索环境中的变化和减少智能体不必要的从头学习的时间,研究了对探索环境的预处理方法,提出了运用轨迹标记的Q学习算法尝......

期刊

Q学习探索环境策略重用预处理

基于Q学习优化BP神经网络的BLDCM转速PID控制

为了提高无刷直流电机(BLDCM)的工作稳定性,设计了一种基于Q学习算法优化的BP神经网络控制器(QBP-PID).QBP-PID利用BP神经网络(BPN......

期刊

控制理论与控制工程无刷直流电机 PID控制器 BP神经网络 Q学习

融合有效方差置信上界的Q学习智能干扰决策算法

为进一步提升基于值函数强化学习的智能干扰决策算法的收敛速度,增强战场决策的有效性,设计了一种融合有效方差置信上界思想的改进......

期刊

干扰决策强化学习有效方差置信上界 Q学习干扰动作剔除马尔科夫决策过程

一种基于无限时域无模型的在线Q学习算法

针对连续线性系统的无限时域最优控制的在线实现问题,在系统动态完全未知的条件下设计了一种在线Q学习算法.基于无限时域最优控制......

期刊

最优控制哈密顿函数 Q学习 Actor/Critic逼近器

基于强化学习的多目标点航关联方法

针对密集杂波环境下的多目标点迹-航迹关联问题，以强化学习（Reinforcement Learning， RL）方法为基础，提出了一种基于Q学习的多目标点迹-......

期刊

多目标点迹-航迹关联 Q学习 MDP模型策略函数 Q表再学习

长距离自由空间光通信中基于机器学习的Spinal码关键技术研究

在长距离自由空间光（FSO）通信中,信号强度会因为受到湍流、散射、吸收等因素的影响而衰减,而大气湍流是最重要的因素。大气湍流会干......

学位

自由空间光通信 Spinal码湍流信道强化学习 Q学习深度强化学习深度Q网络

基于DQN的边缘服务器视频缓存算法研究

随着近几年互联网用户数量和视频数量的增长,视频传输流量成为互联网的流量的主要组成部分。在有限的带宽资源下,满足视频传输的服......

学位

强化学习 Q学习边缘缓存网络视频

面向车辆延迟容忍网络自适应路由算法的研究

在车辆自组织网络（Vehicular Ad-Hoc Networks,VANETs）的背景下节点的资源十分有限,节点之间难以找到一条稳定的通讯路径,传统的路由......

学位

VDTN路由算法 Q学习节点活跃度信誉值网络拥塞

混合动力工程车辆智能化能量管理方法研究

一直以来,工程车辆在基础建设、工业生产以及矿山开采等领域扮演着重要角色。然而在节能降耗的大趋势下,工程车辆作为高能耗、高排......

学位

混合动力系统工程车辆能量管理方法 Q学习 Dyna-Q学习虚拟世界模型

面向大规模机器类通信的设备接入与资源分配算法研究

随着第一版5G国际标准于2018年9月正式冻结,5G的大门正式开启。5G技术的广泛应用给人们生活的方方面面带来了巨大的改变。机器类通......

学位

机器类通信随机接入早期数据传输动态前导码分配 Q学习帧结构设计

双媒质协作中继性能分析与资源优化

通信技术发展除了满足可靠性和有效性等基本要求外,应用中还要结合实际场景考虑建设成本和复杂度等因素。无线通信技术和电力线通......

学位

双媒质协作通信自适应中继策略全双工功率分配 Q学习

无线传感器网络中基于强化学习的非连续无人机数据采集轨迹规划

一般来说无线传感器在电源能量、通信能力以及计算和存储能力方面存在一定的条件限制,影响了网络的数据采集效率、生命周期等性能......

学位

WSN 数据采集 UAV 路径规划 Q学习安全

混合频谱共享方式下多用户动态频谱分配算法

为解决混合overlay/underlay频谱共享方式下多用户动态频谱分配问题,构建了混合频谱共享方式下动态频谱分配模型,提出了基于Q学习......

期刊

Q学习频谱分配多智能体异质用户混合频谱共享方式

计算机博弈算法在黑白棋中的应用

计算机博弈是人工智能的重要分支之一,文章对人工智能算法黑白棋中的应用进行了研究.首先介绍了计算机博弈中的经典黑白棋算法,然......

期刊

蒙特卡洛树搜索深度强化学习马尔科夫决策过程 Q学习 SARSA

看过本文同时还关注