Q学习相关硕士博士期刊学术论文

Q学习相关论文

基于Q学习的多无人机协同航迹规划方法

针对多无人机同时到达目标的航迹规划问题，建立战场环境模型和单无人机航迹规划的马尔可夫决策模型，基于Q学习算法解算航程最短的最......

期刊

多无人机航迹规划 Q学习时间协同碰撞避免

离散四水库问题基准下基于n步Q-learning的水库群优化调度

水库优化调度问题是一个具有马尔可夫性的优化问题。强化学习是目前解决马尔可夫决策过程问题的研究热点，其在解决单个水库优化调度......

期刊

水库优化调度强化学习 Q学习惩罚函数可行方向法

基于强化学习的边缘计算网络资源在线分配方法

针对边缘计算应用对实时性的要求,引入软件定义网络和网络功能虚拟化技术对边缘计算网络进行重构.基于此,考虑以最大化长期平均实......

期刊

边缘计算资源分配实时任务马尔可夫决策过程 Q学习深度强化学习

基于Q学习的多任务多目标粒子群优化算法

多任务粒子群优化算法（Multi-Task Particle Swarm Optimization,MTPSO）通过知识迁移学习，具有快速收敛能力，广泛应用于求解多任务多目......

期刊

多任务多目标优化粒子群优化知识迁移 Q学习柯西分布局部搜索

无人机辅助的车载自组网路由协议研究

近些年,车载自组网（Vehicular Ad Hoc Network,VANET）作为城市智能交通系统（Intelligent transportation system,ITS）的核心部分,通过......

学位

车载自组网无人机路由协议节点通信 Q学习

基于5G和无人机集群的机动通信技术研究

聚焦当前战场机动通信系统所面临的带宽窄、低速率、时延高和联通性差等现实问题和挑战,将5G通信技术和无人机集群技术相融合受到......

学位

5G 无人机集群机动通信动态分簇 Q学习路由协议

基于深度强化学习的机器人路径规划

针对传统强化学习中Q学习算法在机器人路径规划过程中易引发维数灾难及搜索效率低的问题，提出一种深度强化学习算法。在Q学习算法中......

期刊

Q学习深度强化学习机器人路径规划

Q学习实现亚马逊棋评估函数自调参

在亚马逊棋评估函数模型中进行参数调试，主要由人工依靠经验反复实验来实现，效率较低且无法保证精度。针对人工调参效率低下、精确度......

期刊

计算机博弈亚马逊棋强化学习 Q学习评估函数

基于机器学习的USRP RIO抗干扰跳频通信系统的研究

无线通信技术的快速发展,不仅改变了人们的生活方式,而且改变了现代和未来的战争模式。为保障信息传输的可靠性,通信系统须具备抗......

学位

抗干扰 USRP RIO 自适应跳频 Q学习长短期记忆网络

两相交错并联DC-DC变换器系统效率优化

针对均流控制方案无法保证两相交错并联直流-直流（DC-DC）变换器系统效率处于最优，从而造成能源浪费的问题，提出一种基于电流分配的效率......

期刊

两相交错并联DC-DC变换器效率优化电流分配支持向量回归 Q学习

基于强化学习的生鲜农产品库存优化

随着中国经济的发展,人民逐渐富了起来,生活水平与之前相比有了很大的提高,生鲜行业也得到了快速的发展,此时一些问题逐渐显现了出......

学位

强化学习 Q学习生鲜农产品库存控制订购策略

基于Q学习的无线传感网自适应容侵覆盖优化方法

针对无线传感器节点易受干扰和入侵的特点，为保障网络覆盖和安全性，基于信任管理和Q学习提出了一种新的自适应容侵覆盖优化方法。所......

期刊

无线传感器网络（WSN）信任管理 Q学习覆盖优化容侵

基于强化学习的作业车间动态调度问题研究

随着当前经济全球化的不断深入和客户需求的不断变化,制造企业面临的外部环境越来越复杂多变,经典的以提高算法优化能力为核心的静......

学位

动态调度算法调度规则 Q学习深度强化学习作业车间

未知环境下移动机器人路径规划算法研究

路径规划一直是机器人领域的研究重点。已有机器人路径规划研究大多基于环境已知,但许多情况下,机器人所处环境是未知的,如何在未......

学位

路径规划快速扩展随机树自适应人工势场 Q学习径向基神经网络

基于定向天线的无线自组网邻居发现技术研究

具备无需固定基础设施、无中心和动态网络拓扑优势的无线自组网已被广泛应用于应急、救灾和战场等特殊目的通信场景中。通过使用定......

学位

无线自组网邻居发现自适应波束天线节点冲突 Q学习

环境感知信息辅助的认知雷达波形参数智能选择

现代雷达往往需要在复杂多变的电磁环境中完成多种任务。如何提升雷达的智能化水平，使其能够适应环境变化和任务需求，已成为近年来备......

期刊

杂波环境感知认知雷达机载雷达机动目标跟踪目标检测 Q学习深度Q学习网络

基于学习的布谷鸟搜索算法研究

布谷鸟搜索算法（Cuckoo Search,CS）是一种新型群体智能优化算法,该算法通过模拟自然界布谷鸟寻找鸟窝寄生幼雏的行为,实现群体智能寻......

学位

布谷鸟搜索算法 Q学习自适应选择知识学习工程优化

基于启发式Q学习的FANET可信路由算法

无人机自组织网络（FANET）是实现无人机自主集群的关键技术，其通过各无人机节点来完成协同通信。但节点的高机动性、网络结构的开放性......

期刊

无人机自组织网络路由攻击信任模型 Q学习启发式函数

基于强化学习的多用户功率智能分配

随着无线通信的发展,频谱资源利用率低这一现象已经引发了广泛关注。为了使不可再生的频谱资源得到更充分地利用,多项技术被用来实......

学位

功率分配无线资源管理多智能体强化学习 Q学习

大规模机器类通信网络中基于干扰控制的资源分配方法研究

作为第五代移动通信系统（The Fifth Generation Mobile Communication System,5G）三大应用场景之一的大规模机器类通信（massive Machi......

学位

大规模机器类通信干扰图资源分配 Q学习功率控制

基于回溯思想的高效强化学习末制导律设计

在现阶段空空攻防战中,末制导律阶段由于其作为弹目最终交汇条件的判断依据,因此在控制领域中收到广泛关注。现如今,基于末制导律......

学位

强化学习高效强化学习末制导律 Q学习回溯式更新方法

高层住宅电梯群控系统调度研究

电梯群控技术在大型公共建筑中被广泛采用以优化电梯调度,在缩短用户等待时间、降低电梯运行能耗和机械损耗等方面成效显著。然而,......

学位

高层住宅电梯群模式识别 Q学习蚁群算法半物理仿真

基于H-CRAN的聚类及资源管理算法研究

5G超密集组网技术通过在宏基站范围内密集部署小基站,提升了用户体验、信号覆盖率和系统容量,但同时也导致了越发复杂的拓扑结构和......

学位

超密集组网 H-CRAN架构资源分配聚类算法 Q学习

基于强化学习的网络入侵检测模型研究

随着互联网技术及应用的不断发展,网络已经在商业、经济、军事等各个领域都发挥着巨大作用,而成为人类社会发展不可缺少的部分。然......

学位

入侵检测马尔科夫决策过程强化学习信用度 Q学习 Flink

基于强化学习的公交信号优先控制研究

我国经济的快速发展使得近年来汽车保有量迅速增加、城市交通需求激增,随之带来的交通拥堵问题已严重影响了城市的发展和居民的生......

学位

交通信号灯信号控制公交信号优先雾计算 Q学习

城市环境中车辆边缘计算任务卸载策略研究

5G通信技术的快速发展和应用,加快了整个社会的信息化和智能化进程。作为智能交通系统（Intelligent Traffic System,ITS）重要组成部......

学位

车联网边缘计算任务卸载 Q学习

基于潜器协同的水下数据收集算法研究

水下数据收集是水下传感器网络应用研究的基础。在水下传感器网络中,传感器节点的部署稀疏性的特点,限制了水下数据收集的范围。水......

学位

水下传感器网络数据收集 Q学习潜器任务分配

基于Q学习的WSNs帧长自适应MAC协议

随着人工智能、机器学习研究的深入,Q学习算法也开始应用于无线传感器网络（Wireless sensor networks,WSNs）介质访问控制（Medium acce......

学位

WSNs 介质访问控制 Q学习帧长自适应

基于Q学习的智能交通信号灯优化

利用Q学习发展出的D3QN模型来实现交通信号控制智能体,模型采用离散交通状态编码的状态集,将交叉口处车辆的位置-速度二维矩阵图经......

期刊

自适应交通信号控制 Q学习相位切换马尔科夫决策过程

基于深度强化学习的微电网在线优化

针对微电网的随机优化调度问题，提出了一种基于深度强化学习的微电网在线优化算法。利用深度神经网络近似状态-动作值函数，把蓄电池......

期刊

微电网调度 Q学习在线优化蒙特卡洛深度强化学习

适用于无人机集群应急通信系统分簇路由协议

无人机集群应急通信系统面临的最大挑战为集群网络拓扑的快速变化,因此,高效的自组网路由协议是保证无人机集群应急通信系统具有稳......

期刊

无人机集群应急通信系统 Q学习分簇路由协议

基于Q学习的深度强化学习研究

近些年来,深度强化学习在人工智能领域扮演着越来越重要的角色。但当面对高像素图像游戏的时候,深度强化学习的训练稳定性不佳。深......

学位

深度强化学习过高估计张量分解 Q学习

基于强化学习的多目标点航关联方法

针对密集杂波环境下的多目标点迹-航迹关联问题，以强化学习（Reinforcement Learning， RL）方法为基础，提出了一种基于Q学习的多目标点迹-......

期刊

多目标点迹-航迹关联 Q学习 MDP模型策略函数 Q表再学习

长距离自由空间光通信中基于机器学习的Spinal码关键技术研究

在长距离自由空间光（FSO）通信中,信号强度会因为受到湍流、散射、吸收等因素的影响而衰减,而大气湍流是最重要的因素。大气湍流会干......

学位

自由空间光通信 Spinal码湍流信道强化学习 Q学习深度强化学习深度Q网络

基于DQN的边缘服务器视频缓存算法研究

随着近几年互联网用户数量和视频数量的增长,视频传输流量成为互联网的流量的主要组成部分。在有限的带宽资源下,满足视频传输的服......

学位

强化学习 Q学习边缘缓存网络视频

面向车辆延迟容忍网络自适应路由算法的研究

在车辆自组织网络（Vehicular Ad-Hoc Networks,VANETs）的背景下节点的资源十分有限,节点之间难以找到一条稳定的通讯路径,传统的路由......

学位

VDTN路由算法 Q学习节点活跃度信誉值网络拥塞

混合动力工程车辆智能化能量管理方法研究

一直以来,工程车辆在基础建设、工业生产以及矿山开采等领域扮演着重要角色。然而在节能降耗的大趋势下,工程车辆作为高能耗、高排......

学位

混合动力系统工程车辆能量管理方法 Q学习 Dyna-Q学习虚拟世界模型

面向大规模机器类通信的设备接入与资源分配算法研究

随着第一版5G国际标准于2018年9月正式冻结,5G的大门正式开启。5G技术的广泛应用给人们生活的方方面面带来了巨大的改变。机器类通......

学位

机器类通信随机接入早期数据传输动态前导码分配 Q学习帧结构设计

双媒质协作中继性能分析与资源优化

通信技术发展除了满足可靠性和有效性等基本要求外,应用中还要结合实际场景考虑建设成本和复杂度等因素。无线通信技术和电力线通......

学位

双媒质协作通信自适应中继策略全双工功率分配 Q学习

无线传感器网络中基于强化学习的非连续无人机数据采集轨迹规划

一般来说无线传感器在电源能量、通信能力以及计算和存储能力方面存在一定的条件限制,影响了网络的数据采集效率、生命周期等性能......

学位

WSN 数据采集 UAV 路径规划 Q学习安全

一种空间仿生柔性机器人设计与智能规划仿真方法

针对传统空间刚体机器人存在的自由度有限和环境适应性差等缺陷，基于生物体结构提出了一种受“尺蠖”与“蛇”启发的适用于空间在轨......

期刊

仿生机器人形状记忆合金 Q学习智能规划

含新能源和电动汽车并网的配电网无功优化研究

新能源和电动汽车的快速发展及其在配电网的并网给配电网的无功优化带来了严重的困难。在分析新能源和电动汽车功率随机特性的基础......

期刊

新能源电动汽车配电网无功优化 Q学习蚁群算法

高比例光伏微网无功均分控制中的Q学习方法

针对采用传统下垂控制的分布式电源无功功率分配不均,提出了一种高比例光伏微网无功均分控制中的Q学习方法。该策略融合人工智能算......

期刊

Q学习微电网高比例光伏无功均分下垂控制

基于认知无线电的频谱分配和调度技术研究

随着无线通信技术在人们日常生活中的广泛应用，频谱资源匮乏问题日益严重。研究表明，目前的固定频谱分配制度导致频谱资源平均利用率......

学位

认知无线电频谱分配 Q学习机会调度博弈决策

基于改进Q学习的异构网络接纳控制算法研究

下一代移动通信系统是高度集成多种异构无线网络技术的。不同无线网络之间互相融合,通过提供额外的资源可以达到技术互补的效果。......

学位

异构网络会话接纳控制 Q学习用户体验模拟退火

基于Q学习的LTE/WLAN网络接入控制算法研究

随着无线通信技术的不断发展，人们对于通信的无缝性、高速性及网络泛在化的要求不断提高，单一网络已经很难满足用户的需求。因此，异构......

学位

LTE WLAN 异构网络接入控制技术 Q学习

机器人足球环境下的多机器人协作设计

随着多机器人系统越来越广泛的应用，多机器人协作也受到了越来越多学者的关注，它是多机器人系统中一个关键部分，直接关系到系统完成任......

学位

机器人足球多机器人协作混合系统符号推理系统基于行为主义的体系结构实时控制系统 Q学习

基于半马尔可夫决策过程的风机维修优化研究

当今世界,能源是人类生存和发展的重要基础。其中风能是一种分布广泛的清洁型能源,风力发电也越来越受到人类的关注与重视。与此同......

学位

半马尔可夫决策过程策略迭代 Q学习风力发电机维修决策优化模型

基于Q学习和神经网络的双足机器人控制

被动动力学理论认为双足行走是双足机器人的固有特性,可以充分利用机器人自身的动力学特性提高能效。由于机器人结构的多样性,行走......

学位

双足步态 Q学习资格迹 BP神经网络仿真平台欠驱动机器人

基于Q学习的欠驱动双足机器人行走控制研究

被动动态步行是双足步行研究领域的一个重要分支,其目的在于挖掘动态步行本质特征,充分利用自身动力学特性提高能效。由于机器人的......

学位

欠驱动机器人 Q学习 RBF神经网络经验回放 ADAMS仿真

看过本文同时还关注