强化学习相关硕士博士期刊学术论文

强化学习相关论文

热电联产机组灵活运行特性分析与控制研究

构建以新能源为主体的新型电力系统是实现“双碳”目标的重要手段和必由之路。然而,新能源的大规模并网给燃煤机组提出了新的挑战......

学位

热电联产机组机-炉-热系统非线性模型电热协调控制强化学习热电解耦

基于态势量的电力变压器健康状态预测方法研究

变压器是电力系统的关键枢纽设备,其运行可靠性直接关系电网的稳定。对变压器的健康状态和故障情况进行评估和诊断是保障其安全稳......

学位

变压器健康状态预测态势量结构优化注意力模型混沌预测强化学习

多种决策机制下一类多智能体系统协同控制问题研究

近年来,随着网络化系统和智能控制理论研究的不断深入,多智能体系统协同控制方法在多机器人系统、传感器网络等领域展现出广泛的应......

学位

决策机制多智能体系统协同控制博弈论强化学习

引入强化学习的电力市场均衡分析方法及其应用研究

随着我国电力体制改革的深化和“以新能源为主体的新型电力系统”建设的推进,电力市场将呈现市场主体多元化、交易品种多样化、组......

学位

电力市场均衡分析强化学习机制设计

基于复杂网络理论的僵尸网络检测关键技术研究

随着互联网的持续演化,僵尸网络呈现出平台多样化、通信隐蔽化、控制智能化等特点,以5G、物联网、智能终端、云存储、社交平台为代......

学位

僵尸网络检测复杂网络社区发现强化学习图神经网络

面向计算机视觉的生成对抗网络研究与应用

随着人工智能和深度学习的快速发展,面向计算机视觉的生成模型研究获得了广泛的应用。其中,生成对抗网络具有最深远的影响。相较于......

学位

生成对抗网络训练动态不稳定模式崩溃多鉴别器集成隐层表征特征均衡半监督学习强化学习

无人机通信系统的无线资源智能管理技术研究

随着通信用户的增多,传统的地面通信网络已无法满足人们对无线通信超可靠性、高服务质量、多样性的需求。无人机通信作为一种典型......

学位

无人机通信无线资源管理智能决策强化学习无人机集群

基于能量流测试与仿真的汽油混合动力系统节能研究

在“电气化、智能化、网联化和共享化”潮流的引领下,汽车工业正经历自诞生以来百年未有之大变革,混合动力是现阶段节能汽车发展的......

学位

能量流混合动力整车能量管理等效燃油消耗最小策略动态规划模型预测控制强化学习

基于共识主动性的多智能体联合学习算法及其应用研究

伴随着无线通信技术的快速发展以及人工智能技术的迅猛兴起,智能体的概念逐渐出现在现代生活和先进的生产活动当中。智能体是指具......

学位

共识主动性智能体多智能体系统群体智能强化学习多智能体强化学习联邦学习群体协作

基于强化学习的码头集装箱装卸智能化系统的设计与实现

随着互联网、云计算、大数据和人工智能等技术的不断成熟,港口行业也在迈入与信息化深度融合、向智能化跨越发展的新时代。当前,全......

学位

多智能体系统强化学习集装箱装卸算法验证

基于强化学习的实时广告竞价策略

实时广告竞价（Real-Time Bidding,RTB）目前是现代互联网广告行业普遍采用的流量交易方法,结合大数据技术能够做到广告针对相应用户的......

学位

广告竞价强化学习竞价策略马尔科夫决策

基于强化学习的导弹制导控制系统设计

制导与姿态控制系统是导弹控制系统的两个重要部分,导弹的姿态控制系统即为导弹自动驾驶仪。目前,在设计制导律时,需要充分考虑飞......

学位

导弹强化学习制导控制系统控制参数过载跟踪

基于机器学习的网络安全主动防御技术研究

随着人工智能、大数据等技术的快速发展,诸如数据加密、身份认证等传统网络安全被动防御技术已经无法完全抵御智能化、复杂化、多......

学位

入侵检测堆叠稀疏自动编码器麻雀搜索算法随机博弈强化学习

基于强化学习的无线网络认知抗干扰决策研究

随着无线通信技术的发展,信道环境变得越来越复杂。无线通信由于其广播性质,十分容易受到恶意干扰者的袭击。针对未知且对抗的频谱......

学位

认知无线电抗干扰强化学习深度学习随机博弈

多水下机器人路径规划与编队控制研究

水下机器人活动范围广、智能化程度高,在海洋资源开发、海洋军事和海洋科学发展等领域具有广阔的应用前景。水下机器人除了用于自......

学位

水下机器人强化学习路径规划编队控制人工势场法

混合动力重型卡车能量管理优化策略研究

重型卡车作为重要的交通运输工具之一,节能高效已成为其首要设计指标。一方面节能高效的设计可以减少重型卡车的能源消耗与污染物......

学位

混合动力重型卡车动态规划等效燃油消耗最小策略强化学习能量管理策略

基于深度Q学习和可变形卷积U-Net的肝脏肿瘤分割方法

针对传统卷积神经网络U-Net对早期肝脏肿瘤的分割精度低的问题,在U-Net的基础上提出了基于深度Q学习和可变形卷积U-Net的肝脏肿瘤......

期刊

强化学习深度学习可变形卷积图像分割肝脏肿瘤

基于艾宾浩斯遗忘曲线和注意力机制的推荐算法

传统基于注意力机制的推荐算法只利用位置嵌入对用户行为序列进行建模，忽略了具体的时间戳信息，导致推荐性能不佳和模型训练过拟合等......

期刊

艾宾浩斯遗忘曲线注意力机制强化学习经验回放

战时航材供应保障决策建模与仿真

战时航材供应保障决策是影响航空兵部队持续作战能力的关键因素,本文针对战时航材需求的不确定性和动态性特点,建立了以航材满足和......

会议

战时航材供应强化学习神经网络

智慧交通场景下基于多智能体强化学习的任务协同框架

随着人工智能、车联网等技术不断发展,交通智慧化建设不断推进,大幅提升了交通效率与出行的便利性。在智慧交通场景下,一些计算密......

期刊

计算任务卸载边缘计算多智能体强化学习时空预测

面向边云协同的视频监控系统调度与优化研究

摄像头视频监控已经广泛运用在智能家居、智慧医疗、智慧交通等领域。传统视频监控数据的处理分析主要在云端完成。近年来随着摄像......

学位

边云协同视频处理强化学习神经网络模型

基于深度强化学习的移动机械臂末端滑模控制技术

为提升移动机械臂末端滑模的单元控制时间，结合深度强化学习原理，设计移动机械臂末端滑模控制技术。布设多模态感知滑模控制节点，设计......

期刊

深度强化移动机械臂末端滑模控制技术强化学习移动控制

协作任务下的多智能体容错控制研究

近年来,人工智能技术不断取得突破性进展,多智能体系统作为人工智能领域重要研究内容,其被广泛应用于各个领域。然而在实际应用中,......

学位

多智能体系统强化学习一致性容错隐私

基于抽象的强化学习算法及其量子化

强化学习定义了仅通过行动和观察学会做出良好决策的智能体所面临的问题。为了成为有效的问题解决者,此类智能体必须有效地利用有......

学位

强化学习量子强化学习状态抽象动作抽象量子计算

深度强化学习及智能路径规划应用综述

强化学习是人工智能的重要分支，具备与环境直接交互学习能力并具有优化决策的特点。强化学习问世以来便受到科研学者广泛关注，并探索......

期刊

强化学习路径规划深度神经网络

基于复杂性竞争扰动的铁路货运期权定价模型

针对铁路货运市场特征,利用二叉树刻画运输价格形成过程,引入带有不同运输方式复杂博弈机制的竞争因子,建立铁路货运期权定价模型;......

期刊

铁路货运价格期权定价双层规划累积前景理论强化学习

基于时空图卷积的城市交通预测方法研究

随着我国城市化的高速发展,许多城市病问题也随之产生,城市交通问题也一直备受世界各国广泛关注。据公安部统计,2021年全国机动车......

学位

智慧城市时间序列预测深度学习时空图预测强化学习

基于深度强化学习的知识推理技术研究

知识图谱是指以结构化三元组的形式描述客观世界中的概念、实体及关系的知识网络,并以其优异的延展性和可解释性逐渐成为一个管理......

学位

知识图谱知识推理知识问答强化学习图注意力网络

云原生下基于深度强化学习的移动目标防御策略优化方案

针对云原生环境下攻击场景的复杂性导致移动目标防御策略配置困难的问题，该文提出一种基于深度强化学习的移动目标防御策略优化方案......

期刊

云原生移动目标防御强化学习微服务

强化学习在智能无人系统决策管理中的应用

智能无人系统需要在复杂环境下快速稳定地进行决策，并具备应对非预期状态的能力。智能无人系统往往由于环境及任务复杂度高而难以实......

期刊

智能无人系统强化学习决策管理智能体

中文脑部疾病医疗知识图谱的研究与应用

随着社会的高速发展,人们的生活水平越来越高,同时对医疗健康的关注也不断上升,使得对医学知识的需求不断增长。然而,信息的爆炸式......

学位

中文知识图谱稀疏图谱知识图谱补全强化学习

面向多车协同装车的物流装箱顺序优化研究

装箱的顺序对提升装载的空间利用率,降低企业成本具有重要的现实应用意义。但是在相关的研究工作中,学者们更注重对传统三维装箱问......

学位

装箱问题强化学习深度学习装箱顺序优化

离散四水库问题基准下基于n步Q-learning的水库群优化调度

水库优化调度问题是一个具有马尔可夫性的优化问题。强化学习是目前解决马尔可夫决策过程问题的研究热点，其在解决单个水库优化调度......

期刊

水库优化调度强化学习 Q学习惩罚函数可行方向法

下一代WLAN多链路聚合技术研究

下一代无线局域网（802.11be）旨在降低数据传输的时延、提高系统吞吐量以及增强数据传输的可靠性,为用户提供稳定可靠低时延的高速数......

学位

无线局域网多链路聚合信道接入机制强化学习

电力系统优化控制中强化学习方法应用及挑战

强化学习（Reinforcement learning， RL）方法目前已应用于电力系统的多个领域，在电力系统优化与控制领域的一些应用展现出良好的结果。......

期刊

强化学习电力系统优化与控制

基于类脑认知的机器人经验地图构建与导航

移动机器人通过管理资源并做出决策实现给定任务,它的效能直接取决于其自主导航的能力。复杂的场景对机器人环境建模和导航算法提......

学位

类脑导航移动机器人经验地图贝叶斯估计强化学习

增强现实辅助的互认知人机安全交互系统

在现代制造业中，人和机器人的交互共融是制造智能化的焦点问题之一。在人机交互中，机器人对工人的伤害风险是影响安全生产的关键因素......

期刊

智能制造人机交互增强现实强化学习安全策略

深度强化学习中的知识迁移方法研究综述

深度强化学习是人工智能研究中的热点问题，随着研究的深入，其中的短板也逐渐暴露出来，如数据利用率低、泛化能力弱、探索困难、缺乏推......

期刊

人工智能知识迁移强化学习深度强化学习迁移学习

基于强化学习的需求分布未知情境下酒店客房动态定价研究

传统酒店动态定价研究大多考虑改进需求预测方法或考虑需求环境已知，而现实生活中需求分布通常是未知的. 本文考虑需求分布未知的......

期刊

强化学习动态定价 SARSA（λ）算法收益管理

基于强化学习的软件持续集成测试优化技术研究

在软件开发持续集成测试环境中,当程序员提交集成代码时,测试用例的优先级排序技术可以通过优先执行潜在发现错误的测试用例,尽早......

学位

持续集成测试强化学习内部激励机制测试环境可达性测试用例优先排序

ChatGPT翻开了硬币的哪一面？

...

报纸

智能生成强化学习科技伦理生成式人工智能技术人工智能领域 ChatGPT

基于深度强化学习的工业多终端计算卸载研究

在传统工业生产车间设备监测与运维过程中,存在边缘端设备难以对车间设备产生数据进行高效实时处理的问题。完整的物联网体系为工......

学位

工业物联网边缘计算计算卸载资源分配强化学习

基于强化学习的边缘计算网络资源优化研究

伴随着边缘智能、工业物联网、智能机器人等产业的蓬勃发展,用户对差异化、个性化和智能化的通信需求与日俱增。加之,网络资源短缺......

学位

强化学习网络资源优化资源共享控制与决策体验质量

基于迁移学习与主动学习的服装图像标注与分类

近年来随着服装电商的蓬勃发展,网络上存在海量的服装图像,如何给网络服装图片进行更好的服装描述,即进行文本标注和分类,从而吸引......

学位

图像分类图像标注强化学习迁移学习变分自编码主动学习

基于深度强化学习的医学报告自动生成方法研究

医学影像报告自动生成是医学影像分析中的最重要的任务之一。近年来,医学影像已成为疾病诊断中最常用的医学检查方法。放射科医生......

学位

胸片医学报告生成强化学习注意力机制

电网仿真分析与决策的人工智能方法

电网仿真是电网运行规划的支撑型技术,被广泛应用于电网各种运行方式的分析与决策。然而,目前基于电网仿真的分析与决策仍然需要人......

期刊

电网仿真分析决策人工智能深度学习强化学习

风场中平流层飞艇轨迹智能控制方法

平流层飞艇具有区域驻留持久稳定、载荷能力强、平台位置优越等优势,是极佳的观测侦查平台,应用潜力巨大,是当前临近空间领域的主......

学位

平流层飞艇轨迹跟踪控制神经网络强化学习 Q-learning

基于强化学习的禁飞区绕飞智能制导技术研究

人工智能（AI）的快速发展为飞行器制导技术的研究提供新的技术途径。本文针对高速飞行器面临不确定禁飞区的绕飞问题，提出“预测校正制......

期刊

智能制导禁飞区绕飞强化学习 PPO算法

基于强化学习的高速公路自动驾驶决策方法研究

近年来,各种基于人工智能的应用在越来越多的领域中逐步取得比原有方法更好的效果。其中,自动驾驶逐渐成为人工智能领域最重要的落......

学位

强化学习车道跟随自动超车深度确定性策略梯度近端策略优化

基于SAC算法的四旋翼无人机姿态控制

近年来,飞行器控制向智能化发展,将深度强化学习应用于飞行器控制成为备受关注的热门话题。针对此话题,采用基于深度强化学习算法P......

会议

四旋翼无人机姿态控制强化学习 GymFC Soft Actor Critic

看过本文同时还关注