强化学习相关论文
构建以新能源为主体的新型电力系统是实现“双碳”目标的重要手段和必由之路。然而,新能源的大规模并网给燃煤机组提出了新的挑战......
变压器是电力系统的关键枢纽设备,其运行可靠性直接关系电网的稳定。对变压器的健康状态和故障情况进行评估和诊断是保障其安全稳......
近年来,随着网络化系统和智能控制理论研究的不断深入,多智能体系统协同控制方法在多机器人系统、传感器网络等领域展现出广泛的应......
随着我国电力体制改革的深化和“以新能源为主体的新型电力系统”建设的推进,电力市场将呈现市场主体多元化、交易品种多样化、组......
随着人工智能和深度学习的快速发展,面向计算机视觉的生成模型研究获得了广泛的应用。其中,生成对抗网络具有最深远的影响。相较于......
随着通信用户的增多,传统的地面通信网络已无法满足人们对无线通信超可靠性、高服务质量、多样性的需求。无人机通信作为一种典型......
在“电气化、智能化、网联化和共享化”潮流的引领下,汽车工业正经历自诞生以来百年未有之大变革,混合动力是现阶段节能汽车发展的......
伴随着无线通信技术的快速发展以及人工智能技术的迅猛兴起,智能体的概念逐渐出现在现代生活和先进的生产活动当中。智能体是指具......
随着互联网、云计算、大数据和人工智能等技术的不断成熟,港口行业也在迈入与信息化深度融合、向智能化跨越发展的新时代。当前,全......
实时广告竞价(Real-Time Bidding,RTB)目前是现代互联网广告行业普遍采用的流量交易方法,结合大数据技术能够做到广告针对相应用户的......
制导与姿态控制系统是导弹控制系统的两个重要部分,导弹的姿态控制系统即为导弹自动驾驶仪。目前,在设计制导律时,需要充分考虑飞......
随着人工智能、大数据等技术的快速发展,诸如数据加密、身份认证等传统网络安全被动防御技术已经无法完全抵御智能化、复杂化、多......
随着无线通信技术的发展,信道环境变得越来越复杂。无线通信由于其广播性质,十分容易受到恶意干扰者的袭击。针对未知且对抗的频谱......
重型卡车作为重要的交通运输工具之一,节能高效已成为其首要设计指标。一方面节能高效的设计可以减少重型卡车的能源消耗与污染物......
针对传统卷积神经网络U-Net对早期肝脏肿瘤的分割精度低的问题,在U-Net的基础上提出了基于深度Q学习和可变形卷积U-Net的肝脏肿瘤......
传统基于注意力机制的推荐算法只利用位置嵌入对用户行为序列进行建模,忽略了具体的时间戳信息,导致推荐性能不佳和模型训练过拟合等......
战时航材供应保障决策是影响航空兵部队持续作战能力的关键因素,本文针对战时航材需求的不确定性和动态性特点,建立了以航材满足和......
摄像头视频监控已经广泛运用在智能家居、智慧医疗、智慧交通等领域。传统视频监控数据的处理分析主要在云端完成。近年来随着摄像......
为提升移动机械臂末端滑模的单元控制时间,结合深度强化学习原理,设计移动机械臂末端滑模控制技术。布设多模态感知滑模控制节点,设计......
近年来,人工智能技术不断取得突破性进展,多智能体系统作为人工智能领域重要研究内容,其被广泛应用于各个领域。然而在实际应用中,......
强化学习定义了仅通过行动和观察学会做出良好决策的智能体所面临的问题。为了成为有效的问题解决者,此类智能体必须有效地利用有......
强化学习是人工智能的重要分支,具备与环境直接交互学习能力并具有优化决策的特点。强化学习问世以来便受到科研学者广泛关注,并探索......
针对铁路货运市场特征,利用二叉树刻画运输价格形成过程,引入带有不同运输方式复杂博弈机制的竞争因子,建立铁路货运期权定价模型;......
随着我国城市化的高速发展,许多城市病问题也随之产生,城市交通问题也一直备受世界各国广泛关注。据公安部统计,2021年全国机动车......
知识图谱是指以结构化三元组的形式描述客观世界中的概念、实体及关系的知识网络,并以其优异的延展性和可解释性逐渐成为一个管理......
针对云原生环境下攻击场景的复杂性导致移动目标防御策略配置困难的问题,该文提出一种基于深度强化学习的移动目标防御策略优化方案......
智能无人系统需要在复杂环境下快速稳定地进行决策,并具备应对非预期状态的能力。智能无人系统往往由于环境及任务复杂度高而难以实......
随着社会的高速发展,人们的生活水平越来越高,同时对医疗健康的关注也不断上升,使得对医学知识的需求不断增长。然而,信息的爆炸式......
装箱的顺序对提升装载的空间利用率,降低企业成本具有重要的现实应用意义。但是在相关的研究工作中,学者们更注重对传统三维装箱问......
水库优化调度问题是一个具有马尔可夫性的优化问题。强化学习是目前解决马尔可夫决策过程问题的研究热点,其在解决单个水库优化调度......
下一代无线局域网(802.11be)旨在降低数据传输的时延、提高系统吞吐量以及增强数据传输的可靠性,为用户提供稳定可靠低时延的高速数......
强化学习(Reinforcement learning, RL)方法目前已应用于电力系统的多个领域,在电力系统优化与控制领域的一些应用展现出良好的结果。......
移动机器人通过管理资源并做出决策实现给定任务,它的效能直接取决于其自主导航的能力。复杂的场景对机器人环境建模和导航算法提......
在现代制造业中,人和机器人的交互共融是制造智能化的焦点问题之一。在人机交互中,机器人对工人的伤害风险是影响安全生产的关键因素......
深度强化学习是人工智能研究中的热点问题,随着研究的深入,其中的短板也逐渐暴露出来,如数据利用率低、泛化能力弱、探索困难、缺乏推......
传统酒店动态定价研究大多考虑改进需求预测方法或考虑需求环境已知, 而现实生活中需求分布通常是未知的. 本文考虑需求分布未知的......
期刊
在传统工业生产车间设备监测与运维过程中,存在边缘端设备难以对车间设备产生数据进行高效实时处理的问题。完整的物联网体系为工......
伴随着边缘智能、工业物联网、智能机器人等产业的蓬勃发展,用户对差异化、个性化和智能化的通信需求与日俱增。加之,网络资源短缺......
近年来随着服装电商的蓬勃发展,网络上存在海量的服装图像,如何给网络服装图片进行更好的服装描述,即进行文本标注和分类,从而吸引......
医学影像报告自动生成是医学影像分析中的最重要的任务之一。近年来,医学影像已成为疾病诊断中最常用的医学检查方法。放射科医生......
电网仿真是电网运行规划的支撑型技术,被广泛应用于电网各种运行方式的分析与决策。然而,目前基于电网仿真的分析与决策仍然需要人......
平流层飞艇具有区域驻留持久稳定、载荷能力强、平台位置优越等优势,是极佳的观测侦查平台,应用潜力巨大,是当前临近空间领域的主......
人工智能(AI)的快速发展为飞行器制导技术的研究提供新的技术途径。本文针对高速飞行器面临不确定禁飞区的绕飞问题,提出“预测校正制......
近年来,各种基于人工智能的应用在越来越多的领域中逐步取得比原有方法更好的效果。其中,自动驾驶逐渐成为人工智能领域最重要的落......
近年来,飞行器控制向智能化发展,将深度强化学习应用于飞行器控制成为备受关注的热门话题。针对此话题,采用基于深度强化学习算法P......