强化学习算法相关论文
以某三轴燃气轮机作为研究对象,针对燃气轮机各工况下转速失稳、不同海况下的动力响应需求、外部干扰等因素对燃气轮机工作状态的影......
近年来,序列化推荐系统由于其结合时序信息能够更好地获取用户的长期或短期的兴趣偏好的特点,超越了传统的基于协同过滤的推荐方法......
移动机器人是现阶段科研工作的重点内容之一,并且受到社会各界人士的广泛关注.基于此,本文针对当前移动机器人的智能路径规划算法......
现如今,物联网用户需求的不断增长以及相关应用的发展,给移动设备提出了更高的计算需求、带宽需求、存储需求等。但是受到电池容量......
随着大量分布式可再生能源注入电网,传统的单一能源优化利用模式正在发生变革。能源结构的多样性和耦合关系将对系统运行的安全与......
随着高比例可再生能源的渗透,主动配电网的建模对电网调度和规划非常重要.为了准确描述分布式发电的随机性和负荷的时变性,提出一......
针对智能体避障问题,采用强化学习算法予以解决.首先,介绍强化学习的原理,分析对比了解决强化学习中探索与利用平衡问题的ε-greed......
由于我国经济的迅速发展,人们休闲娱乐的方式也越来越多,外出旅游也成为人们追求生活质量的重要方式。在旅游出行前,人们通常会在网上......
2015年5月,国务院正式印发《中国制造2025》,全面推进“工业4.0”。“工业4.0”的核心是智能制造。而智能制造的基石是精益生产,工业......
2016年以来,随着AlphaGo在人机围棋比赛中的大胜,深度强化学习算法成为了智能系统决策技术的核心。集感知和决策功能一体化的端到端......
随着城市交通拥堵问题日益严重,智能交通信号控制技术作为缓解交通拥堵最有潜力的方法之一,受到了国内外广泛的关注。由于交通系统具......
算法作为当今科技高速发展时代下重要的工具,已经深刻影响了经济市场,推动着社会整体资源结构配置的优化。即时配送是互联网下先进算......
随着商业航天的发展,卫星的数目呈现出规模化增加的趋势,然而航天测控系统中的测控资源数量相对有限,因而如何对现有测控资源进行有效......
多智能体系统的最优一致性控制问题是指:在每个智能体仅知道自身和其邻居智能体信息的情况下,对每个智能体设计控制器,使每个智能体的......
近年来,人们在强化学习领域的研究已经取得了令人瞩目的成就。然而在场景较为复杂时,传统的强化学习算法面临维度灾难以及长期信度分......
在实际场景中,用户的身份标识符通常是不可用的,例如用户在购买商品前以未登陆的状态来浏览电商平台,或者匿名地浏览网页从而保护个人......
在制造系统的生产过程中,生产设备状态的衰变会降低产品的质量水平,导致多成品率质量问题。本文针对此类具有多成品率质量问题的衰变......
计算力学是一个全新的理论框架,主要研究动力学系统中的几何状态空间如何支持符号推理计算。Santa Fe研究所的Crutchfield教授从80......
随着高层建筑的不断增多和智能建筑的快速发展,人们对建筑物内的客流运输设备电梯提出了越来越高的要求。为了提高电梯的运输能力和......
多智能体系统由多个相互作用的自主智能体(Agent)形成的集合,其研究的核心问题是寻求建立一种有效的协同机制,使功能简单,相互独立......
分批补料发酵过程的反应特点包括强非线性、时间滞后、参数时变性以及生物状态量难以实时测量等,对产物、底物和时间消耗进行直接......
强化学习是一种从与环境交互中学习的机器学习技术,是目前机器学习研究中最活跃的方向之一。强化学习所面临的一个突出问题是大空间......
空间搜索能力与局面估值的准确性是决定棋类游戏水平高低的最重要的两个方面。六子棋游戏规则简单,但状态空间复杂度高,平均分枝因......
随着经济全球化,电子商务环境的竞争越来越激烈,人们必然会选择协商来解决利益冲突。利用agent自动协商技术可以替换人工协商费时......
从行为心理学发展而来,介于监督学习和非监督学习的强化学习算法,目前是机器学习研究领域的热点,越来越受到关注。现有的强化学习算法......
移动无线通信设备的暴增导致无线频谱资源日益稀缺,驱使蜂窝移动通信技术迅猛发展。LTE-U技术作为下一代蜂窝移动通信系统的关键技......
发展新能源汽车是我国的国家战略。为解决插电式混合动力汽车(Plug-in Hybrid Electric Vehicle,PHEV)对动力电池高比能量和高比功......
车载自组织网络(Vehicular Ad-hoc Networks,VANETs)作为智能交通系统的重要组成部分,为解决道路通行效率和车辆安全行驶等关键问......
本文作者对联想存储器进行了深入研究,提出了一种自适应强化学习算法,以改进双向联想存储器的学习。计算机软件仿真结果表明,这种改进......
根据电梯运行周期公式和强化学习原理,给出了双轿厢电梯动态运行的强化学习算法配置.提出双轿厢电梯动态运行模式的4种类型,给出双......
基于Q-强化学习算法,建立了进化博弈中代理人的决策模型.考虑到强化学习算法不需要建立环境模型,可以用于不完全、不确定信息问题......
本文针对多Agent系统强化学习中存在的状态空间极大时,传统的强化学习算法学习速度缓慢等问题,将量子计算理论与多Agent系统强化学......
本文将Q强化学习算法应用于移动机器人局部路径规划,解决了移动机器人在复杂环境中的局部路径规划问题.采用基于信任分配的CMAC神......
本文提出一种基于过程奖赏和优先扫除的强化学习算法.以多移动机器人觅食任务的计算机仿真为手段,与手工编程的同构策略和地域......
基于行为的自主移动机器人在获取外界信息时不可避免地会引入噪声,给其系统性能造成一定的影响。提出了一种基于过程奖赏和优先扫......
作为一类重要的机器学习方法,经典查找表形式的强化学习方法在大规模或者连续空间任务中普遍面临“维数灾难”问题,而基于逼近技术......
移动机器人技术是一门多学科技术,随着生产的发展和自动化程度的提高,现代工业生产朝着高效和高柔性的方向发展,人类对高智能移动机器......
制造业是作为高能耗产业,减少其能量消耗不仅是由于企业日益增长的生产运营成本,同时也是由于需要减少生产过程中温室气体排放。随着......
卫星信号跟踪系统是卫星地面接收系统的重要组成部分,负责卫星的捕捉、跟踪等多项工作。良好的卫星跟踪机制不仅可以大大有助于提高......
研究了一种基于智能体动作预测的多智能体强化学习算法.在多智能体系统中,学习智能体选择动作不可避免地要受到其他智能体执行动作......