DQN算法相关论文
大数据技术发展产生的海量数据急需一种可靠的数据存储方法,现有的主动故障预测方法相比被动容错机制可取得更好的效果,但是故障硬盘......
针对复杂动态不确定环境下的无人机集群对抗问题,基于多智能体强化学习开展了对抗决策方法的研究。首先,基于MaCA环境构建了无人机集......
自动驾驶领域已经成为当前车辆出行行业最大的风口,对于自动驾驶而言,车辆移动最大的难点是利用人工智能自动寻找到达目的地的最优......
随着人工智能、大数据、云计算等信息技术不断取得突破,数字经济蓬勃发展,生产者对于生产过程中的智能信息化需求日益增长,因此,利......
空间大型薄膜天线结构由于质量轻、收纳比大、易于展开等优点,已成为近年来国内外空间天线结构的研究热点之一。为掌握膜面预应力......
移动自组网是一种无固定基础设施依赖,且于任何时间、地点都能够快速组建的临时性多跳网络。移动自组网较强的部署灵活性和适应性......
提出一种基于深度强化学习的智能灯亮度个性化调节方法,综合考虑自然光亮度及用户位置对用户实际感受亮度的影响,动态计算并设置灯......
路径规划是无人车实现自主化和智能化的关键技术之一,由于实际环境的多样化,就需要路径规划算法具有较高的适应性。因此,本文采用......
近些年来,随着城市化进程的不断推进,城市规模不断扩大,越来越多的高层及超高层建筑拔地而起,建筑占地面积快速扩增、平面形态各异......
在科技飞速发展的今天,智能、便捷已然成为时代的需求,智能车也因此而受到广泛关注。随着智能车技术的发展,智能车系统日趋复杂,对......
近些年来,中国城市轨道交通领域的发展日新月异,地铁、轻轨、磁浮等轨道交通系统的总运营里程逐年提高。同时运营里程的增加伴随着......
随着大量分布式可再生能源注入电网,传统的单一能源优化利用模式正在发生变革。能源结构的多样性和耦合关系将对系统运行的安全与......
数据中心网络通常采用富链接的拓扑和多路径的路由来保证流量高峰期的业务稳定性,研究表明,数据中心网络的负载通常占实际网络能耗......
针对配对交易策略目前存在的套利空间小、投资收益低等问题,本文基于强化学习算法构建配对交易策略,并以2010-2016年期间美国公共......
机器人技术在生产和生活等各方面的应用越来越广泛,机器人控制系统的一个主要任务是完成路径规划。路径规划的传统算法在面对高维......
渗透测试是通过模拟黑客攻击的方式对网络进行安全测试的通用方法,传统渗透测试方式主要依赖人工进行,具有较高的时间成本和人力成......
认知雷达可以随着环境的变化对发射波形进行调整,使雷达的发射波形和环境相匹配,达到提高目标检测和跟踪精度的目的。本文针对雷达......
随着科技的快速发展,移动设备的进步以及人们对设备的功能需求越来越大,如今在移动设备的执行的媒体应用和计算任务日益增加,低延......
日益复杂的多媒体与科学计算需求,迫切需要计算机具有更强大的计算能力,单受半导体工艺的限制,单纯通过提高工作频率提升处理器性......
仿人双足机器人具有与人类相似的外形,运动方式也更像人,对人类的生活场景具有更强的适应性,在现代社会中应用前景广阔。仿人机器......
麻将作为典型的非完备信息博弈游戏主要通过传统Expectimax搜索算法实现,其剪枝策略与估值函数基于人工先验知识设计,存在假设不合......
介绍了基于强化学习实现自动飞行的Flappy Bird的整个开发流程。其中讲解了前期准备工作需要配置的一些开发环境,并且讲述了模型训......
针对传统DQN算法下网联车驾驶行为决策的动作选择过程随机性强、探索空间大的问题,研究了结合专家知识和DQN算法的智能车辆决策框......
科学技术的进步推动着人工智能的快速发展,强化学习作为人工智能重要分支领域的研究越来越被广泛应用,特别是在解决智能移动机器人......
进入21世纪以来,我国的城市化、机动化进程不断加快,小汽车保有量保持较快增长,导致交通拥堵、能源危机、环境污染等问题日益明显......
深度强化学习是机器学习领域的一门新兴学科,它结合了深度学习的感知能力以及强化学习的控制决策能力。基于深度强化学习的金融交......
随着服务机器人、扫地机器人和自动引导车的日渐普及,路径规划作为移动机器人技术的核心成为研究的热点。在面对复杂的环境时,移动......
协作通信是无线传感器网络(Wireless Sensor Network,WSN)实现数据可靠传输的关键技术,而协作通信技术的关键在于中继方案的选择。......
深度强化学习是一种新的算法,它结合了深度学习和强化学习,以实现从感知到行为的端到端的学习。就像人一样,直接通过深度神经网络......
仿人机器人因其类人的特性而具有较广的应用和较强的研究价值,能够在不同环境下稳定行走是其必须具备的基本性能。现阶段,仿人机器......
深度强化学习能为交通信号控制研究带来诸多优化空间,它能够实现Agent与道路交通环境之间的交互,根据获得的惩罚或奖励不断地学习......
一致性聚类本质上是一个组合优化问题,这已经被证明是NP完全型难题,主要困难在于从不同聚类算法的输出结果中求出一个共识聚类。在......
计算机博弈一直是人工智能最具挑战性的研究方向之一。它也称机器博弈,主要分为完全信息计算机博弈和不完全信息计算机博弈两大类......
随着机器人在社会生活中的广泛应用,机器人技术也成为了当前研究的热门方向。而在控制机器人移动的研究领域中的三大核心是机器人......
近年来,深度强化学习在许多领域都取得了一定的成功并得到了广泛的应用。其应用是否具备承受攻击能力和强抗打击能力也随之成为近......