论文部分内容阅读
基于强化学习的多智能体协调控制技术
【摘 要】
:
借助于深度学习,强化学习已经成为了一种解决有序决策问题的强大方法,强化学习是指智能体通过与环境的不断互动改善自身的策略并最大化自身的回报的过程。多智能体强化学习作为强化学习的一个分支,从多个智能体的角度来研究强化学习,在多个领域具有广泛的应用,例如交通流量控制,多人对抗游戏,自动驾驶等,正成为强化学习研究的热点。本文对强化学习在多智能体领域的算法和应用进行了研究,本文的研究内容如下:·本文对多智能
【出 处】
:
中国科学院大学(中国科学院深圳先进技术研究院)
【发表日期】
:
2021年01期
其他文献
小微湿地作为大量陆地动物、植物、底栖动物重要的栖息地和迁移通道,为各类动植物提供生命所需要的各种资源,在动植物生存、繁殖和种群发展中发挥重要作用。小微湿地相较于大型湿地,拥有更多的边界,具有更大的周长—面积比,为动植物提供更多样的生境。因此,探讨小微湿地的网络结构与其生物多样性效应,对于小微湿地的管理和湿地生物多样性保护具有重要意义。本文以抚仙湖北岸小微湿地和鹤庆草海小微湿地为例,基于地理信息技术
学位
随着人工智能、机器人和无人驾驶技术的迅速革新,视觉SLAM技术作为核心关键技术也是目前研究的重点。然而,现有的视觉SLAM技术还有很多不足。一方面视觉SLAM很容易受到光照变化的影响,而影响定位的精度和稳定性。另一方面,当环境中存在动态物体时,由于算法无法判断是环境发生了变化,还是相机进行了移动,现有算法往往会跟踪失败。考虑建图效率,在面对大规模场景时,用单一的传感器设备进行建图效率低下,对SLA
学位
目的本次临床观察旨在明确以固元通络立法,主方六味地黄合桃红四物汤治疗慢性肾脏病肾性骨病(肾虚络瘀证)的临床疗效及安全性,对其与单纯使用西药治疗在缓解临床症状、改善实验室指标方面的优势进行科学客观评价,为该理论指导本病的治疗提供临床依据,从中药和西药联合的角度提升本病的临床疗效。方法将符合标准的病例66例患者随机平均分为治疗组和对照组各33例,入组患者均先进行常规治疗以保证均衡可比,待一般状况稳定后
学位
常见的负载型Pd,Pt等贵金属催化剂由于资源稀缺、价格昂贵等问题,在选择性加氢催化领域的长远发展受到了严重制约。目前大量研究结果表明,非贵金属Cu基催化剂也具有较高的选择性催化加氢能力。然而,早期研究的Cu基催化剂普遍存在制备复杂和催化稳定性较低等问题,所以亟待开发经济高效的方法提高Cu基催化剂的使用寿命。本论文首先以Cu2+源与有机前驱体进行自组装的形式原位引入金属组分,合成出金属有机框架模板;
学位
气候变化对生物多样性具有重要影响。物种的适应、迁移或灭绝等与气候变化密切相关。目前国内外对于气候变化与生物多样性之间的关系已做了广泛的研究,包括气候变化对物种间和物种内水平上的遗传分化和遗传多样性的影响。然而,物种对气候变化适应性响应的研究较少。横断山地区是世界生物多样性的热点地区之一,探究该地区当前物种所具有的遗传多样性能否使其适应未来快速的气候变化,对于理解该地区生物多样性的起源与维持具有重要
学位
随着近年来我国大气污染事件频发,改善大气环境质量、治理环境污染已经是我国政府急需解决的事情。挥发性有机物(VOCs,volatile organic compounds)作为我国大气污染中常见的污染因子,严重危害了我国人民的身心健康,同时该污染也是作为江苏省“263”专项环境治理工作的重点治理项目之一。探讨和研究处理挥发性有机废气具有十分重要的意义。本论文论述了当今去除挥发性有机废气的一般处理方法
学位
随着人工智能的不断发展,新思维和新潮流的不断涌现使手机界面中图标设计的风格和形式不断发生变革。然而,无论时代和潮流的发展多么的迅速,经典、传统的艺术风格永远都不会过时。在这个用户体验和审美要求极高的时代,抽象设计风格对现实产物的精神化和强大的视觉冲击力是用户和设计师共同关注的要素,也是能否实现好的用户体验的要点。对用户来说,现有的手机界面中的图标设计风格种类越来越多,在主题商店中用户会看到各种各样
学位