确定性策略梯度相关硕士博士期刊学术论文

确定性策略梯度相关论文

无人机设备能够适应复杂地形，但由于电池容量等原因，无人机无法长时间执行任务。无人机与其它无人系统（无人车、无人船等）协同能够有效......

期刊

无模型深度强化学习算法作为强化学习中的一种主要算法,其最大特点是在不对环境建模的情况下,通过与环境不断交互自主的进行学习。......

学位

一般的标准强化学习的策略目标是找到一种能够获得最优的解决方案,但在实际的生活环境中仅掌握一种方法是远远不能满足的。因此掌......

学位

电气操作票制度是我国电力系统运行管理中的重要制度,是一种防止误操作的有效措施。操作票制度要求工作人员严格按照操作票的指令......

学位

DDPG算法是一种端到端的深度强化学习算法,主要用于解决仿真任务。DDPG能够在具有高维度动作空间的任务中取得接近人类的水平,然而......

期刊

人工智能这个词已经成为了近年来的热门词汇,而强化学习就是其中一个备受关注的分支。它是一种面向智能体的学习,强调的是智能体经......

学位

目前,深度强化学习(Deep Reinforcement Learning,DRL)已成为人工智能领域中重要的前沿方向,在各个领域中基于DRL方法的应用都已取......

学位

针对强化学习策略由仿真环境向实际迁移困难的问题,以提高无人机采用无深度信息单目视觉时的行人规避能力为目标,提出一种基于异步......

期刊

传统的基于CDN和P2P技术的流媒体系统存在可靠性差、扩展代价高等缺点。云计算技术的成熟使流媒体服务向云形态转变,流媒体云可以......

学位

在流媒体边缘云资源调度中,传统启发式方法或规划方法多数存在自适应性不足、时间复杂度高等问题。基于迁移代价、负载均衡等约束,......

期刊