Q学习算法相关论文
针对能源互联园区中各主体利益诉求不同以至于难以协调调度的问题,提出了基于多智能体Q学习算法的能源互联园区协调调度方法。首先,......
柔性作业车间调度问题作为一个众所周知的非确定性多项式问题,是生产制造和流程规划环节最关键的问题之一,本文研究柔性作业车间调......
我国正处于人口加速老龄化阶段,数量庞大且逐年递增的失能人士对家庭和社会的护理能力提出了严峻的考验。本课题以减轻失能人士身......
针对自动气象观测设备计算任务数据量大、存在时延等问题,文中开展了面向自动气象观测设备的移动边缘计算卸载算法的研究.首先,采......
机器博弈作为人工智能的重要分支受到越来越多学者的关注与重视,作为一种流行的扑克竞技游戏,德州扑克一直是机器博弈研究领域的热......
随着当代科学技术的不断发展,人们的生活水平不断提高,汽车产业得到了飞速的发展。同时随着汽车数量的快速增长,由停车点的数量和......
空间大型薄膜天线结构由于质量轻、收纳比大、易于展开等优点,已成为近年来国内外空间天线结构的研究热点之一。为掌握膜面预应力......
随着社会不断发展,城市化不断推进,越来越多的通讯基站,输电线高塔,气象观测站,新能源(光伏,风能)发电设施等基础设施被建立,相关的......
云环境下,数据中心规模不断扩中,新技术的引入不断的提升了资源的弹性,满足更多的高性能计算需求,但也使得云数据中心的结构愈加复......
近些年来,随着城市化进程的不断推进,城市规模不断扩大,越来越多的高层及超高层建筑拔地而起,建筑占地面积快速扩增、平面形态各异......
对抗是现实中十分常见的问题,小到游戏,大到战争处处都有对抗的影子。智能体攻防对抗是一种典型的对抗问题,其对抗主体由若干防守......
针对摘挂列车编组调车作业计划编制问题,基于强化学习技术和Q学习算法,提出1种调车作业计划优化方法.在表格调车法的基础上,将调车......
近年来,人工智能研究领域中强化学习大受欢迎,它与监督学习有异曲同工之妙,也有许多的不同点可以区分.首先,监督学习需要在他人的......
超短期光伏功率预测对光伏并网系统的安全运行有着重要意义.针对传统单一预测模型在进行光伏功率预测时受到功率随机波动性的影响......
随着固定翼无人机的广泛应用,自主飞行任务越来越复杂和多样化,现存的导航控制算法多适应于二维平面的导航控制,较难满足复杂飞行......
本文将超轻度混合动力汽车作为研究对象,以提高整车燃油经济性和维持电池能量全局平衡为目的,基于强化学习方法,研究了混合动力系......
针对随机线性离散时间系统,利用Q学习算法求解无限时域的随机线性二次最优追踪控制(SLQT)问题.首先,假设通过命令生成器生成追踪所......
跨区域索引服务技术EMPI(机构级患者主索引),用于复杂的医疗体系内,通过构建一个主要或唯一的患者标识将分散地分布在不同地域的多......
将区域电网作为参与电网调度的单元,通过联络节点的电价建立区域电网与整体的联系,以避免集中调度中对风电不确定性建模的复杂过程......
随着无人机的广泛应用,其飞行能耗和计算能力面临着瓶颈问题,因此无人机路径规划研究越来越重要.很多情况下,无人机并不能提前获得......
为了同时兼顾换挡策略的全局最优性与在线实时性,提出了基于Q学习算法的智能综合换挡策略。根据马尔科夫理论,构建需求功率转移概......
近年来,由于智能手机、平板电脑等智能设备的快速普及,推动了移动宽带数据服务需求的显著增长,所以像LTE-A和异构网络等技术先后被......
学位
移动机器人在动态环境和未知静态环境中缺乏环境相关的先验知识,这就要求其具有较强的灵活性与适应性来应对各种状况。所以,针对静......
近年来,由于传统能源的日益枯竭和生态环境的破坏,可再生能源发电技术以及新能源电动汽车得到了迅速的发展,新能源电动汽车使能源......
随着高性能计算机、快速信息交互网络的出现,分布式人工智能、计算机协同工作、数据挖掘和数据仓库等高新技术的迅猛发展,基于主体......
电子商务充分利用互联网的优势,消除了企业与企业、消费者与企业之间的地域限制,这给企业创造了无限的商机,给消费者带来了更多的......
合作型多智能体决策技术研究给定的一组智能体如何协调彼此的动作,与环境进行交互,共同完成一个长远的目标。合作型多智能体决策技术......
如何提高基于内容的图像检索(Content-based Image Retrieval)系统的检索结果,这一直是基于内容图像检索的关键问题和最终目的。为......
强化学习是一种无监督的机器学习技术,能够利用不确定的环境奖赏发现最优的行为序列,实现动态环境下的在线学习,因此被广泛用于Age......
目前,在MMOG(Massively Multiplayer Online Games)中应用的人工智能技术比较简单,强化学习算法可以实现更加复杂的游戏智能。由于......
多Agent协作问题是RoboCup2D中研究的热点问题。RoboCup仿真2D中,协作问题解决的好坏直接关乎比赛效果。针对仿真2D中的实际问题,......
无线传感器网络(Wireless Sensor Network, WSN)中的关键问题就是传感器节点能量的有限性,节能高效地使用节点能量是WSN面临的一大......
学位
带球技术作为球员的基本个人技能之一,是RoboCup2D比赛研究的一个重点问题。球员带球动作设计的细致性和准确性以及带球路径选择的......
情绪在人们的日常学习工作中发挥着重要作用,并且人类具有的情感能力是人类与当前智能机器的最大不同之处之一。不断完善的认知心理......
针对虚拟同步发电机(Virtual Synchronous Generator,VSG)的功频调节性能及VSG与合并有源滤波(Active Power Filter,APF)的光伏电......
近几年来,人工情感技术得到了很大程度的发展,取得了许多研究成果,但距离人工情感进入寻常百姓家还有很长的路要走。本文立足于人......
为平滑高速公路瓶颈区域上、下游车流速度,基于单位距离速度变化量和多项式SG卷积平滑处理的2个奖励函数,分别建立了2个速度协调的......
产品更新换代速率越来越快,为了满足不同消费者的多样化需求,厂商往往采用共生换代策略,且互联网背景下的消费者越来越“聪明”,厂......
经济全球化使得全球之间的联系越来越紧密,贸易往来越来越频繁。信息技术的高速发展,加速了全球化的进程。集装箱的优势和便利条件......
学位
针对云计算领域的资源调度这一问题,国内外学者提出了多种云资源调度模型对其进行求解,但是在实际应用过程中会存在不确定性,因此......
随着技术的发展与社会的进步,产品的耐用性与企业更新换代速度的加快成为了一种矛盾,越来越多的企业开始开展以旧换新活动来解决这......
面对互联网络应用新的需求不断出现,网络体系结构表现出极为的脆弱和不足,SDN网络架构就是在这样的背景下应运而生,旨在改变现有网......
随着云计算、移动设备和移动应用的迅速发展,移动社交云逐渐成为一门非常有潜力的技术。移动社交云是以协作为核心,以资源分享为主......
无人机具有飞行时间长、机动性能好的显著优势,特别适用于精确侦查打击、大过载、高速度飞行等实际作战需求。无人机的航路规划和......
首先,分析了Q学习算法在采摘机械手路径规划问题中的应用,介绍了云平台的工作模式,以利用其对路径规划进行计算;然后,设计了农业采......
针对前轴驱动混合动力汽车再生制动过程中电液制动力矩分配问题,提出基于Q学习算法的再生制动能量回收控制策略。文章以制动能量回......