马尔可夫决策过程相关论文
为了缓解数据中心综合运行成本高、电网侧负荷峰谷差大的问题,提出一种基于马尔可夫决策过程与交替方向乘子法结合的数据中心储能系......
机载防撞系统是保障飞行安全的重要组成部分,民航客机已被要求必须安装机载防撞系统。随着飞行环境逐渐复杂化,当今广泛使用的机载......
本文提出了一种基于局部线性时序逻辑任务描述的滚动时域多机器人协同规划在线合成方法,初步解决了如何在建模为马尔可夫决策过程......
针对边缘计算应用对实时性的要求,引入软件定义网络和网络功能虚拟化技术对边缘计算网络进行重构.基于此,考虑以最大化长期平均实......
多功能雷达是现代电磁战场上不可或缺的重要装备,针对多功能雷达的干扰一直是一个难题。本文在研究多功能雷达信号特点和雷达对抗过......
随着客户多样化需求不断提升,根据客户对订单的不同需求来组织生产的订单生产型(Make-To-Order,MTO)模式在企业生产活动中越来越重要......
由于传统基于固定加工环境的工艺路线制定规则,无法快速响应加工环境的动态变化制定节能工艺路线。因此提出了基于深度Q网络(deep Q ......
民航业的快速发展为民用航空运输机场带来了大量的起降航班和乘客的同时,影响了民用运输机场的运行效率,增加了机场管制人员的工作......
为对法官员额资源进行调度优化,平衡司法资源有限和现实司法需求之间的矛盾,该文建立审判人力资源调度优化模型,提出基于强化学习的审......
移动边缘计算技术为低时延要求、资源敏感的计算任务需求提供解决方案,通过研究任务请求特征以提高调度算法效率是边缘计算的重要研......
在对远程支援干扰飞机雷达干扰资源调度问题具体分析的基础上,基于雷达对抗推演仿真平台,将组网雷达干扰资源调度问题建模为一个带......
本文针对污水处理精准曝气过程的智能控制方法进行研究。依靠人工经验的曝气方法存在能源的浪费,为降低曝气能耗,需要对曝气过程进......
本文研究非标机械零部件网上采购平台环境下的资源优化调度问题,解决传统的非标机械零部件线下采购中的采购垄断、采购供需间响应......
随着全球城市化进程的加速发展,交通安全与拥堵、环境污染等问题日益严重。自动驾驶技术有望解决这些问题,并已成为现代汽车技术的......
针对无人机地面动态目标跟踪问题,建立了远距离自主引导与近距离伴飞避障两个阶段的马尔可夫决策过程模型。在此基础上,提出了一种改......
随着我国城镇化的逐步推进和人民对生活舒适度的不断提高,建筑能耗已经逐步成为社会总能耗中不可忽视的组成部分。城镇供暖能耗在......
针对机位再分配算法结果难以满足不同操作人员操作习惯的问题,提出一种符合实际业务人员操作习惯的机位再分配推荐算法。首先以航班......
以提高无线传感器网络中任务处理的能效为目标,提出了一种近似最优化的任务处理机制,无线传感器节点可根据任务缓存区的任务数量、......
安全帽是各行各业施工现场工作者和高空作业人员必不可少的一种安全防护工具。进入施工现场前通常要求工人必须佩戴安全帽,但是每......
本文建立了基于马尔可夫过程的动态委托-代理模型;在折扣准则下,对系统状态空间,代理人可用行动集和委托人可选合同有限的情形进行了模......
随着智能设备数量急剧增加,终端用户的计算任务需求远超设备本身计算能力。移动边缘计算架构将服务器资源部署在网络边缘侧,可为终......
互联网的高速发展给人们带来便利的同时也产生了各种安全威胁,传统的网络架构与防御技术存在的确定性、同构性和静态性缺陷,导致了......
本文主要研究随机环境下连续时间马尔可夫决策过程的最优控制问题.首先我们给出一些条件证明了在有限时间里最优控制策略的存在性;......
推荐算法在一定程度上解决了信息过载问题,但传统推荐模型在挖掘数据特性方面有待改进.为此,结合强化学习方法提出一种融合序列模......
自然语言生成是目前非常重要且具有挑战性的一类人工智能任务.长短时记忆(Long Short-Term Memory,LSTM)语言模型是目前最为主流的......
Q-Learning是目前一种主流的强化学习算法,但其在随机环境中收敛速度不佳,之前的研究针对Speedy Q-Learning存在的过估计问题进行......
在未来战争中,传统的单兵种、单装备间的对抗将被多兵种、多装备对抗所取代。协同电子对抗利用计算机及通信技术将现有电子对抗系......
需求响应项目的实施过程中,用户对激励的实际响应程度存在不确定性,导致调整电量无法达到预期效果。为减少电力资源的浪费,优化资源配......
针对大型医用设备人工管理效率低、无法满足应急调度需求的问题,文中提出了基于深度强化学习算法的医用设备应急调度优化技术。使......
工业控制网络系统是实现工业生产自动化的关键,是衡量国家工业水平的重要指标。随着物联网、大数据、智能技术的发展,其安全运行已......
随着海上船舶数量的增加和船舶航速的提高,加强船舶航行的安全和安保管理已成为全球各国的当务之急。在海上交通管理任务中,船舶航......
软件定义无线传感器网络(Software-Defined Wireless Sensor Network,SDWSN)基于软件定义网络(Software-Defined Network,SDN)的解决方......
抓取检测作为机器人智能化的研究重点,目的是让机器人能够像人类一样的对外部环境做出判断,抓取各种各样的物体。但传统的抓取检测......
为解决移动机器人仓储系统中的多AGV无冲突运动规划问题,建立了马尔可夫决策过程(MDP)模型,提出了一种新的基于深度Q网络(DQN)的求解方法......
基于部分可观察Markov决策过程(POMDP)的强化学习模型能有效地对动态决策问题进行建模,但精确求解最优策略是PSPACE难题,在直接逼......
软件测试是一种检测软件缺陷,提高可靠性水平的重要手段。证明、检测和预防是软件测试追求的目标,人们可以从不同角度设计软件测试来......
针对5G网络资源状态动态变化和网络模型高维度下服务功能链部署的复杂性问题,该文提出一种基于深度Q网络的在线服务功能链部署方法......
针对传统冷源系统节能优化方式机理建模复杂,缺乏自我学习能力,优化速度较慢等问题,提出一种基于数据驱动和自我学习机制的冷源系......
在大规模可再生能源并网的趋势下,风电、光伏等间歇性电源出力的不确定性给电网调度运行带来了挑战。传统调度方法通常建立在对不确......
在实际场景中,用户的身份标识符通常是不可用的,例如用户在购买商品前以未登陆的状态来浏览电商平台,或者匿名地浏览网页从而保护个人......
为实现需求侧最大效益,提出一种能够应对复杂环境的基于深度强化学习(DRL)的分层能量调度方法.首先,构建家庭能量管理系统(HEMS)双......
推荐系统致力于从海量数据中为用户寻找并自动推荐有价值的信息和服务,可有效解决信息过载问题,成为大数据时代一种重要的信息技术......