马尔可夫决策相关硕士博士期刊学术论文

马尔可夫决策相关论文

多弹分布式协同智能抗干扰通信策略

针对拒止环境中多导弹系统易受到恶意干扰而导致弹间链路可用性和传输时效性降低的问题，提出了一种基于多智能体深度确定策略（Multi-......

期刊

多导弹协同抗干扰多智能体深度确定策略马尔可夫决策部分可观测功率分配决策

基于用户激励的共享单车调度策略

针对共享单车的调度问题，考虑预算限制、用户最大步行距离限制、用户时空需求以及共享单车分布动态变化的情况下，提出一种用户激励下......

期刊

共享单车调度需求预测用户激励马尔可夫决策深度强化学习

考虑零售商需求转移和交付合同的库存配给策略与应用研究

近些年,差异化服务在实践过程中已经很常见。尤其,随着市场竞争越来越激烈,零售商对于供应商库存服务提出了更高的要求。因此,供应......

学位

库存配给需求转移交付合同马尔可夫决策

基于深度强化学习的老年健康数据挖掘及应用研究

由于计划生育人口政策以及生活成本增高的影响,我国人口出生率下降,社会老龄化趋势日趋严重。与此同时,老年人随着年龄增长身体健......

学位

马尔可夫决策蒙特卡罗法脉象图分析法中医脉象

基于拓扑地图的服务机器人交互式导航技术研究

伴随着新一代人工智能浪潮的到来,机器人技术不断推陈出新,机器人的应用也越来越广。服务机器人作为与人关系最密切的机器人,给人......

学位

智能轮椅人机交互式导航拓扑地图共享控制区域生长马尔可夫决策

优化强化学习路径特征分类的脉象识别法

脉象识别是中医诊断的重要手段之一.长期以来,依据个人经验进行的脉诊制约了中医的推广与发展.因此,利用传感设备进行脉象识别的研......

期刊

马尔可夫决策蒙特卡罗搜索脉象图分析法路径特征分类中医脉象

随机无线通信信道功率分配策略研究

基于无线网络的各项应用业务已随着无线网络的普及而日益渗透到我们的生活中，然而无线设备有限的功率资源限制了其在更多的应用业务......

学位

无线通信功率分配马尔可夫决策过程最优决策

移动中继系统中的机会式传输策略研究

移动中继系统区别于固定中继系统的一个重要特征是信道随时间快速且剧烈的变化,这会对系统产生正反两方面影响：一方面多径传输和严......

学位

移动中继缓存中继机会式策略机会式数据包调度算法马尔可夫决策过程拉格朗日放松算法二维有限状态马尔可夫信道

锂电池组均衡控制系统研究与设计

随着锂电池技术的发展不断发展,锂离子电池的应用前景也越来越广阔,但是受到电池制造技术和电源管理系统的技术制约,锂电池需要大......

学位

锂离子电池组均衡控制系统软件设计均衡电路剩余容量马尔可夫决策

基于逆向强化学习的报酬函数构建

近几年来,强化学习和学徒学习作为机器学习的两个子领域得到了极大的发展。在目前的强化学习技术中,报酬函数的自动构建是迫切需要......

学位

逆向强化学习报酬函数马尔可夫决策环境模型

连续时间分层强化学习算法

分层强化学习,如Option、MAXQ等,通过引入抽象机制来解决大规模系统的“维数灾”问题,并具有加速策略学习的功能。Option算法是运......

学位

半Markov决策过程(SMDP) 多Agent系统性能势 Q学习分层强化学习(HRL) Option

基于移动边缘计算的多维资源优化技术

近年来,用户需求呈现爆炸式增长,不同应用程序对计算需求也越来越大,时延要求越来越高。传统的集中式云计算虽然有充足的计算和存......

学位

移动边缘计算用户移动性 ADMM算法虚拟机迁移马尔可夫决策

考虑不同灾害影响的电网弹性增强研究

电力基础设施作为社会各行各业发展的基础条件,保障其安全可靠运行是十分重要的。近年来,具有高随机性和破坏性的极端灾害事件的频......

学位

恢复力弹性电网马尔可夫决策 PageRank算法恢复策略

IP网络服务的生存性提供模型与机制研究

IP网络诞生至今已有半个世纪,它对全球经济与社会的发展起到了极大推动作用。随着IP网络规模的扩大、承载业务趋于多元化、服务质......

学位

IP网络生存性服务漂移伪随机序列意图感知马尔可夫决策过程

电力设备管理中的状态监测、现金流预测和决策分析

设备管理是指将管理、金融、经济、工程和其它方法综合运用于物理设备,以求用最有效的方式提供所需的服务水平.将设备管理的概念应......

学位

设备管理状态监测蒙特卡洛仿真全寿命周期费用分析马尔可夫决策检修优化

考虑状态演变过程的高速铁路牵引供电设备维修策略

牵引供电系统是铁路系统的重要组成部分,具有重要的地位与作用。随着健康管理(PHM)与状态维修(CBM)的逐渐引入与推广,对高速铁路维......

学位

牵引供电设备状态维修维修决策马尔可夫决策过程多目标粒子群算法

离散时间马尔可夫决策过程最优平稳策略的灵敏度分析及其应用

本文主要是研究离散时间马尔可夫决策过程最优平稳策略的灵敏度分析及其应用。全文主要内容由理论基础和实例应用两部分组成。......

学位

离散时间马尔可夫决策线性规划平稳策略灵敏度分析

基于易腐商品及保鲜投入的双渠道联合库存与定价策略研究

近年来，随着易腐商品保鲜技术的成熟以及电子商务环境下的双渠道销售模式的发展，易腐商品的销售策略及其保鲜投入问题的研究受到愈来......

学位

库存管理动态定价贝叶斯更新马尔可夫决策保鲜投入易腐商品双渠道销售模式电子商务

异构无线网中面向QoS的马尔可夫选择策略

针对移动终端在异构网络环境下,需要在垂直切换过程中进行网络选择的问题,提出一种面向QoS的马尔可夫选择决策算法,通过对算法模型......

期刊

马尔可夫决策垂直切换异构网络服务质量(Qos) Markov decision processes vertical handoff heteroge

基于马尔可夫决策过程的算法研究

基于马尔可夫决策过程理论,将终端直通选择与有限阶段折扣MDP模型相结合,研究网络吞吐量最优化问题。首先利用MDP对终端直通选择进......

期刊

马尔可夫决策终端直通迭代算法 Markov decision Device-to-Device iterative algorithm

一类多阶段决策模型的稳定解及最优调节策略

得到一类确定型多阶段决策系统的差分方程组模型及该模型稳定解存在的条件并获得稳定解.同时给出该类模型中未知参数的辩识方法.利......

期刊

差分方程特征方程马尔可夫决策转移概率矩阵 difference equation characteristic equation Markov dec

基于增强学习算法的AGV导航研究

AGV(Automated Guided Vehicle)导航问题是一个连续状态空间问题,直接应用传统表格型增强学习方法存在维数灾难和学习效率低等问题......

期刊

增强学习算法 AGV导航马尔可夫决策 MATLAB仿真 reinforcement learning algorithm AGV navigation Mar

马尔可夫决策过程在动态WTA中的应用

介绍了防空作战中的目标分配方法,指出传统方法的不足,并根据防空作战的实际情况,建立了基于马尔可夫决策过程的最优化动态WTA方法......

期刊

防空作战马尔可夫决策优化 WTA air defence Markov decision optimization WTA

多UCAV任务分配有限阶段MDP方法和算法

多UCAV(U nm anned Com bat A ir V eh icle)任务分配是无人机作战决策的重要内容,是一类求解困难的组合优化问题,目前尚无成熟高......

期刊

无人作战飞机马尔可夫决策任务分配组合优化 UCAV markov decision processes task allocation combin

基于Markov决策的项目报价决策分析

对工程项目报价决策进行了研究，通过与以往常规方法相比较，提出了用马尔可夫决策方法来解决如何确定投标价格水平的问题，并结合具体实......

期刊

招投标报价决策马尔可夫决策 bidding bidding decision Markov decision-waking

The Cooperative Multi-agent Learning with Random Reward Values

This paper investigated how to learn the optimal action policies in cooperative multiagent systems if the agents' re......

期刊

学习加强随机报答多代理马尔可夫决策 reinforcement learning game random reward

基于马尔可夫决策理论的动态火力目标匹配

针对炮兵随行作战时的动态火力目标匹配问题,运用马尔可夫决策理论进行了探索。首先检验了马尔可夫决策理论对动态火力目标匹配的......

期刊

马尔可夫决策火力目标动态匹配 markov decision firepower target dynamic matching

利用排队论和决策论探讨拦截巡航导弹问题

以多层拦截巡航导弹为军事背景,建立了相应的排队决策模型。通过此模型可以对多层拦截找到最优决策,此方法切实、有效,较好地应用......

期刊

排队论马尔可夫决策多层拦截

并联式混合动力汽车能量管理的马尔可夫决策

为研究同轴并联式混合动力汽车的能量管理策略,建立了同轴并联式动力系统动态方程,分析了转矩需求无后效性的马尔可夫特性.在维持......

期刊

能量管理马尔可夫决策动态规划并联式混合动力汽车 energy management Markov decision process dynamic pro

电动汽车电池建模及放电管理研究

基于电池的额定容量效应和恢复效应的特性,采用脉冲放电策略建立电池组随机模型,马尔可夫决策过程理论和线性规划理论对电池组的放......

期刊

电池模型脉冲放电马尔可夫决策线性规划 battery model pulse discharge Markov decision linear progr

循环经济下随机再制造系统的最优库存策略研究

本文主要研究循环经济下连续性盘存的随机再制造系统的最优控制问题。在顾客到达时间间隔、回收品到达时间间隔、制造和再制造过程......

期刊

循环经济再制造系统库存控制结构性质马尔可夫决策

基于马尔可夫决策过程的机会网络转发策略

在机会网络节点随机移动的场景中,提高路由算法性能评价中的投递率,控制开销率,降低平均迟延是持续的研究方向。由于目前机会网络......

期刊

机会网络马尔可夫决策投递率

基于强化学习的图书内容推荐策略研究与应用

[目的/意义]基于强化学习的图书内容推荐方法可解决传统推荐系统注重推荐列表的准确率,忽略图书推荐的多样性,且无法解决数据信息......

期刊

图书内容推荐强化学习多样性马尔可夫决策 book content recommendationreinforcement learningdiversit

城市环境救护车管理与调度方法研究

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们......

学位

城市环境救护车管理救护车调度马尔可夫决策简单网络管理协议实时故障诊断

有限阶段马尔可夫决策的可变限速控制模型

分析了高速公路主线可变限速控制的作用,研究了现有的限速方法,将高速公路主线可变限速控制过程看作是离散时间的马尔可夫决策过程......

期刊

交通信息工程可变限速控制马尔可夫决策强化学习高速公路主线

基于局部合作的RoboCup多智能体Q-学习

针对多智能体Q-学习中存在的联合动作指数级增长问题，采用-种局部合作的Q-学习方法，在智能体之间有协作时才考察联合动作，否则只进行......

期刊

马尔可夫决策 Q-学习局部合作仿真2D Markov Decision Processes（MDP） Q-learning regional coopera

基于马尔可夫决策理论的燃料电池混合动力汽车能量管理策略

根据道路试验记录的数据建立驾驶员需求功率的马尔可夫模型,利用马尔可夫决策理论获得混合动力汽车的随机能量管理策略。借助燃料......

期刊

燃料电池混合动力汽车能量管理策略马尔可夫决策

基于MDP的分簇水声网络TDMA协议

TDMA协议是固定分配时隙的MAC协议,由于水声信道具有传播延迟高、带宽窄等特点,水声网络协议的效率较低。本文针对分簇网络结构提......

期刊

水声网络 TDMA协议马尔可夫决策时隙分配吞吐量

基于随机动态规划的燃料电池城市客车能量管理策略优化

设计了一种新型的燃料电池混合超级电容的城市客车动力系统结构,在理论计算和工程分析的基础上,对该动力系统进行了参数匹配。提出......

期刊

燃料电池城市客车能量管理策略马尔可夫决策

防空导弹武器系统目标分配建模研究

目标分配是防空导弹作战指挥控制中的关键环节,分配的优劣直接关系到防空导弹武器系统的作战效果及整体效能的发挥。文章根据防空......

期刊

防空导弹目标分配建模马尔可夫决策

基于Markov决策过程的数据中心人员配置

如何合理分配人员,减少忙闲差异,接应处理繁多而复杂且具有随机性的任务,同时控制成本支出,一直是数据中心急需解决的难题。分析了......

期刊

基础运营人员配置马尔可夫决策

计算机系统与计算机网络中的动态优化:模型、求解与应用

对计算机系统与计算机网络进行资源分配以及任务调度使用的理论工具是动态优化。当前,随着计算系统以及计算网络的发展,国内外已经......

期刊

计算机系统计算机网络动态优化马尔可夫决策

基于马尔可夫决策的理性秘密共享方案

基于马尔可夫决策理论研究理性密码共享系统模型和秘密重构方法。首先利用马尔可夫决策方法,提出适合于理性秘密共享的系统模型,该......

期刊

理性秘密共享马尔可夫决策博弈论折扣因子风险偏好函数

重载组合列车分布动力机车重联控制系统无线传输同步性研究

为提高重载组合列车各重联机车无线控制的同步性能,基于800MHz无线电空间波无线传输模式,建立重载组合列车分布动力机车重联控制无......

期刊

重载组合列车动力分布机车重联无线传输同步控制马尔可夫决策

基于支持向量回归机的黄金价格短期预测

针对黄金价格时间序列的特点,首先结合马尔可夫决策思想对数据集进行相空间重构处理,然后利用支持向量机技术建立黄金价格走势的短......

期刊

黄金价格预测支持向量机相空间重构马尔可夫决策

看过本文同时还关注