序列决策相关论文
深度强化学习作为机器学习的一个分支,其通过结合深度学习的感知能力与强化学习的决策能力实现了对从感知到行为端到端的学习。目......
在文章中,研究了强、弱关系两类群体中的行为决策,事实上在模型实际运用或仿真时,不需要赋予群体某些特殊的性质,系统只要输入每个决策......
传统的序列决策方法旨在对决策过程与决策步骤进行建模,以求解得到最优的决策序列。然而,传统序列决策建模过程对目标函数和决策次......
自PID控制思想提出至今,其参数整定规律一直在理论方法和实践应用方面得到广泛的关注。基于数学计算的理论整定方法,由于过于依赖......
供应链中序列决策过程是指当决策者在供应过程中制定一项决策后又遇到一些新情况,并需要根据新情况再进行下一项决策的过程.由于信......
提出了一种多阶段三支决策垃圾短信过滤模型,通过将短信使用不同的信息粒度表示,运用序列决策(即多阶段、多步骤决策),在不同的决......
为解决作战决策中的序列决策问题,利用决策树的分析方法,以登陆作战中是否提前实施登陆行动、登陆成功后是否向登陆场纵深进攻的两......
文章通过对数据挖掘技术的相关分析与比较,提出了序列决策的分析方法,将数据挖掘与统计分析相结合,从海量成绩数据中提取隐藏于其中的......
蒙特卡罗树搜索(MCTS)在棋类博弈问题中展现出卓越的性能,但目前多数研究仅考虑胜负两种反馈从而假设博弈结果服从伯努利分布,然而......
传统的序列决策方法旨在对决策过程与决策步骤进行建模,以求解得到最优的决策序列.然而,序列决策建模过程对目标函数的确定性要求......
针对多波束卫星系统中资源分配序列决策的多目标优化(MOP)问题,为了在提升卫星系统性能的同时,提高用户业务需求的满意度,提出了一......
随着计算技术、嵌入式技术、传感器技术、通信技术以及自动控制技术的飞速发展,新一代智能系统也悄然出现。新一代智能系统的主要......
序列决策问题作为一种广泛存在的决策问题,在各个领域都具有重要的应用。强化学习技术为解决序列决策问题提供了一种强有力工具,本......
在求解黑盒优化问题时,演化算法可以被看作是一类通用的优化器。不过随着待优化问题维度的增加,演化算法会遇到所谓的“维数灾难”......