基于MAS和RL的舰船设备协同控制方法

来源 :南京航空航天大学学报 | 被引量 : 0次 | 上传用户:ronglao2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在构建舰船设备协同控制多智能体系统(MAS)过程中,各Agent之间存在某种内在的冲突、联系和规律,为了有效地发现和消解这些问题,引入智能控制解决方案和强化学习方法,能为MAS系统的构建提供有效的技术保障。本文提出了基于强化学习(RL)算法即改进的遗传算法并辅之以贝叶斯学习算法,来解决舰船MAS中各Agent中的任务分配问题、实现设备协同控制的优化和学习,并以舰船运动目标下的设备协同控制来具体验证上述算法,从而体现舰船运动控制MAS的可行性。
其他文献
高光谱图像取得较高的光谱分辨率对于分类和识别很有益。但与此同时也带来了巨大的数据量,使其压缩成为必需。传统的预测方法能够在一定程度上去除谱带之间的相关性,但其预测系数不能利用高光谱图像谱带间的信息进行自适应的调整,使得预测效果不是最优。本文建立了高光谱图像谱带间的线性模型,推导出在信噪比最优下的预测。该方法能够更好地降低预测后图像的熵值。实验表明,相对于传统方法重建的平均信噪比提高了4.6064
为研究BTi6431S钛合金热拉深成形工艺,本文以某型号飞行器天线盒盖为例,通过设计正交实验方案,先后分别对无压边情况下拉深成形进行了有限元数值模拟,用最薄壁厚减薄率作为描
课堂是学校教书育人最为主要的场所,也是教师向学生传递知识的平台,因此为了能够保障课堂教学效果,就必须要加强对课堂的管理有效性,营造良好的课堂教学环境、教学氛围,但是
随着经济的持续高速发展,我国能源问题越来越严峻,以火电为主的电力结构与化石能源资源日渐枯竭的矛盾越来越突出,可替代能源开发利用已成为我国实施可持续发展战略急需解决的问
建立了某钢管混凝土拱桥的有限元模型,通过计算模态分析获得了该桥的计算模态频率。对该桥实施了环境激励下的动态测试,通过实验模态分析获得了该桥的前两阶实验模态频率。采
利用Lamb波频散方程及其数值求解得到的频散曲线,对Lamb波模式及激励信号中心频率范围进行预测。建立了试验测试系统,利用集成在复合材料层合板上的PZT压电陶瓷片作为驱动器和
为了进一步增强青少年的体质健康,贯彻《国家中长期教育改革和发展规划纲要(2010-2020年)》,教育部办公厅下发了《关于在义务教育阶段中小学实施“体育、艺术2+1项目”的通知
近年来,人们的质量意识不断增强,绿色无公害食品越来越受到人们的青睐,没有该标志的禹城扒鸡受到了冷落。山东省禹域市质监局了解到这一情况后,派出技术骨干深入盘帅扒鸡公司,帮助
提出一种基于神经网络的航空发动机全包线PID控制器参数整定方法,在全包线内选定若干离线整定点,在这些点离线整定PID控制器参数kp,ki,kd。以离线整定点参数为训练样本,离线训练BP
高中体育课程是增强学生身体素质以及心理健康的重要学科,但是由于目前很多高中学校对体育教学的重视程度还不够,为学生设置的教学内容,以及教学方法不符合高中学生的学习需