【摘 要】
:
由于现代社会的快速发展,生产生活中的许多工作均需采用多智能体系统以解决复杂的任务。随着群集智能以及多智能体强化学习的发展,面向多机器人的任务分配方法得到了广泛的研究,通常可将任务分配算法分为有协作任务分配和无协作任务分配。目前面向自组织映射神经网络的无协作任务分配方法存在移动方向角偏差的问题,继而在实际的二维障碍物环境中不能进行有效任务分配。面向有协作的多智能体强化学习存在不能协作解决多个任务的问
论文部分内容阅读
由于现代社会的快速发展,生产生活中的许多工作均需采用多智能体系统以解决复杂的任务。随着群集智能以及多智能体强化学习的发展,面向多机器人的任务分配方法得到了广泛的研究,通常可将任务分配算法分为有协作任务分配和无协作任务分配。目前面向自组织映射神经网络的无协作任务分配方法存在移动方向角偏差的问题,继而在实际的二维障碍物环境中不能进行有效任务分配。面向有协作的多智能体强化学习存在不能协作解决多个任务的问题。因此,本文从有协作与无协作这两个角度对多机器人任务分配进行研究与改进,以提升多机器人任务分配系统的有效性和实用性。论文的研究工作如下:(1)提出了一种面向无协作的多机器人任务分配算法(Vector Direction Self-Organizing Map,VDSOM)。将矢量方向法引入SOM自组织神经网络,改进原始SOM算法在多机器人任务分配过程中,不能自主避障这一问题。改进后的VDSOM算法将整个多机器人任务分配分为4步:首先,采用胜者为王规则确定获胜神经元;其次,以该冠军为中心确定邻域函数;再次,采用矢量方向法修改机器人的移动方向角,以避免在路径规划过程中横穿障碍物;最后,根据引入的矢量方向法更新SOM获胜神经元的权值。通过仿真实验证明,VDSOM算法按照上述4步可以达到多机器人任务分配的目的,并能够避免横穿障碍物的情况,具备一定的有效性。(2)提出了一种面向有协作的多机器人任务分配算法(Heuristically Accelerated Dynamic Team Q-learning,HADTQL)。首先,根据环境的具体信息,构建了合适的状态动作空间;其次,采用动态探索系数将学习过程分为两阶段,保证了智能体前期学习的探索性和后期学习的稳定性;再次,采用改进的奖赏函数和多智能体强化学习自身产生的经验,提供实时的奖赏,以帮助机器人进行合理的动作选择;最后,引入启发函数来指导多智能体强化学习下一步的动作选择。通过实验对比Team Q-learning(TQL)、HATQL,验证出HADTQL算法能够在自主避开环境中障碍物的前提下,通过学习找到一个最优的任务执行序列协作完成所有的任务且路径相对最优,且能够合理的进行任务分配。
其他文献
玉米秸秆是草食类家畜的主要饲料来源之一,其酸性洗涤纤维(ADF)的含量在玉米植株育种、品种筛选、家畜食用价值提升等方面具有重要意义。本文在详细分析玉米秸秆中ADF的化学官能团机理的基础上,提出使用近红外光谱(NIRS)技术快速无损的检测玉米秸秆中ADF含量。本研究获取的569份玉米秸秆样本,均来自于黑龙江大学呼兰校区种植基地,采用近红外光谱仪与全自动纤维仪分别测量样本在400-2500nm范围内的
随着经济全球化的进一步扩张,企业间的竞争越来越激励,如何提高财务绩效以在竞争中处于优势地位成为企业的重要关注点。高层管理团队对企业的生产经营方式及内容起到重要的决策作用,与企业财务绩效存在着必然的联系,对此,近年来国内外学者及企业自身对这一联系进行了越来越深入的研究,研究结果也向我们证明了高层管理团队的特征确实对企业财务绩效产生着深远影响,然而这些结论在为我们揭示高管团队特征与财务绩效联系的同时,
进入二十一世纪,国内外高校在人才、资金等方面的竞争越来越激烈。由于资源的稀缺性,使得预算管理的重要作用日益凸显出来。通过科学合理的预算,有助于各高校将有限的资源合理地分配至重点扶植学科;也有助于各高校统筹资源,将资源合理分配至各行政部门和各院系,实现资源的统筹规划以及各部门之间的密切联系。另外,高校当前的资金来源中,除了传统的财政拨款外,其他类型的筹资方式也逐渐增多起来。与传统的校级一级预算管理模
随着开源软件运动的不断深入,越来越多的用户和开发者使用问题追踪系统(Issue Tracking System)来报告问题,包括在使用过程中发现的软件缺陷,对新功能的期望和对改进的建议等。这些问题报告中所包含的用户反馈十分有用,能够帮助提升软件质量,也能够帮助开发者更好地收集用户需求。然而,问题报告的数量十分巨大,一个项目的问题报告能达到数万条甚至数十万条,这使得人工逐一分析问题报告会耗费开发者很
知识经济时代渐渐成为社会发展的主流趋势,知识在生产过程中渐渐占有重要地位,专利技术是知识的精华部分,专利创业成为一种典型的技术创业方式且发挥着其特有优势,专利创业有
湿地是地球陆地表面碳密度最高的生态系统,在全球碳循环中发挥着重要作用。高寒湿地作为青藏高原上特殊的生态系统类型,由于其处在“低纬度、高海拔”的特殊地理位置,气候条
小麦作为安徽省三大主粮作物之一,既是安徽省农业的重要组成部分,也在促进社会发展、经济稳定中发挥着重要作用。自2008年安徽省农业保险实施以来,小麦种植保险为农户有效地分摊和转移了它们在农业生产过程中面临地自然灾害风险。但随着技术进步和农业的进步,市场价格风险也变成农户们所需要面对的风险。现有的小麦种植保险无法保障小麦市场供求变化导致的价格风险,而小麦收入保险涵盖了产量、价格变化或二者同时变化导致农
随着网络终端设备的流行和移动互联网的普及,人们的生活中每天都有海量的数据产生,如何从庞杂的数据中及时获取到想要的信息成为了一个难题。推荐系统是当下解决信息过载问题的最好方案之一,系统通过采集用户在互联网中的历史行为记录,利用推荐算法对用户的兴趣喜好进行分析预测,快速恰当的为用户推送最符合其行为习惯的信息。推荐系统的核心是个性化推荐算法,人们针对应用场景提出了许多不同的个性化推荐算法,设计一种推荐效
机载雷达观测范围广,在检测或识别海上目标时,会收到大量的来自不同方向的较强的海杂波回波,影响雷达的检测精度。海杂波不同于地杂波,由于其具有波动性,因此需重点研究海杂波的时变及散射特性,建立精细的回波模型并有效模拟出海杂波的数据,可对杂波抑制算法及目标检测算法的优化、雷达系统设计、海洋环境监视提供有利依据。海杂波回波模型的精细程度越高,杂波模拟的数据量和运算量就越大,无法满足机载雷达海杂波模拟方法所
低温环境对北方高寒冷地区动物的健康有重要影响。牛磺酸作为一种食物添加剂,具有抗氧化,免疫调节,解毒,渗透调节和神经调节的功能。不仅增强动物免疫器官指数,还能增强淋巴细胞活性,促进其增殖,同时对动物机体不会产生副作用。本试验以低温环境下肉鸡为研究对象,探讨牛磺酸对低温环境下肉鸡免疫功能的影响。为应用牛磺酸提高低温环境下动物免疫力提供理论依据。本试验将240只AA肉鸡在14日龄时随机分为三组,对照组(