【摘 要】
:
针对动态对抗的多agent系统(MAS)环境中agent行为前摄性较差的问题,提出了一种将意图跟踪和强化学习相结合的agent模型.该模型将对手信息和环境信息分开处理,在agent的BDI心
【机 构】
:
北京理工大学信息科学技术学院计算机科学工程系
论文部分内容阅读
针对动态对抗的多agent系统(MAS)环境中agent行为前摄性较差的问题,提出了一种将意图跟踪和强化学习相结合的agent模型.该模型将对手信息和环境信息分开处理,在agent的BDI心智模型中引入了Q-学习机制应对环境变化;在强化学习的基础上注重对对手和对手团队的意图跟踪,改进Tambe的意图跟踪理论,针对特定对抗环境中的对手行为建立对手模型,跟踪对手和对手团队的意图,预测对手目标,以调整自身行为.实验证明,所提出的agent模型具有更强的自主性和适应性,在动态对抗系统中具有更强的生存能力.
其他文献
主要利用福建省气象局提供的1961-2010年雷暴日人工观测数据和2006-2010年闪电定位数据以及雷电灾害数据,对福建省雷电时空分布规律和雷电灾害风险区划进行分析研究.选择孕灾
以离散时间仿真原理为基础,研究了雷达侦察信号环境的数学模型和仿真算法,并对雷达脉冲参数进行了建模和分析。考虑到雷达侦察信号环境的复杂性,引入了噪声干扰脉冲和脉冲丢失处
目的:总结同侧股骨干合并股骨颈骨折的手术治疗临床经验。方法:回顾性分析同侧股骨干合并股骨颈骨折12例手术治疗的临床效果。全部微创经皮空心钉固定股骨颈骨折及切开复位有
伴随现代化信息技术在图书馆中的广泛运用,图书馆的数据资源愈加丰富多样,"藏、借、阅"一体化的开放服务手段的推广使读者享受了越来越多的便捷服务,读者可以进行自主查阅各种
当前,针对移动网络学习课程资源开发的研究不仅数量少,而且多是理论性的探讨和总结,缺乏实践和借鉴意义。根据移动网络学习的特点和系统平台的技术规范,为学习者设计、开发合
<正>根据全国馆局长会议精神,从2013年开始,国家档案局将每年的6月9日即"国际档案日"作为全国各级档案部门的集中开展档案宣传的活动日。为迎接首届全国"国际档案日"宣传活动
“接受、吸收、整合化学信息的能力”有时又称审题能力。结合近几年全国各地高考试题,归纳介绍审题方法,使学生对各种常用的审题方法有一个完整、系统的认识。学生在实践中不
随着经济发展及环保理念的增强,政府对农村生活污水治理工作高度重视,昆明市政府积极推动农村污水治理工作,在滇池流域开展农村污水处理设施及污水治理工作。针对农村污水的
目的:探讨3型肩锁关节脱位关节融合克氏针内固定疗效分析。方法:自1998年1月~2006年12月采用肩锁关节融合克氏针内固定术治疗3型肩锁关节脱位142例。结果:所以患者均随访1~6
档案部门持续开展的档案普法与法制宣传教育工作,是档案工作人员树立法治观念,提高法律素质,增强依法办事能力,倡导社会档案意识,营造档案事业发展环境的有效方法,是从源头上