MMOG中基于强化学习的多NPC协作的研究

来源 :沈阳航空工业学院 沈阳航空航天大学 | 被引量 : 1次 | 上传用户:yangbintian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,在MMOG(Massively Multiplayer Online Games)中应用的人工智能技术比较简单,强化学习算法可以实现更加复杂的游戏智能。由于MMOG具有实时性的特点,强化学习算法不能被很好的应用。因此研究适合MMOG的强化学习方法具有重要意义。本文在深入研究强化学习相关技术的基础上,针对MMOG中的动作型和策略型人工智能技术分别进行了研究。本文主要完成了以下两方面的工作:1.针对MMOG中的动作型人工智能技术,提出启发式加速评估Q学习算法(the Heuristically Accelerated Evaluated Q-Learning,HAE-QL)。该方法引入启发式和评估来加速标准Q学习算法。通过使用一个启发函数在学习过程中影响行动的选择,使用一个评估函数来评估所选择的动作,以减少不必要的探索,提高学习效率。为了保证该算法的有效性,启发函数和评估函数是根据Q函数来计算。同时,提出基于HAE-QL的卡尔曼滤波DR预测算法(the HAE-QL Kalman Filter Dead Reckoning,HQ-KDR),这样既可以保证NPC(Non Player Character)在通信延迟的情况下正确学习,又能保证学习的有效性。2.针对MMOG中的策略型人工智能技术,提出MMRL(MMOG Reinforcement Learning)算法。算法中NPC选择的策略是基于对其他NPC选择的策略的信任基础上,不同于现有的大部分算法是基于对行动的信任上。该算法只记录NPC学习失败的情况,由于失败的情况要比成功的情况少很多,历史知识空间会显著降低,有效的提高了算法的效率。同时,该算法使用历史记录对NPC学习的动作进行评估,进一步提高了算法的效率。实验证明HAE-QL方法和MMRL算法可以显著提高NPC的对抗性,并且能为MMOG中的NPC学习问题提供良好的支持。
其他文献
随着计算机科学和信息技术的飞速发展,检测技术已经成为了一种关乎经济发展和科技进步的关键技术。由于技术上存在着不可避免的缺陷,目前很多检测问题陷入了无法测量的困境。
计算机检测与数值分析作为水泥石长期力学特性分析的重要技术手段,在固井配方水泥的性能评价中发挥着重要作用。建立水泥石长期力学特性的数学分析模型,进行自动数据切分成为
随着互联网的飞速发展以及社会化媒体的兴起,社会化媒体文本特别是包含情感信息的文本出现了爆炸式的增长。针对此类文本的舆情监控和群体性事件预测等问题的研究意义逐渐凸
基于视频的运动分析主要针对包含各种运动目标的视频图像序列进行处理,从场景中检测、跟踪、分类识别目标,并对其行为进行理解和描述。其中,目标分类是基于视频的运动分析课
数字图像的边缘检测是图像分割、目标区域识别、区域形状检测等图像分析领域十分重要的基础,是图像识别中检测图像特征的一个重要属性,图像理解和分析的第一步往往就是边缘检
面部特征点检测技术,就是在人脸图像中检测出预先定义的某些点的位置,主要是指面部五官特征的位置。由于面部特征点检测可以为人脸分析问题提供一些重要的基础数据,因此成为
随着Internet和信息技术的快速发展,数字电视、电子书、音乐等数字内容越来越多。由于数字资源具备易于无损复制、分发等特性,数字资源未经授权和非法使用的情况普遍存在,给
随着移动互联网的快速发展,智能手机和平板电脑等移动设备成了现代人们日常不可或缺的电子设备。而基于Android系统的移动设备在目前的移动市场中占据着主要地位,这就给基于A
可拓学是1983年中国的蔡文教授提出来的。可拓学的目的在于通过从定性与定量两方面研究矛盾本身,解决矛盾的方法。该学科广泛应用于多个领域,己取得了一定的成果。可拓检测技
目前,随着我国供热体制的改革,集中供暖分户热计量工作已逐步得到重视。就目前各试点的运行情况来看,无论是供暖效率、热计量原理、温控方式、设备管理方式、还是在热费的计