论文部分内容阅读
随着计算机硬件的发展,计算能力的提升,以及全球范围内游戏市场的日益繁荣.各大游戏厂商持续开发出无论在图像渲染上,还是在物理仿真效果上,都更加逼近现实的游戏.另一方面,得益于可从游戏引擎中提取的丰富图像信息,以及可靠的标签信息,如何利用游戏进行机器学习算法训练,在世界范围内逐步受到重视.其中又以2015年Rock Star公司在个人电脑平台上发布的《侠盗猎车5》(Grand Theft Auto V,简称GTAV)所模拟的世界设定较为丰富与真实,能够提供一个庞大复杂的动态场景,经过改造,可以成为一个能够进行车辆自动驾驶算法前期训练和检验的平台.由于GTAV是一个商业软件,是闭源项目,虽然内部的素材和动态系统被证实是外部可控的,但同时也存在相关的文档也较为缺乏的问题.为了将GTAV改造成合适的自动驾驶训练场,本文在开源代码的基础上,进行了相关的研究,研究工作主要体现在两方面,一是对开源代码进行了重构和内容扩充,增设额外的虚拟传感器—一个完全可配置的二维/三维激光雷达;二是研究GTAV提供的车辆自动驾驶系统.由于GTAV的闭源性质,其提供的车辆自动驾驶系统,是一个黑箱系统.但允许外部进行两个层面的控制.较低层面是对车辆的油门、刹车和方向盘的控制.较高层面的是利用四个驾驶行为特性参数,进行驾驶行为意图层面的控制.对此展开的工作内容分为两方面,一是,实现了 GTAV车辆自动驾驶系统与外部程序和算法的交互数据链.关于较高层面部分,本文设计的插件能够使GTAV内部的车辆能够按照预设的驾驶行为特性参数、预设的路线,进行单程、单程循环和双程循环,共计三种方式进行车辆驾驶及环境数据.二是,通过分析自动驾驶系统配置所必需的四个参数(在文中称为驾驶行为特性参数),完成了相关的配置方案.使用这些方案配置GTAV车辆自动驾驶系统,分析其驾驶行为特性,得到配置方案中的驾驶行为特性参数与实际驾驶行为的关联状况.研究关联状况过程中,为了更好地反映方向盘转角序列中不同随机程度下的概率密度分布(可以认为,在躲避前方突然出现的障碍物时,随机程度较大;在跟驰前方车辆时,随机程度较小),本文提出一种以随机程度为条件的核密度估计窗宽选择方法.此方法基于较为常见窗宽选择方法—拇指法则(Rule of Thumb),利用相关系数描述随机程度,使用相关系数导出的相关时间求解一阶高斯马尔科夫过程不确定性,使用这个不确定性替换拇指法则窗宽计算过程中所需的样本标准差.实际计算过程表明,此算法能够通过调节相关系数,获得反映不同随机程度下的序列分布.