论文部分内容阅读
随着大数据及智能时代的到来,以数据驱动为基础,从数据中挖掘知识、识别模式的形式正成为当今学术界及工业界解决诸多问题的主要方式之一。其中以数据驱动为基础的人群场景监控、分析、行为预测及运动合成也正成为人群仿真领域中的研究热点。由于人群是一个多智能体的集合,考虑到其中个体的多样性、环境及生物体生理的复杂性,以数据驱动而非制定有限规则进行人群仿真将研究重点逐步从人体力学、心理学、物理学领域转向模式识别及机器学习领域。然而,由于人群及数据的复杂性与多变性,完全依赖数据进行人群仿真中的宏观场景建模、中观碰撞避免及微观运动合成仍面临着诸多挑战。本文以数据驱动方法为依托,在宏观、中观及微观三个人群分析与仿真研究方向上展开了一系列工作:提出了一种基于特征加权支持向量机(Support Vector Machine,SVM)的行人检测新方法用以对行人进行检测与监控。该方法核心思想在于运用引入Metropolis准则的遗传算法(Metropolis Genetic Algorithm,MGA)对支持向量机中输入样本的特征设置权重。具体地讲,在MGA中,我们将Metropolis准则引入至遗传算法的父代选择机制中以动态改变父代的接受概率,从而令算法具有更强的跳出局部极小值及收敛的能力。实验表明,通过将该算法运用于SVM中的特征加权问题,在行人检测应用领域中,所提出的方法能够达到更为精准的行人检测目的。提出了一种基于人群轨迹数据分析的宏观场景建模及仿真框架,以进一步揭示真实场景中人群数据存在的特有属性并积极地驱动人群仿真效果逼近真实数据。本框架首先依据已有历史行人轨迹对场景信息进行分析,以划分不同的运动模式。而后以分类后的运动模式为单位,分别计算其速度场,并进行异常去除。最后以优化后的速度场为指导进行宏观层面的场景建模与路径规划,最终获得符合真实轨迹时空特性的仿真路径。另外,在实验中我们发现了存在于同一运动模式下人群的三种时空统计特征:(1)轨迹长度统计服从幂律分布;(2)轨迹速率服从高斯分布;(3)运动速率总是在出入口及转弯附近较低而路径中段较高。提出了一种基于多隐含层神经网络的人群仿真方法以实现中观层面的人群局部碰撞避免操作。该方法的核心思想在于运用多隐含层神经网络拟合人群中的状态-动作数据对,以训练出拥有行人运动决策的网络模型,从而指导agent进行局部碰撞避免。该方法首先满足了传统数据驱动方法对人群仿真真实性的需求,与此同时,在碰撞次数、运行效率上也均优于传统的基于搜索的数据驱动方法。更可贵的是,神经网络模型能够学习到训练数据中一些不存在的有效运动决策,从而进一步说明了该仿真方法在指导agent进行局部碰撞避免过程中的有效性。进一步对深度神经网络模型进行研究,提出了一种一致性惩罚项(Consistency Term,CT)损失函数用以提高神经网络分类准确率及生成网络模型中生成样本的质量。为进一步对辨别器进行Lipschitz连续限制,我们由1-Lipschitz连续性的基本定义出发,通过扰动每个真实数据点x两次,并使用Lipschitz常量来限制判别器对扰动数据点x’及x"的敏感度。实验表明,该损失函数的引入不仅生成了比之前方法更真实的图片样本,并且拥有最先进的半监督学习效果。进一步,我们将CT项加至多隐含层神经网络损失函数中并用于人群仿真中的运动决策生成,相比之下获得了更小的测试误差。提出了一种混合运动图(Hybrid Motion Graph,HMG)框架用以实现更为灵活、多样的微观层面上的人体运动合成。该框架在运动类内运用运动场(Motion Fields)思想进行类内运动的灵活合成与控制,与此同时,在运动类间运用运动图(Motion Graphs)技术完成不同运动模式间的快速、自然切换。具体地,在HMG构建中,首先,具有时空特性的运动模板将从每个训练运动类中导出。其次,框架将每一类运动连同其对应的运动模板进行组合以建立典型的运动场。再次,框架通过时空约束对相关运动模板进行插值,生成运动类之间的平滑过渡。最终,通过将每个类的运动场集成至运动图的全局结构控制中,建立模板与运动场之间的平滑过渡组合。在论文的最后,我们对全文的研究工作进行了总结与展望。