论文部分内容阅读
随着现代社会人民生活水平的提高,世界人口急剧增加,由人群聚集引发的公共安全问题日益突出,人群密度估计已经成为了视频监控领域不可或缺的研究课题。与此同时,随着近年来人工智能的飞速发展,深度学习作为人工智能的主流算法,其应用越来越广泛,特别是在计算机视觉领域,深度学习方法由于其自主学习特征的能力,取得了诸多突破性进展,这也使得利用深度学习方法来进行人群密度估计成为了一个必然趋势。但深度学习需要大量的样本进行训练,而用于人群密度估计任务的样本采集和标注都比较繁琐且耗时,因此本文研究了基于小样本的人群密度估计方法,其主要在数据增强和密度估计两大方面进行。主要内容如下:1、针对目前人群密度估计数据集样本量偏少和场景单调的问题,本文提出了一个基于CycleGAN风格迁移的数据增强方案,并采集了 4种风格的公共场所图片来训练风格迁移网络。在ShanghaiTech A&B、UCSD、WorldExpo ’10数据集上进行了数据增强实验,样本扩充数量可观,扩充比例从71%到299.5%不等,且生成图像与真实图像非常接近,其风格迁移效果明显。2、针对复杂人群场景,本文提出了一个基于多尺度模块条件生成式对抗网络(CGAN-MsB)的人群密度估计模型,在其中引入多尺度模块来提取多尺度特征,并同时使用条件对抗损失、感知损失和欧氏损失来优化训练。分别在ShanghaiTech、UCSD数据集上进行了小样本对比实验,验证了本文数据增强方案的有效性,实验结果表明基于CycleGAN风格迁移的数据增强方法可以有效降低小样本带来的负面影响并减小人群密度估计误差。此外,也对条件对抗损失函数与感知损失函数的作用进行了对照实验,实验结果表明两者都对模型的优化起到了正面作用,特别是条件对抗损失,其可以有效地减小估计误差并提高密度图质量,而感知损失在提高密度分布准确度上有一定的作用。最后通过与主流方法进行对比,模型性能表现优越。