论文部分内容阅读
近年来随着我国经济的不断发展和医疗水平的不断提高,我国的人口数目呈现快速的增长趋势。截至2017年末,中国大陆的人口数量已经达到十三亿九千万人,特别是一线城市,人群密集度达到一种极高的水平。另一方面,人们消费水平的不断提高也使得人们参加演唱会,观光游览,大型比赛等集会的次数更加频繁。人群密集度过高导致的踩踏事件和恐怖事件发生的次数越来越多。这些事件时时警醒人们,同时也显现出对人群密度进行估计和人流量进行统计有着十分重要的现实意义,它能够帮助人们计算出人群密度和人流量从而预防不必要的灾难的发生。据此,本文的研究重点是通过自动化的方法,利用计算机视觉对特殊场合下的人群密度和人流量进行研究。
基于神经网络的深度学习方法近年来随着计算机性能的飞速提升也取得了不小的进步,深度学习在各种各样的比赛中取得了令人可喜的成绩。深度学习不同于传统的算法需要人工设计特征提取器,其核心是通过多层网络来自动学习图像或者文本的特征信息。众多学者的研究表明,通过神经网络学习出来的特征相比于传统的方法提取出来的特征更加具有泛化性。并且基于神经网络的方法在计算机视觉,自然语音处理,语音识别等领域取得的准确率要远远超过传统的方法。由此,本文在借鉴并总结前人的工作的基础上,将神经网络引入人群密度估计任务和人流量统计任务当中。
针对人群密度估计问题,本文首先改进一种人群密度估计模型来更好的完成人群密度估计任务。此模型由深层网络和浅层网络组成,其中深层网络是基于VGG-16设计的,浅层网络拥有三层卷积层和三层池化层。其次,本文提取深层网络不同卷积层的特征,将它们和深层网络的输出和浅层网络的输出结合在一起,同时在网络的最后加入两个上卷积层使得最后输出特征图的大小和原始图片的大小相同。再次,本文将人群密度估计任务和人流量统计任务结合起来,使得两个任务在一个神经网络模型中得以实现,通过学习上述人群密度估计模型输出的特征,利用一种特殊的循环神经网络——长短期记忆网络(Long Short-Term Memory, LSTM)来计算一段时间内通过某个地方的人数。本文收集并标记了两个数据集,经过大量的实验研究表明,本文改进得到的人群密度估计模型准确率比前人提出的人群估计模型更高。相比于LSTM的模型,本文改进的融合人群密度估计任务和人流量统计任务的模型的表现也更加优秀。
基于神经网络的深度学习方法近年来随着计算机性能的飞速提升也取得了不小的进步,深度学习在各种各样的比赛中取得了令人可喜的成绩。深度学习不同于传统的算法需要人工设计特征提取器,其核心是通过多层网络来自动学习图像或者文本的特征信息。众多学者的研究表明,通过神经网络学习出来的特征相比于传统的方法提取出来的特征更加具有泛化性。并且基于神经网络的方法在计算机视觉,自然语音处理,语音识别等领域取得的准确率要远远超过传统的方法。由此,本文在借鉴并总结前人的工作的基础上,将神经网络引入人群密度估计任务和人流量统计任务当中。
针对人群密度估计问题,本文首先改进一种人群密度估计模型来更好的完成人群密度估计任务。此模型由深层网络和浅层网络组成,其中深层网络是基于VGG-16设计的,浅层网络拥有三层卷积层和三层池化层。其次,本文提取深层网络不同卷积层的特征,将它们和深层网络的输出和浅层网络的输出结合在一起,同时在网络的最后加入两个上卷积层使得最后输出特征图的大小和原始图片的大小相同。再次,本文将人群密度估计任务和人流量统计任务结合起来,使得两个任务在一个神经网络模型中得以实现,通过学习上述人群密度估计模型输出的特征,利用一种特殊的循环神经网络——长短期记忆网络(Long Short-Term Memory, LSTM)来计算一段时间内通过某个地方的人数。本文收集并标记了两个数据集,经过大量的实验研究表明,本文改进得到的人群密度估计模型准确率比前人提出的人群估计模型更高。相比于LSTM的模型,本文改进的融合人群密度估计任务和人流量统计任务的模型的表现也更加优秀。