论文部分内容阅读
随着计算机的数据处理能力不断增强,特别是随着深度学习的飞速发展,人们获得了对海量数据前所未有的处理能力。然而,面对真实世界中的海量数据,往往会由于人们的需求,数据的种类以及任务的重要程度等因素,导致虽然我们有能力使用这些海量的信息,但是却不得不与人力,资金等投入资源做一些衡量与取舍。在众多海量数据中,监控图像数据的量级绝对是相当巨大的。在研究生期间,我们做了很多基于监控数据的行人再识别方向的研究,并产出了一些结果。比如在[1]中我们尝试引入self-paced学习策略来引导网络学习到真正的个性化特征,在[2]中我们尝试构建一层神经网络来替换基于欧式空间的距离度量规则,在[3]中我们更是尝试了通过删除视频中特定帧的方法来减小数据的噪声与计算的冗余,并且同时期望能提升模型识别的效果。然而,这些方法在公共数据集上表现的越来越好的同时也在困扰着我们,就是他们究竟在现实的环境中表现的怎么样,我们能不能把这些方法利用到真实的现实环境中来,甚至我们可不可以创建一套让所有在这个领域的模型都能跑在上面的框架,告诉我们究竟哪些模型最能在现实环境中发挥各自的优势。因此,本论文希望基于深度学习强大的内容理解能力的基础上,即构造一个实时的跨摄像头的人体识别与跟踪系统。本文主要的理论核心为行人再识别的深度模型。在探索模型获得更高的准确率的同时,本文也在尝试从减小模型的参数大小,加快模型的运行效率等方面的优化工作。除此之外,本文围绕着行人再识别模型,搭建了一套配套的实时运行框架。其中会涉及到数据压缩、数据网络传输、数据并行处理、数据存储与数据容灾等工作,实际上这一部分的工作量更大,因为几乎没有可以借鉴的工程,所以这一部分在实际工作中遇到了很多严峻的挑战。最后,本文提出了一系列科学的系统测试与评估方法。这些测试方法可以保证我们的系统在实际运行过程中,可以更加充分利用被分配的资源,拥有更高的容错率,更低的使用门槛及开发和拓展门槛。让我们的这套系统可以运行在更多的设备上。最后,本套系统在实际环境中进行部署运行,在长时间的无人干涉的运行中,系统运行良好,系统表现符合理论预期。这些说明我们提出的这套基于海量实时监控数据的行人再识别监控与跟踪系统是稳定且有效的。