论文部分内容阅读
近年来,国内物联网概念和深度学习的兴起使得人工智能开始渗透到生活的各个领域。而安防产业,作为维护社会稳定和人们人身安全的重要手段,因人工智能的产业赋能而得到长足的发展。为了持续推动安防产业的发展,我国提出了平安城市的概念。建设平安城市的基础是信息感知,构建出全面立体的安防监控网络是必不可少的手段。因此视频监控技术得到越来越广泛的应用,大量的监控设备部署在校园、街道和小区等公共场所,产生了海量的监控视频数据。然而传统的视频监控技术多数只提供采集、存储和回看功能,存在诸多弊端。当下随着人工智能的发展,如何智能地分析处理海量视频数据,从中提取出有用的信息,并对视频中的目标进行识别,成为人工智能领域的热点研究问题。本论文针对异常事件检测、不同分辨率人脸识别和行人重识别等问题开展研究工作,主要有:(1)监控视频中的异常事件检测,比如打斗、追逐或人群聚集等事件;(2)监控视频中异常或者可疑行人的身份识别。深度学习在图像识别,语音识别等领域取得巨大进展,为监控视频的智能处理提供了契机,本文以深度学习为工具,开展的研究工作和主要创新如下:1.对于监控视频中异常事件的检测问题,提出了一种基于自适应自编码器的特征重构方法。该方法针对异常事件检测问题中正负样本分布不均的问题(监控视频中95%以上为正常事件,异常事件出现的频次远低于正常事件),只利用监控视频中的正常事件作为训练数据,综合正常事件在空间和时序上信息训练网络模型,学习出正常事件的自编码器模型,拟合正常事件的时空分布,利用正常事件的模型实现异常事件的检测和定位。由于该方法只需要正常事件作为训练数据,大大降低了任务和模型的复杂度。实验表明,该方法可对监控视频中的异常事件做出准确的检测和定位。2.为了进一步提升异常事件检测的效果,提出了一种使用主成分分析网络的特征提取和异常检测方法。该方法利用非监督深度学习模型PCANet,提取出正常事件的高层特征表示,然后使用聚类方法对提取出的高层特征进行聚类,从而得到正常事件的聚类中心。对于测试数据,利用其与聚类中心的距离判断其异常值,从而实现异常事件的检测。3.针对监控视频中人脸图像训练集因分辨率不同导致识别准确率低的问题,提出了使用卷积神经网络的高低分辨率人脸识别方案。该方案提出了两种算法:(1)将不同分辨率的人脸图像使用线性插值归一化到同一尺寸,然后使用混合样本训练深度卷积模型;(2)改进了深度网络,在模型训练中加入回归误差,低分辨率的人脸和对应身份的高分辨率人脸作为模型输入,将对应的高分辨率的人脸图像和其身份信息作为监督信息,综合利用分类和回归误差,缩小低分辨率的人脸在特征空间上与高分辨率人脸的距离,从而实现识别准确率的提升。4.针对监控视频中的行人重识别任务因人体遮挡和躯体不对齐等因素导致的识别准确率低的问题,提出了使用深度学习的解决方案,该方案提出两种算法:(1)设计了一种结合分类模型和多尺度匹配模型的深度网络,使用分类模型得到高层特征图,在此基础之上使用多尺度匹配模型在不同尺度上对特征图做卷积,从而捕获不同行人图像在语义上的关联,克服躯体不对齐带来的影响;(2)使用二阶池化实现注意力池化,从而有效地提取出人体区域的特征,克服背景等外界因素的干扰,提升了行人重识别的准确率。