论文部分内容阅读
近年来,视频监控行业发展迅速,社区、城市道路、校园、工厂等场景的摄像头数量大幅增加。同时,利用包括人脸识别在内的基于深度学习的图像分析技术来对视频监控系统进行赋能成为了当前视频监控行业重点关注的趋势。而高清摄像监控设备的推广与普及,使得图像质量有了巨大的提升,数据量也呈几何倍数的增长,相应的对这些信息的处理成本也随之增加。为了视频监控设备的更大规模应用,对视频内容进行针对性的过滤变得非常必要,本文据此提出了基于视频帧过滤的高通量监控视频人脸识别系统,主要工作内容包括以下两个方面:(1)针对监控视频人脸识别系统的视频帧过滤方法。传统的降低视频分析计算负载的方法大多从算法模型本身入手,通过缩小网络规模或者是依赖深度学习对视频帧进行过滤。本文考虑大部分监控视频人脸识别应用中拍摄角度、场景相对固定的特点。另外,视频流通常为24-26 FPS,而对人脸识别算法模型来说数据大多是冗余的。根据上述背景本文提出一种视频帧过滤方法,在人脸识别模型前设置一个基于视频背景减除的过滤器和一个基于人脸关键点检测的过滤器,降低最终到达人脸识别模型的视频帧数量。实验表明本方法在可接受的人脸识别准确率基础上减少了大量冗余数据,一定程度提高了相同算力下所能处理的视频流数量。(2)监控视频系统的设计实现与测试。首先对本文提出的监控视频系统做总体设计规划,分为边缘层系统和云端层系统两部分,包括系统架构的设计和功能模块的划分。然后基于Flask Web开发框架和React开发边缘层的人脸识别监控视频管理子系统,负责绝大部分视频分析相关的任务。采用Gin框架开发云层统一纳管子系统,负责对各个边缘端系统进行纳管。最后对系统进行功能测试、集成测试和性能测试。详细描述了需求分析、系统设计、系统实现和测试等过程。