论文部分内容阅读
随着现今科学技术与人工智能领域的不断进步,人们的生活方式正在不断改变,大量繁琐复杂的工作现在都可以通过计算机来完成,尤其随着公共安全监控、智能机器人,机动车辅助驾驶等领域的不断发展,越来越需要计算机以模拟人体视觉的方式代替人们解决实际的需求和问题,因此包括行人检测在内的计算机视觉领域开始成为现今人工智能技术的重要分支;而公共安全一直就是国家维稳与安防工作的重心,在安全监控方面,由于摄像头与监控领域的广泛性,单凭人工面对数量庞大的监控显示屏早已无法满足实际工作的需要。因此将行人检测技术代替人工应用到公共安全领域中,对一些敏感区域如军事管理区,科研重地,铁路沿线等进行实时监管,无疑将大大提高工作效率。当发现异常有行人闯入时对其进行实时标记预警,提醒管理员真正做到“早发现,早报告,早制止”;本论文的工作内容主要来自于作者实习单位的实际项目,开发与研究重点为在监控场景中对出现的行人进行实时检测。作者独立完成了以下内容:行人检测系统的设计与实现,作者以计算机视觉领域的相关知识为基础,深入研究探讨了行人检测领域的相关技术和方法,通过模式识别和深度学习中的相关算法,实现了从自然场景中提取行人目标和数目对其进行标记,并通过实验进一步验证其有效性。论文主要工作如下:(1)行人检测算法的设计,对图像中的行人目标生成区域建议并进行类别匹配。即先采用卷积神经网络对图片进行特征提取,针对传统的选择性搜索算法在生成区域建议时经常导致建议窗口数目过多,导致训练耗时,占用空间大等问题,本文直接通过RPN(区域建议网络)生成建议窗口送入后续网络进行类别判断,将区域建议的生成也统一到深度学习框架中,实现在GPU中完成全部计算。从而大大减小产生的窗口数目,进一步提高区域建议的生成速度与准确率。(2)Faster-Rcnn网络模型的训练,通过反向传播和随机梯度下降的方法对RPN进行端到端的训练,在卷积神经网络的基础上额外增加了两个卷积层,实现对目标边界和分数的准确预测。然后以联合训练的方式将训练后的RPN和目标检测网络进行二次交替训练,实现RPN与目标检测联合网络的建立和卷积层共享。(3)行人检测算法的实现,将算法进一步应用到实际的需求场景中,实现对行人信息的实时检测与监控,并对其进行实验测试与分析。行人检测系统主要应用于检测自然场景中的行人以及行人数目,实现行人目标的实时检测与行人数目统计。通过对比实验和测试结果进一步表明,本行人检测系统能够达到较高的行人检测率,可以满足实际的系统需求。