论文部分内容阅读
近年来,人工智能正在以令人难以置信的速度飞速发展,其中计算机视觉的研究也称为了人们关注的焦点。伴随着深度学习(Deep Learning)的进步,计算机在图像物体识别方面的精度已经超过了人脑。顾名思义,复杂场景下的物体检测与识别主要包含两部分内容:场景检测和物体识别。场景检测就是物体框选,主要方法有滑动窗口法和选择性搜索法;而物体识别的主流方法是卷积神经网络(CNN),包括将物体定位与深度学习相结合的方法,例如Fast R-CNN、SPP-net等。然而,虽然CNN网络模型识别准确率高,但训练网络需要大量数据、超长的训练时间和昂贵的硬件成本,这些缺点限制了CNN的应用范围。另外,作为物体识别基础的场景检测算法也存在复杂度高,物体定位时间长且不太准确等问题。为了解决上述问题,本论文基于深度学习研究了复杂场景下物体的精确检测算法与实现。首先,介绍了物体检测和深度学习的研究背景与研究进展,包括卷积神经网络和窗口标定方法。随后,利用压缩感知(CS)可以同时对数据进行采集和压缩的特点,研究基于压缩感知的图像显著性检测算法(Image Saliency Detection Method,ISDM):结合显著图在CS测量域对图像分块进行显著性判定,并快速生成显著块图;随后提出基于ISDM的窗口标定方法,并利用ISDM生成的显著块图去除大量的图像背景冗余。该方法可以大大缩短窗口扫描时间,解决场景检测中窗口标定冗余度高、定位时间长的问题。接下来,本论文提出了基于快速特征融合(Fast Feature Fusion,FFF)的物体识别算法,给出快速特征融合网络框架,该框架主要包含特征融合和局部选择两个模块。其中在特征融合模块中,我们设计了一个浅层CNN网络;随后推导出可应用于遗传算法的适应度函数和编码规则,并将深度学习特征与传统图像特征通过遗传算法进行融合。而局部选择模块可以对融合特征进行降维,减少类内半径,进一步提高识别率。该算法可以解决物体识别中深度学习模型训练时间和硬件成本高的问题。最后,我们利用本论文提出的算法,针对道路交通卡口摄像头数据实现了特定车型检测的深度学习网络应用软件。利用B/S网络架构完成深度学习在图像大数据下的应用软件设计。该软件可以在短时间内快速识别出多路摄像头数据中的特定车辆,并可以使用手机和PC通过浏览器访问查询界面。实验结果表明,我们设计的软件具有高稳定性、高识别精度、高响应速度和高可扩展性的特点,可用于智能交通、数字城市等多个领域。