【摘 要】
:
目标检测是计算机视觉的一项基础研究,其主要目的是对图像或视频中的物体进行检测与识别,从而实现对场景内容的理解。随着深度学习的发展,这项技术在近几年取得了巨大的进步。然
论文部分内容阅读
目标检测是计算机视觉的一项基础研究,其主要目的是对图像或视频中的物体进行检测与识别,从而实现对场景内容的理解。随着深度学习的发展,这项技术在近几年取得了巨大的进步。然而,目前基于深度学习的目标检测算法大多是为服务器所设计,即使在NVIDIA Titan X这样强大的GPU上,处理一张图片也需要超过100毫秒,而且需要耗费巨大的内存资源,无法直接运行在手机等嵌入式设备上。 本毕业论文设计并实现了一套完整的移动端目标检测系统,特别针对神经网络算法的小型化部署及快速计算。对一种目前主流的目标检测算法SSD进行轻量级改造,使它可以流畅运行在手机端。首先,设计了一套轻量级的神经网络前向计算框架,可以将服务器端训练好的目标检测模型部署到移动端。基于iOS平台,额外使用Neon指令集优化和移动端GPU加速卷积计算过程,体现了本框架的高度可拓展性。对于模型大小,使用一种小型网络Tiny-Darknet替换原有的VGG16网络,并通过渐进式量化将其参数量化到5比特,将整个模型大小缩小为原来的1/70。对于模型精度,使用膨胀卷积金字塔和反卷积等多尺度卷积特征融合的方法进行优化。最后,引入了目标跟踪算法,检测模块与跟踪模块相互配合,进一步提升了整个系统的流畅性和稳定性。 基于此系统在iPhone7Plus上实现了一个Demo应用,从摄像头获取视频流,对其中的目标进行检测并实时显示在屏幕上。本Demo可以同时检测和跟踪5个目标,模型大小为1.4MB,且整个系统的平均运行速度达到35FPS以上。
其他文献
随着电子信息技术的发展,新的信息以一种前所未有的速率在产生和处理,同时网络也大大加快了信息传播的速度,这使得对海量信息的处理成为了人们的一种迫切需求。仅仅使用本地存储
运动目标检测与跟踪是计算机视觉研究的基础任务和关键技术之一,在视频监控、视频会议、人机交互等领域有着广泛的应用。论文针对背景模型变化、光照影响、前景背景颜色近似
在信息时代的今天,如何有效地利用大量的原始数据来分析现状以预测未来,已经成为人类面临的一个重大挑战。数据挖掘是致力于数据的分析和理解、发现数据内部蕴含的大量知识技术
随着B2B等应用的普及,越来越多的数据以XML文档的形式出现,如何对XML文档中的数据进行联机分析引起了研究工作者的关注。传统的做法是先将XML中数据转换为关系的元组,再进行
随着石油行业信息化的高速发展,油气田基础数据正以指数般的速度积累,如何将生产数据在油气田开发手册中及时、全面的呈现出来成为油气田企业需要解决的一个问题。油气田开发
随着P2P的广泛应用,基于P2P的应用研究日新月异,搜索技术就是其中之一。研究发现,在P2P网络中,即使每个节点共享少量文件,整个网络所共享的文件数量也是非常庞大,要想充分的
近年来,机器视觉技术已越来越多地运用于农产品检测领域中。目前,苹果、芒果等果蔬已能成功地通过大小、颜色、尺寸比等特征值进行分选。然而,由于不规则扁平粒状物的表面为
近年来,随着移动互联网的飞速发展,移动智能终端已经深深影响着人们的生活、学习和工作。然而,在众多的移动智能终端中Android系统的智能终端设备占据了巨大的市场份额。由于
制造执行系统(Manufacturing Execution System,MES)是面向车间层的管理信息系统,它是上层的计划管理系统与底层的工业控制系统之间的纽带。然而,传统MES通用性差,柔性不足,开发难
网格计算是近年来在国际上兴起的一种新技术。网格作为“第三代Internet",是把整个互联网整合成一台巨大的超级计算机,其根本目的是实现非平凡的资源共享和协同工作,消除信息