论文部分内容阅读
随着技术的发展,在移动终端设备发展视频流中的物体识别应用有着广泛前景。传统的图像匹配算法和机器学习算法很难取得良好的识别性能。对比深度卷积神经网络在物体识别领域的重大进展,一个显著的发展趋势是将深度卷积神经网络技术应用在移动终端上,从而实现高精度的物体识别。然而深度卷积神经网络是计算密集型应用,同时考虑到移动终端设备资源受限,直接在终端上部署深度卷积网络将会导致:因计算能力不足而造成的延迟过高;因能耗过大而造成的续航时间过短;因内存消耗过多而造成的运行失效;等等问题。这些问题直接阻碍了视频流物体识别在移动终端的发展。现有的解决方案主要有两种。一种利用云计算,移动设备仅作为数据收集发送与接收平台,但是会造成隐私泄露等一系列问题;另外一种更受关注的是对卷积神经网络进行压缩,使得网络得以部署在移动设备。然而现有工作都是单纯针对于网络结构进行的,尤其地,在面对复杂识别任务(待识别物体种类过多,例如现实生活场景的物体识别),仍然会存在网络过于复杂而无法部署,延时高,能耗高等诸多问题。对于这一挑战,本文深入分析物体识别及其所处环境的内在联系性,提出了一种全新的压缩卷积神经网络设计架构解决方案。本文主要的设计思想是将整个物体识别任务化分为两个子任务:场景识别以及场景内的物体识别。该任务分解思路从问题规模上压缩了网络的复杂度,根本上保证了网络前向推理低时延以及低资源。进一步地,通过构建能量预测模型,建立能耗和浮点计算量之间的直接联系,提出根据浮点计算量指导网络结构设计以及参数设置方案,确保所设计网络能够在限制资源内取得较好的识别性能。除此之外,本文针对已设计网络提出了一系列的性能增强及优化技术。特别地,所提出的卷积分解技术,不仅能够增强网络性能,并且使得网络设计具备可扩展性。为了测试本文的可部署压缩神经网络架构思想,本文根据设计思路实现了一个认知援助原型系统,成功部署到智能手机上,并进行了广泛的实验。最终,实验结果表明,在满足能够部署在移动终端设备,低延时,低能耗等目标,原型系统能够取得良好的识别性能。特别地,本文对网络性能增强和优化技术进行了详细实验,实验结果显示这些技术能够有效地优化和提高网络性能。除此之外,本文详细测验了所提出的能耗预测模型,结果表明该模型能够对其在移动设备上能耗进行精准的预测。