论文部分内容阅读
近些年来随着人工智能的发展,以及大数据的广泛应用,深度学习技术得到快速的发展。深度学习技术因为其自身在很多方面预测准确的优势,在自然语言处理、图形识别、智能机器人,推荐引擎、语音翻译、自动驾驶等众多领域都有广泛的应用。深度学习的研究虽然取得了很大的成果,但并不代表深度学习方法可以用来解决一切问题,深度学习方法本身在实际应用中仍然存在一些问题,例如如何更好地提取表示特征;如何提高网络模型的预测能力;如何提高网络模型的效率,减少内存的使用,时间的消耗等。并且如果要将深度学习应用到更广泛的平台和领域中,模型的大小,扩张性,平台的适用性以及模型的执行效率将是非常重要的问题。如今很多深度学习的研究对于深度学习模型的效率提升有了很大的帮助,通过网络模型的优化改进,库函数的优化,硬件优化支持,高效的编程框架的使用等多个方面提出对深度学习方法的优化,以提高深度学习模型的运行速度。本文中将从以下几个方面提出对深度学习扩展方法的优化研究:1.本文针对深度学习中用于物体检测与分类的深度学习模型Faster RCNN现有的实现版本,使用C++语言重构使用Python实现的版本,通过高性能编程语言的使用来缩短模型的检测时间。2.通过引入GPU编程将Faster RCNN模型中扩展部分可以进行并行处理的部分重构进行并行处理,在深度学习应用中,需要大量的数据计算,在大量有并行性的数据计算中并行处理要比串行处理带来更高的效率。并且在GPU编程与CPU编程中,合理调整数据在CPU和GPU中的执行顺序,减少GPU与CPU之间数据的频繁传送带来的开销。3.针对特殊的应用场景,可以使用一些特殊的预处理方法,对深度学习数据进行预处理,减少模型中实际运算的数据量。本文中针对Faster RCNN在物体检测中的应用,以智能视频监控为实际应用场景,通过使用GMM高斯混合模型,先对视频分割出的图像,进行背景消除建模处理,只保留图像的前景部分,通过减少模型的计算量来实现模型的运行时间的压缩。4.鉴于GPU编程需要一定的基础,并且需要根据经验对并行区域进行手动编程,本文通过扩展领域编程语言Para C来使其支持深度学习中的常用算法,并以Faster RCNN为实例,扩展Para C的基础操作,使得其支持Faster RCNN中实现方法代码的自动并行性转换。本文通过介绍深度学习的发展状况,并以深度学习中的Faster RCNN的实景应用为例,对深度学习所使用到的算法以及扩展算法提出多方面的优化,并通过多次实验对比优化收益。