面向移动终端视频流物体识别的卷积网络设计方法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:sssss1O
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着技术的发展,在移动终端设备发展视频流中的物体识别应用有着广泛前景。传统的图像匹配算法和机器学习算法很难取得良好的识别性能。对比深度卷积神经网络在物体识别领域的重大进展,一个显著的发展趋势是将深度卷积神经网络技术应用在移动终端上,从而实现高精度的物体识别。然而深度卷积神经网络是计算密集型应用,同时考虑到移动终端设备资源受限,直接在终端上部署深度卷积网络将会导致:因计算能力不足而造成的延迟过高;因能耗过大而造成的续航时间过短;因内存消耗过多而造成的运行失效;等等问题。这些问题直接阻碍了视频流物体识别在移动终端的发展。现有的解决方案主要有两种。一种利用云计算,移动设备仅作为数据收集发送与接收平台,但是会造成隐私泄露等一系列问题;另外一种更受关注的是对卷积神经网络进行压缩,使得网络得以部署在移动设备。然而现有工作都是单纯针对于网络结构进行的,尤其地,在面对复杂识别任务(待识别物体种类过多,例如现实生活场景的物体识别),仍然会存在网络过于复杂而无法部署,延时高,能耗高等诸多问题。对于这一挑战,本文深入分析物体识别及其所处环境的内在联系性,提出了一种全新的压缩卷积神经网络设计架构解决方案。本文主要的设计思想是将整个物体识别任务化分为两个子任务:场景识别以及场景内的物体识别。该任务分解思路从问题规模上压缩了网络的复杂度,根本上保证了网络前向推理低时延以及低资源。进一步地,通过构建能量预测模型,建立能耗和浮点计算量之间的直接联系,提出根据浮点计算量指导网络结构设计以及参数设置方案,确保所设计网络能够在限制资源内取得较好的识别性能。除此之外,本文针对已设计网络提出了一系列的性能增强及优化技术。特别地,所提出的卷积分解技术,不仅能够增强网络性能,并且使得网络设计具备可扩展性。为了测试本文的可部署压缩神经网络架构思想,本文根据设计思路实现了一个认知援助原型系统,成功部署到智能手机上,并进行了广泛的实验。最终,实验结果表明,在满足能够部署在移动终端设备,低延时,低能耗等目标,原型系统能够取得良好的识别性能。特别地,本文对网络性能增强和优化技术进行了详细实验,实验结果显示这些技术能够有效地优化和提高网络性能。除此之外,本文详细测验了所提出的能耗预测模型,结果表明该模型能够对其在移动设备上能耗进行精准的预测。
其他文献
当前,我国铁路建设规模大,进度控制对于建设目标的实现和投资效益的提高意义重大。我国铁路建设工程施工进度计划的编制主要采用网络计划法,网络计划方法在应用于铁路工程这
<正>以往,我国语言学界为现代汉语词组(仂语、短语)所规定的范围较狭窄,词组构造分类相应的也比较简单。七十年代以来,在一些教材和专著中,现代汉语词组的范围有所扩充,所列
<正>1我曾经喜欢过一个人。他是我高中时候的班长兼同桌,和他同班是在不那么幼稚也不那么紧张的高二。他是那种开家长会时帮着老师布置会场,学生妈妈们都很喜欢的男孩:不高不
初任教师是指刚刚从事教职不满三年的教师,这一时期在教师发展阶段上被称为“入职适应期”。大量研究表明,初任教师在“入职期”如果不能很好地适应教育教学工作,就很难体验
针对土遗址锚固工程需求,提出了一种基于期望函数的锚固参数组合优化方法.该方法通过对锚固长度、锚孔直径等参数的组合优化,获得了最大锚固力与最小遗址伤害的良好平衡.试验
<正>为什么本应充满诗意、溢满书香、陶冶情性、感受美好的语文课堂,有些时候却成了沉闷无趣、枯燥无味、了无生气的代名词?急功近利的社会思潮如"雾霾"笼罩,致使"穹顶之下"
<正>《环球时报》英文版上海编辑部于今年4月制作了中英文双语短视频《中国是世界上最安全的国家之一》(China is one of the safest countries in the world),在国内外社交
并网逆变器作为分布式电源(光伏、风力、燃料电池等)和微电网的电力电子接口,承担着能量双向转换的功能,为保证并网电流满足谐波标准,并网逆变器通常采用LCL滤波单元对输出电
孕镶金刚石工具中,胎体对金刚石的包镶力来自金刚石与胎体间的冶金反应造成的冶金包镶力以及金刚石与胎体间的机械包镶力.本文研究了机械包镶力产生的原因和计算方法,计算了
近年来引起侵袭性念珠菌感染的病原体种类越来越多,其中光滑念珠菌已位居第二。抗真菌药物广泛使用使得光滑念珠菌耐药现象日趋严重,临床治疗易导致失败。目前,两种或多种抗