论文部分内容阅读
工业场景中的特定对象识别是当前计算机视觉领域的一个热门问题。在深度学习不断发展的环境下,如何进一步加强其与工业界的联系,研究实际工业场景下识别问题的建模及优化具有重要的科学意义和使用价值。
相比于一般的识别方法,面向工业场景的特定对象识别方法主要面临以下挑战:构建包含特定对象的数据集,获得工业场景可用的卷积神经网络,保障工业场景下模型的泛化能力。为了解决上述问题,本文提出了一种面向特种目标(如坦克)对象的紧凑型深度网络识别算法,具体包含以下主要工作和成果:
1.为了构建包含特定对象的数据集,提出了一种基于类别分层的数据集自动构建技术,通过结合目标检测技术以及类别分层思想来对互联网上收集的特定图像进行清洗和重组,最终得到了一个大小为39965的合成数据集。
2.为了获得工业场景可用的卷积神经网络,提出了手工设计和随机优化2种解决方案。手工设计的方法通过结合有效的特征表示结构和基于平行结构的线性分类器,最终得到一组高效的卷积神经网络,其中最少的乘法次数低至7M次,其在CIFAR-10上Top1的精度为87.2%。随机优化的方法将卷积神经网络表达成有向图,通过结合神经演化和多目标优化算法实现了计算量,模型深度和识别率的协同优化,同时还引入了线性规划将基因编码翻译为可用的卷积层配置参数,使得演化算法可以通过较小的基因长度来自动调整各个网络层的配置。演化得到的模型在CIFAR-100上Top5精度为86.1%,Top1精度为60.2%,与识别率相近的网络相比,具有结构新颖,乘法次数低等特点。
3.为了保障工业场景下模型的泛化能力,提出了一种面向无线网络传感图像的迁移技术,通过分步骤的使用知识蒸馏及迁移学习最终获得了强力的特征提取器及分类器,此外还设计了相关的数据增强方法来改善目标数据集和合成数据集之间的图像属性差异。提出的技术能够有效的保证小规模网络模型在特征学习上的有效性,相关实验结果表明该方法可减少41.12%的类别平均测试误差。
相比于一般的识别方法,面向工业场景的特定对象识别方法主要面临以下挑战:构建包含特定对象的数据集,获得工业场景可用的卷积神经网络,保障工业场景下模型的泛化能力。为了解决上述问题,本文提出了一种面向特种目标(如坦克)对象的紧凑型深度网络识别算法,具体包含以下主要工作和成果:
1.为了构建包含特定对象的数据集,提出了一种基于类别分层的数据集自动构建技术,通过结合目标检测技术以及类别分层思想来对互联网上收集的特定图像进行清洗和重组,最终得到了一个大小为39965的合成数据集。
2.为了获得工业场景可用的卷积神经网络,提出了手工设计和随机优化2种解决方案。手工设计的方法通过结合有效的特征表示结构和基于平行结构的线性分类器,最终得到一组高效的卷积神经网络,其中最少的乘法次数低至7M次,其在CIFAR-10上Top1的精度为87.2%。随机优化的方法将卷积神经网络表达成有向图,通过结合神经演化和多目标优化算法实现了计算量,模型深度和识别率的协同优化,同时还引入了线性规划将基因编码翻译为可用的卷积层配置参数,使得演化算法可以通过较小的基因长度来自动调整各个网络层的配置。演化得到的模型在CIFAR-100上Top5精度为86.1%,Top1精度为60.2%,与识别率相近的网络相比,具有结构新颖,乘法次数低等特点。
3.为了保障工业场景下模型的泛化能力,提出了一种面向无线网络传感图像的迁移技术,通过分步骤的使用知识蒸馏及迁移学习最终获得了强力的特征提取器及分类器,此外还设计了相关的数据增强方法来改善目标数据集和合成数据集之间的图像属性差异。提出的技术能够有效的保证小规模网络模型在特征学习上的有效性,相关实验结果表明该方法可减少41.12%的类别平均测试误差。