论文部分内容阅读
互联网技术取得了突飞猛进,计算机软硬件技术取得了极大地发展。数字化存储设备的成本不断降低,导致了图像数据的规模呈现了指数倍的增长,并有进一步扩大的趋势。图像数据展现了海量性、多样性、复杂性的新特点。其中图像的分类是计算机视觉领域的重要组成部分,是获取图像中有效的信息的重要手段,在现实的社会中具有广泛的应用。随着计算机领域中的机器学习、数据挖掘、大数据以及人工智能技术的发展如何借助高性能计算机提取海量视觉图像中的主要特征,并对特征进行分类已经成为一个亟待解决的问题。从2012年开始,深度学习变为机器学习领域中热点研究方向,在学界和业界受到广泛关注。基于深度学习的图像分类方法相比于传统的图像分类方法更具有通用性、不需要人工的特征提取步骤和众多的先验知识,是今后图像分类发展的主流趋势。在调研大量参考文献的基础上,本文结合具体应用场景对基于深度学习的图像分类方法进行了研究,主要工作体现在以下几个方面:(1)卷积神经网络的研究。本文对卷积神经网络的组成、常见的模型设计、训练及优化算法以及分类器的选取进行了研究,并对常用的Caffe框架进行介绍。(2)卷积神经网络在典型图像检测与识别领域的应用。本文选择经典的车辆图像作为研究对象,探究卷积神经网络在车辆的检测与识别任务中的应用性能,重点关注卷积神经网络的特征提取过程,本文方法对于431种车辆图像分类上取得了93.8%的分类精度,基本满足实际应用需求。(3)卷积神经网络在遥感影像场景分类领域的应用。遥感影像具有多目标、多地物覆盖的特点,针对遥感场景影像的特点,本文设计了选择了不同卷积神经网络模型进行实验,研究不同模型对遥感影像场景分类的影响。本文方法对双路VGG16进行双线性卷积特征融合,取得了93.30%的总体分类精度,较单路VGG16模型提升了3.55%,取得了良好的分类精度。深度学习可以建立原始数据多层复杂的特征表示模型,其关键在于深度学习模型的设计。本文针对车辆图像和遥感图像为例,建立了不同的卷积神经网络模型,在车辆及遥感场景分类中取得了较高的分类精度,对今后利用卷积神经网络以及其他深度学习方法进行图像分类研究具有借鉴意义。