基于深度学习的图像分类及应用研究

来源 :中国科学院大学(中国科学院遥感与数字地球研究所) | 被引量 : 23次 | 上传用户:janbchang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术取得了突飞猛进,计算机软硬件技术取得了极大地发展。数字化存储设备的成本不断降低,导致了图像数据的规模呈现了指数倍的增长,并有进一步扩大的趋势。图像数据展现了海量性、多样性、复杂性的新特点。其中图像的分类是计算机视觉领域的重要组成部分,是获取图像中有效的信息的重要手段,在现实的社会中具有广泛的应用。随着计算机领域中的机器学习、数据挖掘、大数据以及人工智能技术的发展如何借助高性能计算机提取海量视觉图像中的主要特征,并对特征进行分类已经成为一个亟待解决的问题。从2012年开始,深度学习变为机器学习领域中热点研究方向,在学界和业界受到广泛关注。基于深度学习的图像分类方法相比于传统的图像分类方法更具有通用性、不需要人工的特征提取步骤和众多的先验知识,是今后图像分类发展的主流趋势。在调研大量参考文献的基础上,本文结合具体应用场景对基于深度学习的图像分类方法进行了研究,主要工作体现在以下几个方面:(1)卷积神经网络的研究。本文对卷积神经网络的组成、常见的模型设计、训练及优化算法以及分类器的选取进行了研究,并对常用的Caffe框架进行介绍。(2)卷积神经网络在典型图像检测与识别领域的应用。本文选择经典的车辆图像作为研究对象,探究卷积神经网络在车辆的检测与识别任务中的应用性能,重点关注卷积神经网络的特征提取过程,本文方法对于431种车辆图像分类上取得了93.8%的分类精度,基本满足实际应用需求。(3)卷积神经网络在遥感影像场景分类领域的应用。遥感影像具有多目标、多地物覆盖的特点,针对遥感场景影像的特点,本文设计了选择了不同卷积神经网络模型进行实验,研究不同模型对遥感影像场景分类的影响。本文方法对双路VGG16进行双线性卷积特征融合,取得了93.30%的总体分类精度,较单路VGG16模型提升了3.55%,取得了良好的分类精度。深度学习可以建立原始数据多层复杂的特征表示模型,其关键在于深度学习模型的设计。本文针对车辆图像和遥感图像为例,建立了不同的卷积神经网络模型,在车辆及遥感场景分类中取得了较高的分类精度,对今后利用卷积神经网络以及其他深度学习方法进行图像分类研究具有借鉴意义。
其他文献
分析了通信企业客户流失的概念,揭示了客户流失的原因,并提出了解决客户流失的基本对策。
金融管制的放松和对外开放往往是一把双刃剑 ,它既可带来竞争的加剧和效率的提高 ,又可带来一定时期内信息不对称的增加和潜在风险的扩大。中国加入世贸组织后 ,金融市场的国
贵定县黔南云雾山现代高效农业产业示范园区是省级100个园区之一。该园区的主导产业是茶叶。为此,笔者认为,要围绕一个目标,紧扣两大产业,注重三个三字,建立四大体系,抓好五大保障,
报纸
江南园林的花窗作为江南园林建筑装饰中最为重要的构件之一,其形态各异,品类繁多,制作精美,在传达着丰富且深厚历史信息的同时也寄托了人们浓厚的情感。本文以江南园林花窗为
提出采用选权拟合的正则化方法。利用参考站坐标准确已知的条件作为约束,设计出正则化矩阵,使法矩阵的病态性得到了较大的改善,只用几个历元的数据求解,能较准确得到模糊度的
坚持资本保全观 ,是正确确定企业收益 ,确保资产保值增值的一项重要财务、会计政策。在长期的收益计量实践中 ,形成的传统资本保全观 ,主要有两种 :财务资本保全观和实物资本
特许经营是发达国家在市政公用事业市场化改革中普遍应用的一种成熟模式,在我国,特许经营模式应用于市政公用事业还是一个新生事物。尽管市政公用事业特许经营的实施在实践中
企业在各项财务活动过程中,经营成果具有不确定性。风险是客观存在的,同时风险也可以预测、控制和管理,企业应该建立财务风险控制和管理的机制,减少风险对企业的影响,使企业
制造业作为我国经济增长的发动机,要突破诸多瓶颈,就应以生产性服务业的进一步开放为重点,并通过CEPA机遇推动与台湾的两岸整合,从而实现我国制造业竞争优势的整体提升。
作者对已颁几个具体会计准则中存在的一些问题和不足作了阐述 ,同时也对《非货币性交易》与《关联方关系及其交易的披露》、《收入》与《非货币性交易》等准则中在逻辑上和体