论文部分内容阅读
近十多年来,人工智能技术的迅猛发展,推动了计算机视觉技术广泛且成功地应用于现实生活。传统上简单的物体分类已经无法满足现实需求,富有挑战的细粒度图像识别问题成为计算机视觉领域的热点方向。通常,细粒度数据集中具有类间区分度弱、类内区分度强的特性,要求算法能分辨更多的图像细节。依托200类鸟类数据集(CUB200-2011)及自建的中国东洞庭湖湿地水鸟数据集,本文开展了基于深度学习的鸟类细粒度识别算法研究及微信小程序实现工作。主要工作如下:1.对鸟类细粒度识别的国内外研究现状进行了梳理与综述,阐述了该项研究的主要问题以及未来发展。2.为应对国内公开鸟类图像数据集缺乏的情况,建立了东洞庭湖136类水鸟数据集,并对数据集中样本进行了详细标注。3.提出了一种基于父类mask特征联合神经网络(CF-CNN)算法。该算法主要有两点创新:第一,将鸟类细粒度类别作为子类,鸟类整体归为父类,利用预训练的分割网络模型获取父类mask信息,将mask信息作为attention信息对分类网络特征进行特定区域增强操作;第二,认为细粒度类别应当更关注颜色、线条等底层特性,提出通过底层信息再利用的方式加强模型效果。最终通过实验对比分析,证明本文提出的CF-CNN算法不仅准确率较高且内存占用相对较少。4.基于CF-CNN算法,本文进一步开发了一个鸟类识别微信小程序。目前,该产品已经提供近千类的鸟类识别、计数、检测在线免费服务,能够为鸟类保护、研究及教育等工作提供帮助。