【摘 要】
:
场景分类在图像理解和计算机视觉中是一个开放的挑战性问题。有效的图像表示在场景分类任务中日益受到关注。该文旨在于通过构建特征提取算法,形成更加丰富有效地图像描述,从而实现场景图像的高精度分类。首先,构建了基于多层次特征表示的图像场景分类算法。传统场景分类采用单一低层特征构建图像描述,无法有效表征内容多变的场景图像。因此提取采样图像块的密集尺度不变特征变换(Scale Invariant Featur
论文部分内容阅读
场景分类在图像理解和计算机视觉中是一个开放的挑战性问题。有效的图像表示在场景分类任务中日益受到关注。该文旨在于通过构建特征提取算法,形成更加丰富有效地图像描述,从而实现场景图像的高精度分类。首先,构建了基于多层次特征表示的图像场景分类算法。传统场景分类采用单一低层特征构建图像描述,无法有效表征内容多变的场景图像。因此提取采样图像块的密集尺度不变特征变换(Scale Invariant Feature Transform,SIFT)特征和卷积层的卷积神经网络(Convolutional Neural Networks,CNN)特征,使用聚集局部描述符向量(Vector of Locally Aggregated Descriptors,VLAD)编码方法分别编码图像块的局部特征,构建包含局部语义信息的低层图像描述和中层图像描述。与此同时,将图像的低层描述与中层描述融合到图像的全连接层的高层语义中,从而获得整合了局部空间信息和全局语义信息的精确图像表示。其次,设计了基于局部特征编码与多通道特征融合的图像场景分类算法。常见算法中均使用全连接层特征来表征图像,缺乏对图像局部信息的刻画,降低了分类判别能力。因此,通过分析卷积神经网络不同通道的特征性能,充分利用不同通道的卷积特征,使其优势互补。采用局部约束线性编码(Locality constrained linear coding,LLC)方法编码多尺寸局部图像块的卷积层CNN特征,获得图像的局部信息,并与原始图像的全连接层的全局CNN特征进行多通道融合来获得更高效地图像表示。最后,提出了基于判别性聚类和加权描述的图像场景分类算法。传统场景分类中采用K-均值(K-means)方法聚类底层特征来构建视觉码本,聚类效果对码本大小及初始化聚类中心敏感,且底层特征缺乏语义信息而不能有效表示图像。因此,提出了判别性聚类方法,利用相关距离,对各类别图像块特征的相关距离矩阵进行二次遍历聚类,取各聚类簇的特征均值作为聚类中心从而构建视觉通用码本。图像分块后基于通用视觉码本映射得到图像局部描述,融合基于图像深度CNN特征的全局描述并加权,获得更丰富的图像表示。
其他文献
相位恢复问题是指仅通过信号傅里叶变换(或其它线性变换)的幅值恢复原始信号。由于相位信息的缺失,该问题是一个不适定问题,因此需要利用图像先验来确保精确重构。该文针对基于正则项的图像重构算法具有计算复杂度高和在存在噪声下重构精度低的缺陷,将传统相位恢复算法与卷积神经网络相结合,对上述问题进行改善。具体的研究内容如下:首先,针对实际应用中重构图像会受到噪声干扰的情况,该文训练去除图片噪声的深度残差卷积神
果蔬收获机械手有利于提高农业生产效率,为改善农业生产模式、解决劳动力不足、实现农业生产的规模化、精准化和工业化提供支撑。本文针对单粒果实收获机械手工作效率低下、
随着互联网的快速发展,图像信息爆炸式增长,这对有效图像的筛选需求越来越大,显著性目标检测是模拟人类的视觉注意机制提取图像中最让人感兴趣的区域,从而使计算机忽略背景更加注重前景以提高计算效率。因此,近年来显著性目标检测的研究在图像处理和计算机视觉领域中的作用愈发重要。首先,针对现有的显著性目标检测模型结果中存在部分背景区域的缺点,提出基于目标候选区域(object proposals)实现背景种子预
写作是英语学习中不可或缺的一环,而反馈则是检验学生写作方面的学习效果和提升写作能力的一种重要形式。在中国的英语写作课堂中,教师反馈一直占据着主要地位。但是随着过程写作教学法的发展,发挥学生的主体地位变得日益重要,关于同伴反馈的研究和实践也随之兴起,其中学生参与度是同伴反馈效果的重要体现,也是教师教学成效的体现。本文根据Rod Ellis提出的学习者参与度与写作反馈的理论框架,从情感、行为和认知三个
流感疫苗对公民的身体健康意义重大,然而由于流感疫苗独特的生产技术和不稳定的接种需求,造成流感疫苗供需不匹配的情况反复发生,导致流感疫苗供应链较大的经济损失。因此,探
发生煤矿灾难后的矿井环境是一个复杂的非结构化环境,充斥着各种有毒、易爆气体,很容易发生二次灾害,不适于救援人员深入井下开展搜救任务,需要使用机器人代替救援人员进入灾难现场完成井下的环境勘探和辅助营救等任务。针对该问题,本文设计了一款用于井下环境勘探的携带清障机械手的履带式煤矿机器人,首先对完整的机器人系统展开详细的说明,然后针对机器人的井下安全行走控制展开研究,主要研究内容如下:首先,为保证煤矿机
在工程伪装的研究中,伪装的效能评价是一项重要的工作,这将有效的帮助研究人员客观的了解伪装的效果并加以改进提高。在工程伪装设计中,如何投入较少的经费获得最好的伪装效
本文针对运动相关性脑震荡现场检测方法成本高、操作复杂、存在人为因素影响等问题,设计并验证了基于两台体感传感器的平衡误差评分系统,实现了非接触式、自动的现场脑震荡检测功能。论文针对单台传感器在骨架跟踪过程中出现的遮挡、视角限制、振荡等问题,提出了采用两台传感器的检测方案,并对两台传感器的摆放位置进行建模,分析了摆放角度与摆放距离对有效工作范围的影响;通过空间坐标系转换原理将两台传感器分别采集到的骨骼
孤岛微电网系统中,频率的动静态性能是系统可靠稳定运行的重要保障,通常采用基于底层逆变器的一次调频控制和基于中央控制器(MGCC)的二次调频控制相结合的方法来维持系统的频