【摘 要】
:
图像检索在图像理解和计算机视觉任务中是一个具有挑战性的课题。在图像检索中存在“语义鸿沟”的问题,即计算机通过提取图像特征所理解的图像语义与人所感知到的图像语义之间存在差距。而且在大规模图像检索中如何实现快速检索成为了待解决的难题。该文充分利用图像语义信息来解决图像检索中语义鸿沟的问题,并且结合哈希算法来实现大规模图像数据集的快速检索。
首先,该文研究了一种基于图像视觉信息和语义信息的图像检索算法。该算法利用图像特征结合哈希编码来描述图像视觉特征,并且利用词向量生成模型将图像语义词转换为词向量来描
论文部分内容阅读
图像检索在图像理解和计算机视觉任务中是一个具有挑战性的课题。在图像检索中存在“语义鸿沟”的问题,即计算机通过提取图像特征所理解的图像语义与人所感知到的图像语义之间存在差距。而且在大规模图像检索中如何实现快速检索成为了待解决的难题。该文充分利用图像语义信息来解决图像检索中语义鸿沟的问题,并且结合哈希算法来实现大规模图像数据集的快速检索。
首先,该文研究了一种基于图像视觉信息和语义信息的图像检索算法。该算法利用图像特征结合哈希编码来描述图像视觉特征,并且利用词向量生成模型将图像语义词转换为词向量来描述图像语义特征。为了更好地结合图像视觉特征相似度和语义特征相似度,该算法建立了重排检索矩阵对图像进行检索。该文通过实验验证了所提出的算法的有效性,根据该算法得到的检索图像即突出了图像语义信息的一致又保证了图像视觉特征的相似。
其次,该文提出了一种基于联合学习的深度监督哈希算法。该算法将哈希函数的学习和图像分类整合到同一个端到端的神经网络框架中。在训练过程中分类器的权重和整个数据库所对应的哈希码可以相互促进。而且该算法在传统的成对监督信息上设置了超参数,使得神经网络的输出更加接近于真实的离散哈希码。该文所提出的算法在MS-COCO和CIFAR-10两个数据集上的图像检索实验都达到了最好的结果。
最后,该文提出了一种基于联合学习的深度监督哈希的改进算法。为了减少经过网络训练得到的图像表示和整个数据库所对应的哈希码间重复部分的差异性,该算法在原始算法的基础上增加了一个新的损失函数。同时为了使损失函数收敛的更快,该算法在新增加的损失函数上设置了一个超参数,使得经过网络训练得到的图像表示更加离散化。该文提出的算法在两个常用数据集上的图像检索实验都得到了比原始算法更高的检索结果。
其他文献
【内容摘要】改革发展过程中,制度建设为实现可持续发展提供了约束、激励和协调规则。目前可持续发展制度框架并不完善、正式制度的执行力、非正式制度的形成还需要不断完善和加强。因此,可持续发展的制度建设应以科学发展观为指导,强化制度实效,营造绿色发展文化。 【关 键 词】可持续发展 制度 建设 在20世纪50、60年代,随着人类对工业革命以来发展历程的反思,全球围绕环境和发展问题的研究与实践正式拉开序
【内容摘要】新时代的大学生思想政治教育面临着新形势、新问题,社会主义核心价值体是新时期中国特色社会主义理论建设中的重大创新成果。只有将其系融入大学生思想政治教育,才能开拓新局面,塑造大学生优良人格。 【关 键 词】社会主义核心价值体系 思想政治教育 大学生 党的十六届六中全会明确提出了社会主义核心价值体系的四项内容,即马克思主义指导思想、中国特色社会主义共同理想、以爱国主义为核心的民族精神和以
【内容摘要】高校是党和国家的思想理论阵地和人才培养基地,高校党组织建设是高校党的建设核心环节。建设学习型党组织是党中央建设马克思主义学习型政党的一项基础工程。进一步思考将学习型党组织建设切实贯穿于高校学生思想政治教育工作中,是大学基层党组织以及每一个共产党员必须从思想认识到工作路径以及成效考核等方面迫切需要解决的问题,进而探索推进高校学习型党组织建设和思想政治教育工作内在可持续发展的途径。 【关
【内容摘要】党是社会主义建设的灵魂,是一切经济建设的出发点。加强党风建设是优化党员的先决条件。要充分认识深化作风建设工作的重要性,提升执行力度,为民办实事。在实际工作中自觉践行执政为民的理念,坚持科学发展观,加强党风党纪教育教育。在进行党风建设要注意与时俱进,跟进时代的步伐,同时还要加强求实务实的党风建设。在具体的党风建设中注重加强以为民办实事为出发点的党风建设;以解决实际问题为目的的党风建设;以
【内容摘要】以党内和谐促进社会和谐是对党的执政能力建设和先进性建设提出的新课题。深入研究党内和谐问题,对于以改革创新精神全面推进党的建设新的伟大工程,为全面建设小康社会提供坚强有力的思想政治保证和干部人才支撑,具有重大意义。 【关 键 词】和谐建设 特色社会主义 一、加强党内和谐建设的重要性 对拥有8400万党员的中国共产党而言,党内和谐是党内各主体要素之间为实现执政兴国的历史使命而形成的理
单幅图像去雾的目的是从单幅含雾图像中恢复未损坏的内容并恢复成清晰的无雾图像。传统的去雾算法存在去雾不彻底,颜色失真等问题,图像去雾仍然是最具挑战性的反问题之一,受到很多学者的关注。近年来,深度学习可以处理许多图像相关的视觉任务,并且显示出了比较先进的性能。为了提高单幅图像的去雾效果,该文将用深度学习的方法处理该问题,具体研究内容如下:
首先,提出了基于YCbCr融合残差稠密网络的单幅图像去雾算法。该文使用卷积神经网络针对YCbCr色彩空间的亮度通道进行端到端的图像去雾,可简单提取出图像含雾的区域
人脸识别,是基于采集到的人的脸部特征信息进行身份识别的一种生物识别技术,属于人工智能和计算机视觉的一个重要研究方向。目前,传统的人脸识别算法需要经过复杂的计算过程,且最后实现的人脸识别的准确率较低。为了提高人脸识别方法的性能,该文从卷积神经网络的角度来对该问题展开研究和分析,具体研究内容如下:
首先,该文从轻量级网络的角度出发,提出基于深度可分离卷积和注意力机制的轻量级网络人脸识别方法。该方法设计了融合深度可分离卷积和注意力机制的逆残差块,在减少网络参数量的同时加强特征的表示能力。注意力机制能够
逆合成孔径雷达(Inverse Synthetic Aperture Radar,ISAR)成像技术是利用目标与雷达之间的相对运动来形成高分辨率图像。ISAR不仅可以克服雾雪等恶劣天气,同时也可以在夜间无自然光条件下工作,在目标识别、辨别和分类等军事领域发挥着重要的作用。当目标具有简单运动时,通过传统成像算法可以获得高分辨率雷达图像,但是当目标具有复杂运动时,通过传统算法难以重建高质量的图像。基于此,该文提出了基于深度学习的ISAR自聚焦成像算法。具体研究内容如下:
首先,建立ISAR成像几何模
利用稀疏表示理论对图像进行研究主要是针对图像块进行单独编码,块与块之间存在重叠部分,忽视了图像块之间具有一致性的特点。利用卷积稀疏表示,可以将整个图像看做是一个整体,对其进行稀疏编码。基于深度学习思想的多层卷积稀疏编码(MLCSC)模型的多层基追踪问题和多层字典学习问题成为研究热点,但这些问题都是基于傅里叶域的交替方向乘子法(ADMM)的传统基追踪算法,ADMM算法不能容易地扩展到多层情况。针对这些不足,该文对多层卷积稀疏编码模型进行了研究和改进,主要工作内容如下:
首先,在多层快速迭代软阈值算
微表情识别在近几年成为了计算机视觉领域的热点课题,微表情在测谎方面有着重要应用。迄今为止,微表情识别任务还面临着识别率不高、数据集难以收集导致的微表情样本数量不足,以及由于各类微表情诱发难易程度不同导致的样本数量不平衡的挑战。该文从传统特征提取方法入手过渡到使用深度学习的方法提取微表情的特征,具体来说,主要贡献如下:
首先针对微表情总是发生在局部的问题,对经典的来自三个正交平面的局部二值模式(Local Binary Patterns from Three Orthogonal Planes,L