【摘 要】
:
多标签图像分类旨在准确的分类出图像中的不同目标所属类别,其广泛的用于场景识别、属性分类等现实场景中。该任务的核心研究问题是利用多个标签之间的相关性,根据已经分类出的类别,推测出其他可能存在但是难以识别的类别。标签之间相关性的学习一直是多标签分类领域的核心研究课题,并且研究进展缓慢,精度较差,难以直接落地于现实应用。深度学习技术的飞速发展,加快了多标签图像分类的研究进程,也提供了标签相关性学习的新思
论文部分内容阅读
多标签图像分类旨在准确的分类出图像中的不同目标所属类别,其广泛的用于场景识别、属性分类等现实场景中。该任务的核心研究问题是利用多个标签之间的相关性,根据已经分类出的类别,推测出其他可能存在但是难以识别的类别。标签之间相关性的学习一直是多标签分类领域的核心研究课题,并且研究进展缓慢,精度较差,难以直接落地于现实应用。深度学习技术的飞速发展,加快了多标签图像分类的研究进程,也提供了标签相关性学习的新思路。针对标签相关性的学习问题,本研究提出使用基于度量学习的多标签识别算法,将图像和标签映射到同一个空间,在此空间中利用度量学习的方法聚类具有联系的特征和标签,学习标签之间的联系,并设计新的Ranking Loss监督度量学习的过程。另外,在复杂情况下多标签图像分类尤其是大规模多标签图像分类任务中,以往的研究忽略了两个更现实的问题:类别分布不均衡和目标大小差异较大,这两个问题都会对最终的分类结果产生坏的影响。本研究针对上述问题,提出基于自注意力机制的算法,设计的深度神经网络在训练过程中自适应的关注对识别有用的特征,并通过构建特征注意力矩阵间接的利用标签之间的联系。为验证算法的作用,本研究在国际权威数据集MSCOCO2014和PASCAL VOC2007上完成实验并与当前最优算法进行对比,实验结果证明,本文提出的算法在以上数据集上取得了最好的结果。
其他文献
本文运用实证分析方法,对地区间高等师范院校生均费用差异状况进行了分析,对导致差异出现的原因进行了论证,提出了政策建议.
文章从湿地的内涵、外延入手,对我国湿地立法现状进行了深入的讨论与分析,并与相关的国外立法进行了比较探讨,同时分析了制约我国湿地立法的主要因素,进而对完善我国湿地立法
笔者近年来运用“屈曲上提内旋过伸法”治疗“网珠肘”效果满意,现介绍如下: 一、一般资料: 本组25例病案中,男性患者10例;女性15例年龄最大者60岁,最小者15岁,病程最长者7年
本文陈述了建筑废弃物组成及其物理性能,并概述建筑废弃物的相关可资源化产品。从对国民经济产生的社会直接效益和问接效益上,分析了建筑废弃物的资源化处置及综合利用项目,不仅
【正】中等职业学生应具有较熟练的读图能力,在传统的《机械制图》学习过程中,常通过一定量的读图练习来加以提高。但因课时有限,往往效果不甚明显。笔者通过减少读图时间而
本文分析了室内游泳馆池厅的空气状态参数的确定和通风量的计算方法,介绍了防止围护结构结露的措施,并对池区与观众区空调系统划分、气流组织以及提高人员热舒适感等问题进行
随着新媒体的快速发展,传统媒介受到巨大的冲击。电视新闻节目主持人的受欢迎程度与电视新闻节目的收视率有直接的关联。电视新闻节目主持人应该努力打造个人语言特色,形成个
本文从循环经济的“3R”原则出发,比较全面、系统地阐述了土木建筑行业走循环经济路子的思路.并给本行业的相关企业提出了具体的实施意见。