【摘 要】
:
随着移动互联网的迅猛发展及移动智能设备的不断普及,社会化图像的数量爆炸式增长,社会化图像的标签因用户标注行为的主观性和随意性,造成图像标签不能很好地反映图像的语义信息。传统的图像标签完备方法往往只关注图像的主要内容而忽略了图像的次要内容,导致图像标签不能完全表达图像的实际内容。目前大多图像标注模型因存在误标注、少标注的问题,直接降低了图像的检索效率。图像标注作为有监督学习的一个典型应用,一直深受研
论文部分内容阅读
随着移动互联网的迅猛发展及移动智能设备的不断普及,社会化图像的数量爆炸式增长,社会化图像的标签因用户标注行为的主观性和随意性,造成图像标签不能很好地反映图像的语义信息。传统的图像标签完备方法往往只关注图像的主要内容而忽略了图像的次要内容,导致图像标签不能完全表达图像的实际内容。目前大多图像标注模型因存在误标注、少标注的问题,直接降低了图像的检索效率。图像标注作为有监督学习的一个典型应用,一直深受研究者的关注。其中,图像标注模型中度量图像样本损失函数的合适选取,对提升图像标注模型的预测准确率,具有重要的指导作用。因此,本文从分析损失函数对模型预测性能影响的角度出发,对有监督学习的常用损失函数及在图像标注中的应用进行了研究。主要研究内容如下:1)在综合分析现有有监督学习算法使用的损失函数的基础上,针对损失函数选择困难的问题,研究了常用损失函数的标准形式、基本思想、优缺点、主要应用以及对应的演化形式,总结了它们更合适的应用场景和可能的优化策略,为提升模型预测的准确率以及为构建新的损失函数提供了理论支持。2)在损失函数理论研究的基础上,构建单标签图像标注方法,并对比研究常用损失函数度量样本的性能差异。在实验的基础上,给出一种新的组合损失函数,并验证了组合损失函数的有效性。构建多标签图像标注方法,通过对比实验进一步探索损失函数度量样本的性能差异,挖掘损失函数与模型、数据集的内在联系,在实验的基础上,为提出的组合损失函数确定最优权重参数。实验表明,适合求解问题的损失函数可改善图像标注性能。3)给出一种基于卷积神经网络与Word Net的图像标签完备标注方法。该方法在损失函数研究的基础上,首先为卷积神经网络选择合适的损失函数,使用卷积神经网络挖掘与待完备图像具有相似特征的图像之间共享的背景标签;然后,利用Word Net的整体部分语义相关性,扩充主要标签的细料度特征标签;最后,使用多标签重要性排序算法过滤完备过程中产生的噪声标签并确定最终保留的次要标签。实验表明,该算法可有效补全社会化图像缺失的标签。
其他文献
随着无线通讯系统的迅速发展,对于通信器件和设备也提出了越来越高的要求。天线作为发射和接收电磁波的设备,在通信系统中扮演着举足轻重的角色。圆极化天线由于其良好的性能,例如对极化匹配要求低、通信容量大以及较强的抗干扰能力,受到了越来越多的关注。与此同时,人工表面等离激元作为一种新型的高性能传输线,由于其束缚性强、损耗低、易调控等优点,被广泛应用到天线、微波器件的设计过程中,极大的丰富了通信设备的种类。
大数据时代背景下,信息过载问题日益成为人们面临的重要挑战,对于在线评论的利用也延伸出两个更加具体的问题:一是商家和消费者在面对海量在线评论时,难以对在线评论内在的高价值信息有客观充分地认知,如细粒度商品属性的情感分布;二是针对同一评论对象的大量评论难以避免地出现正反两面评价,这导致了用户选择困难的问题。针对信息过载的困境,从海量信息中快速获取能有效反映商品性能的评论性信息,以及对消费者在面对双面评
辐射能量E_S是一个重要的物理量,辐射能量的测定是地震定量化研究中一个重要的基本问题,也是数字地震学中重要的研究课题,对地震定量化和工程地震学等研究具有不可忽视的推动作用。地震以地震波形式辐射的能量主要集中在震源谱的拐角频率附近,因此辐射能量E_S更适合描述地震的潜在破坏性。能量震级M_e是用辐射能量E_S转换得到的震级,没有震级饱和问题。能量震级M_e与造成灾害的辐射能量密切相关,更适合描述地震
随着半导体产业的发展,器件的特征尺寸不断减小,硅基材料按照摩尔定律继续发展已经遭遇瓶颈。二维材料的涌现,为半导体行业的发展提供了新的机遇。二硫化钨作为典型的二维材
同时定位与构图(SLAM)技术是实现移动机器人自主运动的基础,可以实现移动机器人在完全陌生的环境中自主进行导航和建图。由于相机具有价格便宜、取用轻便、能够获取大量视觉信息等优点,近年来基于视觉的SLAM受到高度重视。回环检测是视觉SLAM的关键步骤,它可以判断当前位置是否是移动机器人曾经遍历过的地方。正确检测到出现回环的位置可以最大程度地减小由于机器人位姿估计造成的误差,从而创建更加精准的地图,确
随着移动互联网逐渐成熟,移动数据业务呈爆炸式增长,已经全面商用的第四代移动通信系统难以满足未来的市场需求,如今第五代移动通信系统(5G)的商业应用已经提上日程。毫米波频段(30-300GHz)拥有极大的频谱带宽,便于实现超高速无线数据速率,从而毫米波技术成为5G通信中关键技术之一。毫米波天线作为毫米波无线通信系统中的收发器件也成为了当下的研究热门。由于毫米波具有波长短、路径损耗大的特点,在无线通信
随着社会、经济的飞速发展,位置服务(LBS,Location Based Service)逐渐成为人们日常生活中不可或缺的服务之一。定位导航的需求日益扩大,在室外环境中,GPS、北斗、GALILEO、G
目前,在全球四大卫星导航系统的支撑下,室外位置服务已广泛应用于人们生活。而现在人们越来越多的时间是在室内活动,室内位置服务的需求正不断增加。在导航卫星信号难以覆盖
十九大报告提出,加强社区治理体系建设,推动社会治理重心向基层迁移,发挥社区社会组织作用,参与社区建设和治理,可见其在社区工作中的重要地位。促进社区社会组织发展,探索建
随着大规模数据集的产生,数据驱动的深度学习方法极大的提升了目标检测模型的性能。但在小目标检测领域由于数据获取和标注的困难,使得这类方法不适用于小目标检测任务。本文通过虚拟仿真技术生成大规模复杂场景航拍车辆小目标数据集Vehicle Small Object Dataset(VSOD),并开发自动标注工具快速标注数据。但数据集之间域差异的存在,极大限制了虚拟数据的发展。本文设计了针对目标检测任务的域