基于距离测度学习的图像分类方法研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:dubo2536
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的图像分类方法是计算机视觉领域中的难点和热点问题之一。目前几乎所有的图像分类方法都依赖于用图像底层特征间的距离来度量图像内容的语义相似度,实现对图像内容的理解。然而,图像的底层特征和高层语义间往往存在巨大的语义鸿沟。如何缩小语义鸿沟,提高图像分类系统的性能,是一个得到广泛研究的课题。此外,由于人们对于图像内容间的相似度往往带有主观性,如何将这些影响反映到图像间特征相似度的计算上,实现“个性的”图像分类是一个值得深入研究的方向。  本文首先介绍了图像分类系统的一般框架,图像的视觉底层提取,重点介绍分析了不同特征间的距离度量方法。一些距离度量方法由于缺乏对特征空间较好的描述,忽略了背景环境信息对距离度量的帮助,往往效果不是很理想。因此,如何能够从有类标的图像特征空间中自动学到一种合适的距离测度就显得十分关键。本文对距离测度学习方法做了系统的分析研究,探讨了不同距离测度学习算法的本质以及相互之间的联系。  接着,本文提出了一种基于特征互补率矩阵的图像分类方法,试图从两个角度减小语义鸿沟。一方面,图像的各种视觉底层特征描述了图像内容不同方面的特性,因此可以通过融合这些特征更好的描述图像内容,这里我们通过计算特征互补率矩阵来指导融合特征集的选择:另一方面,对线性融合后的特征,利用距离测度学习算法从图像训练集中学到一个距离函数以更恰当的反映图像内容间的相似度。实验表明,该方法能有效提高分类系统性能。  此外,我们通过实验研究了图像数据集不同语义粒度的划分对分类性能的影响,比较分析了几种分类算法以及局部特征在图像分类任务中的性能,评估了十种MPEG一7定义的视觉描述子的分类性能。
其他文献
近几年来,嵌入式技术和多媒体通信技术迅速发展。嵌入式IP视频会议系统凭借低成本和高质量的优势成为研究的焦点。凭借简单、可扩展和易实现等特点,SIP逐步成为3G和NGN领域首
近几年来,随着网络的普及,对等网络(Peer-to-Peer, P2P)技术飞速发展。P2P系统由于方便、快捷和开销少的优点受到了大多数网络用户的欢迎。文件共享系统是P2P技术最为广泛的
One of the main goal of computer vision is the image understanding. Despite the recent success in different tasks, such as object recognition, pose estimation,
无线传感器网络是一种新的信息获取和处理技术,它由大量传感器节点组成,共同完成信息收集,目标监测和感知环境的任务。由于无线传感器网络的低功耗、低成本、分布式和自组织
IT是一个知识衰减率高的行业,其技术发展快,知识更新周期短。为了适应知识的快速变化,IT企业需要对员工进行培训,提高员工的技能水平,保持企业自身竞争力。培训对IT企业发展
目前,电驱动钻机发电机组的控制系统部分技术性能指标不高,且控制系统自成体系,网络通信化程度低。为了提高控制系统的部分性能指标与通用性,从而研究开发将柴油机速度控制与发电机励磁控制及总线通讯集成为一体的全数字控制系统。本文详细介绍了电动钻机发电机组数字控制系统的研究及开发过程,完成了基于TMS320F2812DSP的柴油机转速控制模块和发电机励磁控制模块的软硬件调试。电动钻机发电机组柴油机的转速控制
随着企业在质量、价格、时间、柔性和创新等竞争领域的经营业绩越来越依赖于供应商网络,伙伴关系和有效的供应商管理变得越来越重要。在选择供应链合作伙伴的过程中,由于竞争地位与收益的不平衡,缺乏相互信任等因素会造成合作伙伴评价指标与实际值不相符合。为了能更好地提高企业选择合作伙伴的效率并减少其选择成本,选择最小二乘支持向量机(LS-SVM)算法对合作伙伴进行选择。实验证明,LS-SVM比普通的向量机不仅具
随着Internet技术的兴起,B/S结构逐渐取代C/S结构成为网络应用开发所采用的的主要结构模式。B/S结构拥有众多优点,比如部署方便、升级维护简单,结构易于扩展等。但是随着客户端
并行处理技术近年来已成为计算机界研究的一个热点。采用并行处理技术来解决大数据量或时间复杂度高的问题不仅在计算机界,而且在其它科学领域都是首选的。而算法是并行处理技
在企业信息化日新月异的今天,SOA,即面向服务体系架构已经成为解决企业应用软件建设困境的必由之路。通过SOA应用、SOA企业架构和方法论、SOA基础设施这三个适合中国国情的切