自动图像标注与图像检索算法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:comeon833833
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的快速发展,每天都会产生数以亿计的数字图像。这些图像杂乱无章,为了对这些海量图像进行加工处理并找到有用的图像,图像检索算法应运而生。目前应用最广泛的算法是基于语义和基于内容的图像检索算法。而自动图像标注是获取图像语义的主要方法。在自动图像标注过程中,仍有一些问题需要进一步解决。1.图像的底层视觉特征不能充分体现用户所理解的高层语义而引起的语义鸿沟问题。2.图像数据库中每个标签相关的图像频率有很大差距而引起的类别不平衡问题。3.图像数据集中图像的标注信息不完整而引起的弱标记问题。本文主要针对上述三个问题展开研究,主要工作如下:针对自动图像标注中的语义鸿沟问题、类别不平衡问题、弱标记问题,提出了基于典型相关子空间和K最邻近的自动图像标注算法。首先,将图像的底层视觉特征和高层语义特征映射到一个共同的典型相关子空间,在该子空间中求这两种特征间的相似性。其次,由底层视觉特征和高层语义特征的相似性可以得到图像和标签的相关性,根据该相关性得到与每个标签相关的图像子集,称该图像子集为标签的语义空间。然后求该语义空间中的图像与待标注图像的视觉距离,并利用K最邻近算法选择待标注图像的K个邻居。将每个语义空间的K个邻居组合起来构成一个图像子集,该图像子集中每个标签相关的图像数基本平衡;由于该图像子集中几乎包含了标签集中的所有标签,因此考虑到了标签集中所有标签与待标注图像的标注概率。然后,求待标注图像与该图像子集的视觉距离并结合贝叶斯定理,得到待标注图像与标签的初始标注概率。最后,利用标签间的相关性改善图像标注质量。在Corel5k, ESP Game和IAPR TC-12这三个基准数据集上进行实验对比,实验结果表明,所提出的算法能够有效地完成自动图像标注任务。针对传统的基于哈希的图像检索方法中检索精确度较低的问题,提出了基于分块哈希的图像检索算法。首先,将图像特征分为多块,并对这些图像特征块使用不同的哈希映射函数进行映射得到其对应的实值向量。其次,将所有实值向量组合起来形成一个完整的实值向量,并对该实值向量进行阈值二值化形成哈希码。我们对训练集的图像特征和检索图像集的图像特征分别执行上面的步骤得到对应的哈希码。最后,求训练图像和检索图像哈希码间的汉明距离,并选择与检索图像汉明距离最小的几个图像作为其检索结果。我们在Caltech-256和CIFAR-10数据集上进行性能测试。分析实验结果可以得到,和其他图像检索算法相比我们的算法能在较短的时间内取得较高的检索精确度。
其他文献
随着计算机技术与网络通信以及信息产业的高速发展,网络入侵攻击的事件频繁发生,因此计算机网络安全形势也日益严峻,所以需要能过各种网络安全技术来解决问题。而入侵检测技
随着计算机网络和数据库技术的发展,在企业信息化建设和管理过程中,数据库的应用越来越广泛,几乎所有大型的商业应用系统都是和数据库相关联的,许多应用程序都使用数据库来管
终端直连技术(Device-to-Device, D2D)作为5G中的关键技术和提高频谱利用率以及网络质量的重要手段,得到广泛关注。D2D技术可以提高网络吞吐量,降低基站负荷,减少终端设备发
随着网络技术的发展,当今社会互联网上信息量越来越大。传统的基于文本的图像检索以及基于内容的图像检索由于各自的缺点,必然不能满足人们的需要,从而也推动了自动图像标注
由于无人机(UAV)的零人员伤亡,成本低,生存能力强,机动性好,使用性强等特性,使得其在在现代战争中有极其重要的作用,在民用领域更有广阔的应用前景;近年来,UAV技术引起了世界
Forrest提出的否定选择算法建立在传统的“自我/非我”识别模式基础上,该算法对自体集的完备性和洁净性要求较高,在实际应用中存在无法克服的局限性。SNS模型受到了挑战,新的
随着信息技术的迅速发展和Internet的普及,人们对网络的依赖性越来越大,网络已经融入了人们生活和工作的方方面面。面对越来越复杂的信息系统,人们往往会有很多疑问,但总得不
近年来,随着计算机硬件和软件的发展,计算机图形学在视频游戏,电影动画,虚拟现实等行业中起着越来越重要的作用,而在这些应用中,经常会需要对模型进行变形模拟。目前常用的变
随着经济社会的发展,我国对外开放程度越来越高,进出口贸易量越来越大,科技引进的程度越来越高,人才访问交流越来越频繁。随之而来的就是一些单位及企业邀请外国人来华的需求
无线网状网(Wireless Mesh Networks,WMN)作为一项最后一公里的无线宽带接入技术,以其健壮性,廉价、方便部署等优点受到青睐,在民用,军事等领域得到广泛应用。在多接口多信道