论文部分内容阅读
随着科学技术的迅猛发展,计算机硬件、数字化设备和通信传输等信息技术日新月异,将人类社会带入到一个高度信息化的时代。而多媒体和网络技术的发展,导致了大量图像资源在网上爆炸性增长。作为多媒体数据的一种重要表现形式,图像往往包含着丰富的信息内容,如何对图像数据进行有效的描述和分析对于计算机更好地理解图像内容具有重要的研究意义。另一方面,由于网络图像数量的快速增长,如何对海量的图像数据进行有效地组织管理,并从中快速搜索得到人们感兴趣的结果也成为了当今一个日益重要的研究课题,具有重大的现实意义。
本文以机器学习中常用的图分析方法对图像之间的内在结构关系进行建模,然后将其嵌入到图像的内容分析过程中,并在此基础上对图像潜在主题挖掘、紧致特征描述和大规模数据的快速搜索等内容做了深入研究,主要工作和贡献如下:
(1)提出了一种基于双重局部约束限制的潜在语义分析模型。在图像的词袋表示形式下,潜在主题模型常被用来缩小图像底层特征和高层语义之间的鸿沟。为了克服传统潜在语义分析方法在主题描述能力方面的不足,本文在建模过程中融入了双重局部约束限制。首先,模型通过构造一个(l)1-图对图像间的稀疏近邻结构进行表示;然后,将其与视觉单词之间共生关系联合嵌入到潜在主题的学习过程中,从而得到图像在中层语义空间中更为准确的概率描述,并在图像聚类任务中取得了较好的效果。
(2)提出了一种基于语义图学习的谱哈希算法,实现了图像的紧致编码和快速搜索。哈希算法是为了加快近邻搜索速度而设计的一种编码技术。本文的方法以谱哈希算法为基础,提出了一种新的相似度度量方式对图像关系进行构图,然后利用图像所携带的用户标签等信息对构图结构进行学习,最后在优化的图结构上实现更为准确的图像二进制编码,提高了快速搜索的准确率。
(3)提出了一种半监督的多图哈希算法,并用于图像的快速相似度搜索。针对图像的多种模态表示形式,该方法能够在一个半监督多图框架中同时对图像的多种模态信息进行融合学习,并自适应地学习出每一种模态图的优化权重系数,从而可以更准确地对不同信息进行建模,得到更为有效的图像编码,实现快速图像搜索。
(4)提出了一种基于双互补哈希算法的快速图像检索方法。在判别结构图的基础上,该方法采用了互补学习的方式来进行哈希函数和哈希表的学习,可以同时得到具有互补特性的哈希编码函数和多个互补的哈希表。这种双互补的哈希编码方式能够有效地平衡图像搜索的准确率和召回率,大大提高了快速图像搜索的性能。