论文部分内容阅读
随着计算机技术和网络通讯技术的高速发展,我们的生活和工作中充斥着各种各样的数字化信息,这些信息以图像等多媒体信息为主,在各个领域中都发挥着重要作用。如何对这些多媒体信息进行有效的组织和利用并从中找出用户所关心的数据已经成为目前研究的重要课题。本文将重点讨论如何有效组织这些多媒体数据并克服“语义鸿沟”提高图像分类查询性能的相关技术。本文提出了一种基于开源Web数据的图像分类查询系统,该系统以提取不同媒体底层特征为基础。在该系统中主要提出了关于跨媒体关联图模型的构建与更新和基于跨媒体关联图的聚类索引与新媒体对象的加入几种方法和策略。通过这些方法的提出与使用,不仅降低了系统查询的时间成本,同时也提高了系统最终的查全率和查准率,达到有效找到用户感兴趣信息的最终目的,即通过Web中图像周边文本信息与图像间不同媒体的关联关系找到在高层语义上图像间的相似关系。跨媒体关联图模型的构建是通过获得不同媒体信息底层特征进行相似距离计算来构建单模态邻接图,通过链接分析找出不同媒体间的关联关系,以此为基础构建模型。为了得到图像间固有的或潜在的相似关系本文还设计局了两种更新策略,通过不同媒体间的相似性传递原则进行迭代更新,以提高或削弱媒体内部的相似关系;通过用户的相关反馈使关联图模型中数据的关系能够更加与高层语义关系相一致。在本文的查询和分类过程中都是基于此模型来进行的,与传统方法相比,本文提出的模型能够更好的在高层语义范围内找出媒体间的关联关系,能够更好的使不同媒体信息通过数据间的关系融合起来。在跨媒体关联图模型上进行查询时,本文首先提出了一种基于聚类的索引方法,对于用户提供的查询示例先确定类别,再在类内部计算相似性,这样大大缩短了查询时间。将查询示例作为新媒体对象插入关联图中,通过图中近邻的查找而得到用户感兴趣的信息。最后本文的实验结果中从查询时间、系统的查准率、查全率等多个指标上验证了对于本文提出的基于开源信息跨媒体融合的图像分类查询系统的有效性和正确性。