论文部分内容阅读
随着信息科学的进步和互联网络的发展,网络信息资源越来越丰富,信息量呈爆炸式地增长。目前大多数网络信息检索的主体是文本信息。随着网络多媒体信息量的极速增长和多媒体检索技术的发展,多媒体信息的检索逐渐变得普遍,比如图像检索,视频/音频检索。在传统的图像/网页搜索引擎中,由于查询词的模糊性和检索机制的限制,给用户获得自己所需要的信息设置了障碍。因为大量的不同主题的搜索结果被统一地以链接加图像缩略图或摘要的形式展现出来,用户需要花费大量的时间定位自己需要的图像/网页。根据语义等其他特征对结果进行聚类的方法被认为是解决此类问题的一种有效手段。本论文在多媒体理论,图论,信息论以及模式识别理论的指导下,提出了一种自适应智能图像聚类技术,设计并实现了ImageCluster智能图像聚类系统。本论文提出了一种基于规则和统计的特征融合算法FFRS,较好地融合了图像的视觉特征和语义特征。FFRS使用图像的视觉特征来辅助图像的语义特征,从而使图像的融合特征更能反应图像的本质特征。本论文提出了一个基于颜色和语义结合特征的自适应阶段式聚类法TSCM,该方法结合了不同层次的图像特征,利用了现有多种聚类算法的优点对图像进行聚类,同时通过提取主题关键词,为每类赋予含义。最后聚类结果将以一种非常直观以及生动的星爆图的方式返回给用户。本论文详细介绍了上述算法的工作原理,并在此基础上设计实现了基于B/S架构的智能图像聚类检索系统。在实验中,通过计算聚类均方差和用户评估,说明本文提出的FFRS基于融合特征的三段式聚类方法TSCM得到的聚类结果较传统聚类方法具有更低的均方差和更好的用户体验。