基于语义的图像标注和检索算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:kxlzyc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像的自动标注技术和基于语义的图像检索技术在多媒体信息检索领域有着重要的地位。图像标注满足了用户在海量图像数据库中进行关键词检索的需要。传统的基于文本的图像检索系统需要耗费大量人力进行手工标注,因此,研究人员提出了基于内容的图像检索技术,该技术直接从图像内容中提取颜色、纹理和形状等底层特征进行检索。但是,随着研究的深入,基于内容的图像检索遇到了一个严重的问题,即图像底层特征和语义概念之间存在着“语义鸿沟”。为了解决“语义鸿沟”这一难题,本文提出了基于矢量量化和潜在狄利克雷相结合的模型标注方法。首先,介绍了图像自动标注和检索的研究背景和意义,总结了当前各标注系统的构成及其优缺点。近年来,潜在狄利克雷分布(LDA)模型在文本信息检索领域得到了广泛的研究和应用,许多学者已经证明LDA模型对于离散数据的处理和降维有着显著的作用。不难看出,图像信息和文本信息有着惊人的相似性:1、数据的海量性和高维性,2、同一类图像中包含的相近的目标,而同一类文档含有大量相近的单词。本文详细论述了LDA模型的数学原理,提出了该模型在图像数据处理和图像语义检索中的应用方法。为了描述图像中的有意义区域,需要对图像的目标进行分割运算。本文的在回顾经典图像分割算法的计算速度和分割效果之后,选择了分水岭算法对图像进行分割,并针对该算法存在的过分割问题,提出了一种改进方法。接着,对分割后的图像区域提取了颜色、纹理和形状共18维特征,利用矢量量化技术将这些特征聚类压缩。聚类后的区域特征对应生成“码书”中的一个码字,压缩后得到的“码书”可以看成是图像库的一个语义词典。最后,本文使用MATLAB程序实现了上述方法,并对400幅Corel图像库进行了仿真实验。实验结果表明,本算法可以完成图像的自动标注和关键词检索。
其他文献
目的:研究急性心肌梗死(AMI)患者抢救时行优化急诊护理流程的效果.方法:选择我院收治的80例AMI患者,采纳“就诊先后顺序”随机分观察组(优化急诊护理流程)与对照组(常规护理)
表面等离子体共振(Surface Plasmon Resonance, SPR)调制方式的多样化使得各种类型的SPR传感器相继面世,其中光强调制型和相位调制型SPR传感器分别因为可实现高通量和高灵敏
随着港口物流运作系统环境不稳定性增强,要求该系统能够对多变的环境迅速做出反应,因此,柔性作为一种能够有效应对由环境不确定性或因环境变化而产生的不确定性的手段,被应用到该
张力腿平台是目前深水油气开发应用较成熟的平台形式之一,在深海作业具有运动性能好、抗恶劣环境作用能力强、可移动等优点。我国南海油气资源丰富,结合目前国际的能源需求形式
微阵列芯片具有高通量、微量化和自动化等特点,已经在很多领域得到广泛应用。但是微阵列芯片仍然具有不足之处,如所需设备昂贵、分析时间较长、灵敏度不高、多样品平行分析能力
三体船由于在主船体左右舷各增加一侧体,使得船体周围流场变得十分复杂,三体船性能也因此发生了很大的变化。与常规船型相比,三体船性能优越,在民用及军用方面都有广阔的应用
大规模分布式仿真所涉及的数据空间非常巨大,需要耗费大量的时间,并且对计算环境也有较高的要求。在如此巨大的分布式环境中对资源进行管理和访问是一项十分复杂的任务。将网
无论船舶在设计、建造还是营运过程中,船舶稳性都是受到普遍重关注的一个重要因素,船舶的稳性与其人员财产安全、安全运输以及保护海洋环境等密切相关。以往的船舶稳性计算通