【摘 要】
:
随着数字图像采集设备的普及,互联网中以图像为代表的海量数据正在与日俱增。数字图像在实际应用中极具价值,并已深入到生产、生活的各个方面。而图像索引技术又是大多数图像
论文部分内容阅读
随着数字图像采集设备的普及,互联网中以图像为代表的海量数据正在与日俱增。数字图像在实际应用中极具价值,并已深入到生产、生活的各个方面。而图像索引技术又是大多数图像应用中的基础。由于图像数据集具有噪声数据多、高维稀疏等特性,如何为图像数据集构建准确的索引成为亟待解决的核心问题。本文针对该问题及图像数据集噪音大、高维稀疏的特点,提出一种基于噪音过滤和Info-Kmeans聚类的图像索引构建方法。本文的主要工作如下:(1)调查研究了图像索引涉及到的相关工作,并对相关技术进行了系统的描述,并着重讨论了它们在处理噪音和高维稀疏聚类问题上的不足。(2)对噪音过滤技术的研究。在上述研究的基础上,针对图像数据集中的噪音问题,提出一种基于频繁项集挖掘的噪音图像过滤技术。使用该技术对数据集中存在的噪音数据进行过滤,并使得构建的索引更加准确。(3)对图像聚类算法的研究。对于图像数据集的高维稀疏特性,本文通过对基于KL-divergence的Info-Kmeans算法的性能问题展开分析,从而提出了基于香农熵的ASAIL算法。通过ASAIL算法对图像进行聚类,并将每个簇类中出现最多次数的图像内容作为该簇类的名字,簇类的名字即为索引,从而完成了图像索引的构建。(4)方法的可行性、有效性验证。通过对两个图像数据集构建索引,表明噪音图像过滤算法可有效剔除图像数据集中存在的噪音图像从而提升构建索引的质量,并证明改进后算法的运行时间得到有效降低。同时,通过与传统的聚类方法进行对比,基于香农熵的ASAIL算法对图像等高维稀疏数据具有优良的性能。
其他文献
分布式共享存储系统(DSM-Distributed Shared Memory) 将物理存储分布到各处理节点,同时向用提供一个共享的存储空间.该文首先对软件DSM的系统结构及研究发现状进行了系统的
该文主要研究在分布式环境下面向组件的空间数据库引擎的若干问题.对于空间数据的组织管理,研究人员提出了空间数据库的概念,它建立了统一的空间数据模型和用于数据访问的GSQ
该文研究的MPEG-2码流的非线性编辑算法,涉及MPEG-2标准的编码和解码算法的优化、MPEG-2码流的编辑算法、MPEG-2码流编辑、编码、解码的码率控制算法等问题.
无线传感器网络是一种多功能低能耗的无线自组织网络,在军事监控和探测、大气水纹监控、森林火灾预防、山崩预测、大棚灌溉、鸟类观察、跟踪定位等领域有广泛的应用。智能家
随着语义Web的快速发展,有越来越多的语义Web本体被发布出来。然而,语义Web的分散性导致异构本体的产生,即存在不同的本体包含同义的类、属性和实例。本体匹配旨在发掘不同本
概念设计作为设计过程的早期阶段,是一项创造性的工作,需要有一个快速而有效的工具来支持设计者意图的表达、交流和记录.同时,由于概念设计过程不提供精确的尺寸信息,因此不
该文的研究是将无β环放入物定的依赖环境中,与其它的规范化特性一起讨论,最后得出无β环、无损联接、保持依赖且满足某一范式的数据库模式分解条件.然后给出相应的分解算法.
无线多媒体传感器网络在现代生活中处于举足轻重的地位,它已经深入到军事、工业、商业等中,便利了人们的生活和工作。与传统无线传感器网络相比,它处理的多媒体信息数据量相
HNC理论(概念层次网络理论)是面向整个自然语言理解的强大而完备的语义描体系.该文的工作是基于HNC理论的句类知识,对自然语言理解处理的五重模糊中的第五重模糊之指代模糊进
该文的目的就是要研究噪声环境下一种基于环境特征判别学习的Robust语音识别方法.主要内容如下:首先讨论了语料库的选择与建立.然后提出了一个简单的语音识别系统中的环境模