论文部分内容阅读
随着基于内容的图像检索和本体技术的发展,文物图像检索与本体标注成为改变传统文物数据管理方法的一个重要而又富有挑战性的研究课题。本文针对基于图像的文物标注与检索中的一些关键技术进行了探索性研究,包括局部特征提取、图像语义获取、文物本体构建、语义标注等技术,本研究具有重要理论意义和实用价值。研究的主要创新点有:(1)首次将局部特征提取技术引入到文物图像检索,突破了原有基于内容的图像检索技术在文物特征提取中的应用框架,提出了一种基于SIFT特征的文物图像检索算法。在文物图像库上进行的实验表明,SIFT特征对于检索图像不仅具有旋转不变性和尺度不变性,对于文物对象边界较复杂的图像,也表现出良好的检索效果。该算法提高了已有文物图像检索系统的性能。(2)多示例学习(MIL)标记方法被认为是建立图像低层特征到语义特征间的映射,获取图像语义的新的学习方法。针对已有神经网络算法在解决MIL问题时分类性能不佳以及丢失包结构信息问题,提出了一种新的RK_BP多示例学习分类算法。首选利用前向贪心粗糙集算法进行属性约简,然后利用K均值聚类创建新包空间,最后使用BP进行分类。在基准数据集和文物图像集上的实验表明,RK_BP算法具良好的分类性能。(3)针对MIL应用于图像检索中的歧义性问题,提出了一种KP-MIL图像检索算法。首先利用K均值聚类获取潜在正示例代表和包结构特性数据,分别利用RBF核度量两者相似性,并利用α因子均衡两者的对核函数结果影响,最后使用SVM进行分类检索。在SIVAL图像集和文物图像集上的实验表明,相对于传统的DD及其它结构性MIL检索算法,KP-MIL算法不但具有更强的全局寻优能力,而且效率更高。(4)针对文物分类知识体系复杂的问题,建立一个计算机可以利用的文物分类知识库,并应用本体技术抽取了文物分类知识的元数据模型,构建了一个面向陶器分类的领域本体模型——PYCO。PYCO可以帮助建立起陶俑术语的显式规范化,使分析该领域知识成为可能,实现了文物语义概念的规则化及概念之间的联系。(5)提出了基于PYCO的陶俑自动语义标注方法。首先使用Jseg算法对陶俑图像进行分割,并结合全局视觉特征和局部SIFT特征提取分割区域的低层特征以形成表示图像的特征向量,然后采用多SVM建立低层特征与属性概念的关联,最后借助PYCO层次规则、映射规则等语义概念间的推理规则,实现对陶俑图像高层语义概念的自动标注。该方法有效的支持了基于本体的文物语义检索。