论文部分内容阅读
随着注册商标数量的急剧增加,在这种超大图像库上实现检索将需要耗费大量的时间和人力。传统的商标图像检索方法存在很多缺陷,包括图像的人工分类耗时、带有主观性、自动化程度低等。针对这些不足,我们研究并提出了基于形状特征的商标图像自动检索方法,并优化了商标图像库的索引结构。在讨论了一般图像检索理论的基础上,结合商标图像的特点,提出了一种新的基于形状特征的商标图像检索方法。该方法首先对商标图像进行规格化处理,使其对旋转、平移、缩放、扭曲等各种形状失真具有不变性,然后采用修正的k-均值聚类法对预处理后的形状进行分块,用以确定划分半径,接着提取各分块的Zernike矩值作为表达商标图像形状信息的特征,归一化后采用各分块间特征向量的距离方差来动态调整各个分块的权值系数,使用带权值的欧式距离来计算图像间的相似度。在查询优化方面,针对商标图像库中的高维向量空间,分析了适合高维空间索引的几种方法,然后结合常用的k-近邻查询的技术特点,设计了一种新的基于降维的有效高维空间数据索引方法——层次距离索引(Depth Distance Index Structure, DDIS)。该方法先将数据空间均匀划分成多个金字塔,然后取每个金字塔基的质心为参考圆心,根据每个数据点与其所属金字塔圆心的距离、以及与金字塔基的距离映射到一维,然后使用B+树建立索引。基于达梦图像检索系统和灰度商标图像库的实验结果表明,所提出的两种新算法都具有一定的实用价值。在商标图像的检索精确度方面,新检索算法比不变矩提高了将近36%,比原始Zernike矩提高了将近11%,该方法具有更高的准确度和查全率。在k-近邻查询的响应时间方面,新索引结构的平均CPU占用时间和平均页面访问次数不到iDistance算法的70%,金字塔算法的50%,且能够有效的在较小的查询半径下返回较精确的结果。