论文部分内容阅读
随着科学技术和因特网的发展,以及多媒体的推广应用,海量的各种类型的信息正在全球被快速的采集、传输和应用。20世纪90年代,出现了基于内容的图像检索(CBIR)。它可以直接从图像信息源中获得视觉内容特征,如颜色、纹理、形状等来判断图像之间的相似性。然而,这些图像低层信息反映的只是图像的一些客观统计特性,并不能真正被人们理解。在许多的检索识别中,人们主要是根据图像的关键字来判断图像是否符合自己的需要,其关键词可能是蓝天、落日或其它,而不是图像的低层视觉特征,这些图像的关键字即是图像的高层语义知识。可见,语义检索更能满足用户的需要且有着极其广阔的应用前景。如何解决图像低层视觉特征和高层语义特征存在的“语义鸿沟”已成为语义图像检索问题的关键。本文通过建立一个多输出的BP神经网络,提取图像的底层特征作为网络的输入,用语义期望值作为网络的输出,并用改进的BP算法来训练该网络。训练完成后,该网络能够对风景图像进行多种语义分类检索,从而建立起了从底层特征到语义特征之间的映射。实现了图像的语义算法。本文主要工作包括:(1)风景图像具有比较鲜明的颜色特征,通过学习和分析RGB和HSV的颜色空间模型,提出了一种非均匀量化算法,对自然界的八种主要颜色进行聚类,并选取合适的纹理和形状特征。(2)对图像进行分割,通过在分割区域上提取图像的底层特征向量,再利用BP神经网络建立低层视觉特征和高层语义特征之间的映射,填补了图像检索中的语义鸿沟。并就如何选取隐层节点和构造训练样本集做了分析,使网络具有更好的学习能力。(3)如何选取图像的语义阈值是一个重点也是一个难点,通过实验发现,当阈值的选取范围在[0.55,0.65]时,检索的查全率和准确率能达到一个比较好的平衡效果。最后检索结果证明了该方法对风景图像检索的有效性及先进性。