论文部分内容阅读
深度学习的发展使得人工智能的研究领域迈向更深、更实际的层次,其中卷积神经网络在图像特征表达方面具有十分重要的研究价值。本文结合国家科技支撑项目《民族工艺美术关键支撑技术研究与应用示范》,针对项目的资源库中含有大量的艺术品图片,研究、设计并实现了一套实用的艺术品图像检索系统。一方面这些艺术品图像相对于传统的图像而言,种类多、花样杂,相似性和复杂度都非常高,设计和实现难度都较高;另一方面,作为项目的一项重要功能,图像检索系统具有很强的实用价值和研究意义。本文对艺术品图像检索系统的研究和设计是基于卷积神经网络的,主要进行了以下两个方面的研究工作。其一是利用卷积神经网络对图像进行特征的提取。资源库中艺术品图像数据集规模还不大,对于深度学习研究领域来说,数据集只能算作小规模数据集,同时本实验的硬件环境也并不算很突出。结合实际情况,训练了卷积神经网络模型,通过实验分析选取出较优的卷积神经网络结构—ArtNet。它是一个包含两个卷积层、两个池化层以及一个全连接层的七层网络结构。实验表明,ArtNet对验证集的准确率可以达到94%以上。其二是在ArtNet基础之上,设计并实现了一个实用的艺术品图像检索系统(API),并作为项目建设的一项重要功能与项目的其他系统进行了有效整合。系统包括索引创建和检索两部分。索引创建过程是用ArtNet对原始图像数据集进行特征提取,每一张图片都得到一个特征向量,作为原始图像数据集的特征数据库,形成索引集。检索过程是将查询图片用ArtNet提取特征,得到其特征向量,然后与索引集中的特征向量逐一对比,计算相似度,返回最相似的若干图片。整个系统基于B/S结构设计,用到的深度学习框架是Caffe,用到的编程语言主要是Python。实验结果表明,检索系统的准确度基本都在70%以上,较好地达到了分类检索的目的。