基于卷积神经网络的艺术品图像检索系统设计与实现

来源 :内蒙古大学 | 被引量 : 4次 | 上传用户:ggy353566
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习的发展使得人工智能的研究领域迈向更深、更实际的层次,其中卷积神经网络在图像特征表达方面具有十分重要的研究价值。本文结合国家科技支撑项目《民族工艺美术关键支撑技术研究与应用示范》,针对项目的资源库中含有大量的艺术品图片,研究、设计并实现了一套实用的艺术品图像检索系统。一方面这些艺术品图像相对于传统的图像而言,种类多、花样杂,相似性和复杂度都非常高,设计和实现难度都较高;另一方面,作为项目的一项重要功能,图像检索系统具有很强的实用价值和研究意义。本文对艺术品图像检索系统的研究和设计是基于卷积神经网络的,主要进行了以下两个方面的研究工作。其一是利用卷积神经网络对图像进行特征的提取。资源库中艺术品图像数据集规模还不大,对于深度学习研究领域来说,数据集只能算作小规模数据集,同时本实验的硬件环境也并不算很突出。结合实际情况,训练了卷积神经网络模型,通过实验分析选取出较优的卷积神经网络结构—ArtNet。它是一个包含两个卷积层、两个池化层以及一个全连接层的七层网络结构。实验表明,ArtNet对验证集的准确率可以达到94%以上。其二是在ArtNet基础之上,设计并实现了一个实用的艺术品图像检索系统(API),并作为项目建设的一项重要功能与项目的其他系统进行了有效整合。系统包括索引创建和检索两部分。索引创建过程是用ArtNet对原始图像数据集进行特征提取,每一张图片都得到一个特征向量,作为原始图像数据集的特征数据库,形成索引集。检索过程是将查询图片用ArtNet提取特征,得到其特征向量,然后与索引集中的特征向量逐一对比,计算相似度,返回最相似的若干图片。整个系统基于B/S结构设计,用到的深度学习框架是Caffe,用到的编程语言主要是Python。实验结果表明,检索系统的准确度基本都在70%以上,较好地达到了分类检索的目的。
其他文献
随着现代工业技术的不断发展,数字电路的集成度越来越高,系统芯片(System-on-a-Chip,SoC)上集成的知识产权核(Intellectual Property,IP)越来越多,功能也越来越复杂。在测试
3D视频以其观看时强烈的立体感和全新的视觉体验日渐成为数字媒体发展的主要趋势,而在目前2D-3D图像/视频转换技术中,基于深度图绘制(DIBR)3D图像技术由于具有所需的数据量小
在这个数据日益增长的时代,各类电子设备在每时每刻都会产生或多或少的数据,有时产生的数据往往维度非常高,即称为高维大数据,然而数据挖掘中需要处理的高维数据通常包含冗余
左手材料是等效介电常数与等效磁导率同时为负的一种新型人工材料。作为21世纪科学界的最大发现,它奇异的微波特性很快就引起了广大学者的研究兴趣。负折射、逆多普勒效应和
“精准农业”是当今农业最富有吸引力的前沿课题,通过引入现代技术和科学管理方式,获取农作物生长过程中的参数信息,辅助管理人员做出科学决策,以提高农作物的产量。多光谱技
人类对无线电频谱资源的需求急剧膨胀,为了有效地利用稀缺的无线电频谱资源,一些频谱利用率较高的调制方式和传输技术如多电平正交幅度调制(M-QAM)、正交频分复用(OFDM)、宽
近年来,互联网以及社交通讯的飞速发展给许多企业带来了技术的革新。企业可以通过基于互联网社交平台的投诉反馈通道,快速地收集到各类产品评价及服务质量等投诉反馈信息。对
在大数据时代,数据信息是最有价值的抽象事物,数据中蕴含着大量的有价值的信息,需要将这些信息提取出来,数据挖掘是实现的重要过程之一。数据挖掘是现今社会的热门学科,是从
在信息爆炸的互联网时代,网络上充斥着海量繁杂的信息和数据,且多以半结构化文本或自由文本形式呈现。用户对搜索所关注信息的效率性和获得结果的准确性有着越来越高的要求,
多目标优化问题始终是生产生活中不可避免的问题,对于求解此类问题的算法的研究和优化,始终是智能计算领域的重要课题。目前,分解策略型多目标进化算法(MOEA/D)由于其在解决