基于视觉特征与机器学习的图像分类和图像检索方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:lhbss230
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网行业与多媒体技术的飞速发展,图像分类和检索技术已经成为国内外的研究热点。传统的基于关键字的图像检索和图像分类已经不能满足人们的日常需求,因此基于图像内容的图像识别方法便应运而生。图像特征描述方法中最具代表性的主要有图像视觉特征和基于机器学习算法提取出的图像抽象语义两个方面,而这两者在描述图像时各有侧重点,在图像分类和图像检索时并不能达到理想的效果。鉴于此,本论文基于图像视觉特征和CNN(卷积神经网络)算法提取出的图像特征来研究图像分类算法和图像检索算法。首先,设计了一种基于词袋模型(BOW)的后处理框架。该框架利用CNN特征并计算特征相似度,将相似度高的图像集作为初步检索结果输入到由BOW聚类模型训练出的图像分类器中,检索结果就是包含图像个数最多的类别。实验结果表明,在基于相同数据集与分类类别的条件下(本论文采用图像个数1000共六类图像的数据集),该框架的图像检索准确率为90.4%,相对于基于CNN特征的图像检索算法有10%的提高。其次,详细阐述了基于颜色特征与机器学习结合的图像检索算法,具体来说,分别提取图像颜色特征和CNN特征,并将两个特征加权拼接为融合特征向量,将其作为每幅图像的标识并计算待检索图像与数据库中图像集的相似度,获得最终的检索结果。实验结果表明,检索结果中图像色彩与待检索图像色彩匹配度有大幅度提高。最后,给出了基于多核学习与图像视觉特征结合的图像分类算法,该算法利用CNN特征、局部自相似特征和塔式关键字直方图特征分别计算对应的预编译核矩阵,根据这三个矩阵求解合成核函数和基本核函数的权重得到分类器,对数据库图像进行分类。实验结果表明,多核分类算法在PR曲线性能上优于基于CNN特征的单核分类算法,本论文算法在对七类图像分类时,图像分类的平均精确度提高了18%。结合本论文算法搭建了图像分类网站,该网站基于主流的J2EE框架开发,实现了将用户上传图像集分类的功能。相对于传统的图搜网站,设计的网站允许用户上传多张图像,满足了用户针对本地数据集进行分类处理的需求,可应用于社交网站相册管理、门户网站图片分类等场景中。
其他文献
移动自组织网络具有自组织和无中心的特点,不需要固定的网络基础设施的支持,能够为军事和民用应用快速搭建网络平台,是未来无线通信网络的关键技术。由于移动自组织网络拓扑
短突发通信系统广泛应用于军事通信、卫星通信、深空探测及高速移动通信等领域,由于这些系统的信道都是功率和带宽受限的,因此如何高效地利用有限的功率和频率进行通信成为了
迈入3G时代之后,无线通信系统的业务从传统的话音服务传输扩大到实时图像、音乐、视频流等多媒体传输服务,并且包括了网页浏览、电话会议、电子商务等应用,系统对信息的高速
近年来,随着用户需求的增加,移动定位技术LCS(Location Service)受到越来越多的关注,而 GNSS(Global Navigation Satellite System,全球导航卫星系统)精度高、性能可靠,应用于移动无
空间谱估计技术是20世纪60年代开始发展起来的一门新兴空域信号处理技术,可以说它是在波束形成技术、零点技术和时域谱估计技术的基础上发展起来的一种新技术,其主要目标是研究
正交频分复用(OFDM)技术是近几年兴起的一种在无线信道上实现高速数据传输的新技术。它属于多载波调制技术,其传输速率高,对码间干扰和信道选择性衰落具有很强的抵抗能力等特
随着汽车工业的飞速发展,我国汽车保有量正以每年15%的速度增长,目前已达两千万辆。汽车数量的大幅度增加导致交通事故率的上升,有些交通事故是由于汽车性能问题所引起的,为了避免