用于大规模图像检索的深度哈希网络研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:gxlw360
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像检索技术在机器学习、人工智能和计算机视觉等领域起着重要的作用。然而随着数据的爆炸式增长以及数据维度的增加,大规模图像在存储和计算上给图像检索技术带来了新的难题。近年来,基于哈希计算的图像检索算法因其存储成本低且检索速度快,在计算机视觉领域得到广泛的关注与研究。而在基于哈希计算的图像检索算法中,如何有效的处理高维度特征向量、优化哈希函数来提高检索算法的准确度是其中的一个关键问题,本文就是基于这一问题展开研究:将深度神经网络与哈希算法结合进行自适应学习,不但能处理有标签数据集,也能处理无标签数据集,因此具有更好的适用性。这里算法的框架分为三个部分:(1)运用复杂卷积神经网络产生哈希标签;(2)利用所得的哈希标签训练哈希函数;(3)基于获得的训练模型进行图像检索。我们主要在(2)、(3)部分做了相关的改进,主要工作包括如下内容:1.为了优化训练哈希函数,保证在计算损失函数时输出结果更加稳定,一般会使用批量归一化算法来减小偏差。但是为了进一步提高算法精度,我们引进了三种归一化方法,即层归一化、实例归一化、群组归一化,实验结果证明了群组归一化的性能更加良好。针对训练哈希函数时,全连接层的高维特征向量,本文采用了四种降维方法,包括主成分分析、拉普拉斯特征映射、局部线性嵌入、独立成分分析,实现了高维特征的降维处理,提高了算法的精度和速度。2.为了使得哈希层神经元的输出更加靠近0和1,获得更加均匀的二进制哈希编码来反映不同图像之间类的差别。我们提出了一种改进的损失函数,也就是在原有损失函数中增加了一个惩罚项;然而为了不使第一个惩罚项出现极端情况,即全为0或者1,导致哈希化时带来很大偏差,我们增加了第二个惩罚项进行约束。实验结果也证明了改进损失函数的有效性。3.为了进一步提高图像检索的精确度,我们提出了二级检索框架。首先通过在汉明空间的一级检索,得到图像相似度的排序,选取排序最靠前的20张图像,将其原始的图像特征向量与查询图像的图像特征向量逐一进行欧式距离计算,然后根据相似度由高到低进行排序,作为最终检索结果进行输出。在公开图像集Cifar10、Cifar100(fine)、Cifar100(coarse)、STL-10中的实验结果表明,本文提出的算法在各项评价指标上要优于其它哈希算法。
其他文献
随着人工智能理论和技术的飞速进步,各界对人工智能的关注度持续提升。同时,软件技术也在驱动着包括仪器仪表在内的各领域的进步,软件系统已成为大多数产品不可或缺的一部分。但软件系统功能的逐渐增多,引发了软件使用难、使用率低等问题,因此,将人工智能技术融合在软件使用帮助过程中不仅提升软件帮助水平,而且助力行业快速发展。本文在分析软件帮助系统、人机对话系统的研究现状之后,提出了一种基于软件实景的省略歧义处理
超声侧壁仪用于大型建筑建造地基时钻孔的测量工作。钻孔的质量会对浇注混凝土后成桩的质量产生很大的影响,从而影响整个建筑结构的稳定性。因此超声侧壁仪的测量精度在大型建筑的建造过程中起着非常重要的作用,也对系统中使用的嵌入式实时操作系统的性能提出了更高的要求。随着5G技术与物联网的不断普及,嵌入式系统也逐渐应用到生活中的各个方面。实时操作系统由于其具有实时性、高可靠度、专业化强、易于裁剪和移植等特点,在
随着国民经济的高速增长和居民生活水平的不断提高,人们越来越注重消费过程中的体验和感受。以人工智能、大数据和移动支付等先进技术为基础,融合线上线下的“智能+新零售”模式应运而生,正逐渐成为国内零售业新格局竞争的关键。基于计算机视觉的智能售货柜也因此成为行业内的关注热点。为给用户带来方便、快捷的舒适购物体验,智能售货柜必须要考虑商品识别准确度与识别速度的问题,这既是货柜商品智能识别算法研究的重点,也是
针对目前我国高价值专利评估中存在评估方法科学性不足、定量指标较少及评估体系不完善等问题,以300件中国专利奖获奖专利为研究对象,探讨构建科学合理、实用性强的高价值专利评估指标体系和具体评价方法。首先提出高价值专利是高技术价值、高法律价值、高经济价值、高市场价值的综合体现。其次分别从技术因素、法律因素、经济因素、市场因素等4个层面挖掘高价值专利的典型性特征,构建专利价值评估指标体系和评估模型,并以江
随着科技和互联网的发展,人们希望将纸质文档通过扫描、拍照等方式,提取图中有用信息,光学字符识别(Optical Character Recognition,OCR)技术正是解决这一问题的关键技术。手机、相机等移动设备的普遍应用,给人们带来拍照方便、获取信息便捷的同时,也带来很多不可控的因素,如局部曝光、模糊、畸变等,这都使得图像质量有所降低,进而导致OCR识别率降低,其中图像模糊和图像畸变是导致识
在现代电子信息作战体系中,电子侦察技术发挥着无可替代的作用,而基于星载平台的无源被动定位系统作为电子侦察的关键部分,具有越来越高的地位。然而,现存的双星时频差联合被动定位技术存在一定的问题。时差和频差参数的估计精度对定位精度具有直接的决定作用。而如今普遍使用的时频差估计算法已经不能满足进一步提升定位精度的需求,而运算复杂度也需进一步降低,这就要求一种既能提升时频差参数的估计精度,又能降低运算复杂度
随着技术的发展,机器人的应用拓展到了很多新领域,从而对机械手提出了更高的要求。传统刚性机械手往往具有输出载荷大、运动精确的优点,但是也具有自由度少、灵活度低的弱点。软体机械手理论上具有无限多自由度与任意变形能力,整体具有较高的柔性,安全性、灵活性得到了很好的提升,但往往负载能力低、重复精度差。因此,本文研究了一种基于柔顺双稳态机构的气动机械手,安全性高,自适应性好,重复精度高,输出载荷对气压波动不
过敏疾病作为全世界最常见的疾病之一,影响着人们的生命健康,治疗过敏必须先确定过敏原。当前绝大多数医疗机构通过点刺皮试的方式对过敏原进行检测,点刺皮试的检测方法需要通过体外注射多项过敏原,并由医护人员观察病患对每个过敏原的反应结果,填写电子过敏检测单,再通过人工录入医疗系统,最终形成过敏电子报告单。由于过敏原检测的项目众多,目前采用的手动录入医疗过敏检查单的方法存在工作效率低和录入过程中易出错的问题
随着空间技术在军事行动中的应用,各国大力寻求空间军事威慑,来保证国土安全不受威胁。建立空间防御系统,对探测、监视和跟踪来袭目标至关重要。相对于单星观测,多颗卫星通过联合观测具有无法比拟的优越性,可以扩大可靠跟踪的范围并且获得更加准确的目标信息。对低轨星载传感网络中星载传感器进行信息融合与资源调配,可以使得资源得到合理的规划与调配,从而大幅度地提高对目标的跟踪定位性能。本文研究的内容主要包括以下几部
本文研究基于Red5流媒体服务器的视频无线传输系统设计问题,同时也是网络摄像机的应用程序设计。本系统的设计是解决用户在移动端观看网络摄像机直播、点播视频的问题,其中主要工作分成客户端和服务器设计两部分。客户端包括推流端和微信小程序设计。推流端是推送直播视频流的硬件平台,主要负责推送摄像头采集的视频流数据。推流端使用海思平台Hi3518E网络摄像机,在与服务器建立Socket通信连接及定义好的的通信