【摘 要】
:
随着移动互联网时代的来临,社交媒体、电子商务等新兴平台的不断涌现,随之产生的各式数据呈几何指数上升。不仅如此,监控摄像头网络、车联网系统、智慧医疗影像等技术的发展也产生了海量的数据。这些数据不仅具有极高的商业价值,同时也是涉及国防安全,国计民生的重要资源。如何运用好现代信息技术从这些海量的数据中搜索所需的数据是一个极具价值且有挑战的工作。基于哈希学习的图像检索方法具有储存性能优、查询耗内存少、速度
论文部分内容阅读
随着移动互联网时代的来临,社交媒体、电子商务等新兴平台的不断涌现,随之产生的各式数据呈几何指数上升。不仅如此,监控摄像头网络、车联网系统、智慧医疗影像等技术的发展也产生了海量的数据。这些数据不仅具有极高的商业价值,同时也是涉及国防安全,国计民生的重要资源。如何运用好现代信息技术从这些海量的数据中搜索所需的数据是一个极具价值且有挑战的工作。基于哈希学习的图像检索方法具有储存性能优、查询耗内存少、速度快以及精度高等特点,所以受到了国内外许多学者的广泛关注。大多数现有的监督哈希是集中式的,例如监督离散哈希(SDH)和具有松弛的监督离散哈希(SDHR)。SDH方法通过使用普通最小二乘回归和传统的类标签信息的零一矩阵编码来确定回归目标。而SDHR是对回归目标矩阵添加一个约束,使得每个样本都被正确分类并满足更大的余量,从而达到优化回归目标的目的。在现实环境中,大量的数据会分布在不同的机器上,例如,安防系统中的摄像头、蜂窝网络中的智能手机、车联网中的智能汽车等。因此,集中式哈希方法有很大的局限性,为克服只能在单台机器上训练的缺点,DSDH将SDH扩展到了分布式网络中,并且取得了良好的效果。在本文中,我们提出了基于SDHR的松弛分布式监督离散哈希方法(DSDHR),将SDHR方法引入分布式网络。在此方法中,所有节点共享一个哈希学习模型。同时,引入了一致性约束,以确保DSDHR方法在多个节点上并行更新。在每个节点中,使用交替迭代的方法获得二值化哈希编码、回归目标和哈希函数。在三个公开的标准数据集CIFAR-10、Wiki和NUS-WIDE上,对所提出的方法DSDHR进行相关对比实验。实验表明,DSDHR相比一些集中式和分布式哈希方法在检索精确度方面有所提升。而在训练效率方面,随着码长的增加,本文提出的DSDHR的训练时间相较于集中式SDHR的训练时间有显著的减少。这说明DSDHR克服了集中式方法SDHR在码长较长时训练时间长的劣势。通过消融实验,可知某些参数对于DSDHR方法影响不明显,说明所提出的方法更加稳定。综上所述,DSDHR方法是具有一定竞争优势的哈希检索方法。
其他文献
近年来,双向联想记忆(Bidirectional Associative Memory,BAM)神经网络,因其双向连接结构而受到广泛关注。由于这种结构特征,BAM神经网络在人脸识别、语言理解和序列学习等许多应用中都具有出色的性能。这些应用在很大程度上依赖于BAM神经网络的动态行为,这使得BAM神经网络动力学行为成为研究热点。在生物神经系统中,扩散现象广泛存在,扩散现象会使得神经网络产生更加丰富的动
随着网络技术的不断发展,由智能手机带动的移动媒体逐渐影响人们的生活方式,人类的社交方式也在发生巨大的改变。5G时代的来临,短视频行业异军突起,其用户规模和用户渗透率也在逐年攀升,短视频已日渐成为重要的社交媒介和电商销售渠道,并逐渐占领市场。由于短视频属性复杂,用户对语言的规范程度存在差异,致使平台上出现了大量语言不规范的现象,破坏了汉语的规范性和标准化传播。自短视频开启电商销售模式后,此种现象愈演
混合自由空间光-射频(Free Space Optical-Radio Frequency,FSO-RF)通信能够同时拥有FSO的超高信道容量、无需频谱许可、抗干扰能力强,以及RF的覆盖范围大、广播特性之优势,近年来受到广泛关注,并被认为是面向未来网络最具潜力的技术之一。为了进一步提高频谱效率,支持多用户共享时频资源的非正交多址接入(Non-Orthogonal Multiple Access,N
人工智能在自然语言处理、知识表示、自动推理、机器学习等方向上的长期发展使其具备了知识采集、整理、传输、存储、分析、呈现和应用上的天然优势。人工智能与教育的结合,能够解决教育资源在时间和空间上的分配不均,以其在知识记忆、复述和再现上的优势减少教与学双方的低层次教学投入。此外,人工智能采用机器学习的方法,辅助教与学双方对学习过程信息的理解,这既有利于教育工作者提升教学设计质量,也有利于学习者提高学习效
利用我国33个大中小城市2005—2018年的面板数据,从房地产投资、房地产消费、房地产开发企业规模3个方面选取11个指标,采用熵值法计算得到房地产经济综合指标,并构建静态与动态面板模型,探究人口流动对房地产经济的影响机制。实证结果表明:静态面板模型与动态面板模型回归结果均显示,全国层面人口流动对房地产经济发展具有显著的正向影响;静态面板回归结果显示,人口流入较快地区的房地产经济水平提高显著,而人
在信号处理领域中,压缩感知(Compressed Sensing,CS)作为一种新的信号处理框架,与传统的奈奎斯特(Nyquist)采样相比,仅需要较低的采样率就能还原出成原始信号。CS的提出不仅解决了传统采样中压缩与采样分开进行的问题,还极大地减少了信息的采样频率、信息存储以及传输代价的需求。CS理论表示对可压缩或者具有稀疏性的信号,可以通过一定条件下的观测矩阵映射到低维空间上,最后通过优化算法
人们的内心情感往往通过面部表情直观地体现出来,面部表情是人类进行情感交互的一种重要方式。在日常生活中,可以通过肉眼轻易观察到的表情称为宏表情,其持续时间在0.5秒到4秒之间。宏表情的发生可以被人类自主控制用以掩饰内心真实情感,在一定程度上具有欺骗性。然而,人们在掩饰真实情感过程中,难以避免地会在瞬间泄露出无意识的面部表情,将这种十分短暂、微弱的面部表情称为微表情。微表情作为一种自发式的情感表达方式
随着无线通信基础设施和服务需求的不断增长,通信业务也逐渐从单一化的语音形式转变为多样化的图像、数据、视频等多种形式。然而,有限的射频(Radio Frequency,RF)频谱资源很难满足人们对带宽日益增长的需求。另一方面,自由空间光(Free Space Optical,FSO)通信作为短距离高速率传输数据的有效手段获得了广泛的研究关注,因为与传统的RF通信相比,它具有高带宽、大容量、高安全性、
自适应滤波器因其能够根据不同类型的输入信号自适应调整系统参数,输出期望的滤波结果而被广泛应用在自动控制、生物医学检测、雷达系统等实际工程领域。从实际应用方面出发,系统所处的噪声环境并不满足单一的高斯统计特性,而是非高斯噪声环境居多。所以在算法设计过程中仍主要以非高斯噪声为背景建模。基于变量之间的相似性度量方法为确定数据系统与学习模型之间的关系提供基础。二阶误差准则的相似性度量在应对高斯环境时具有良
神经网络在诸多应用领域展现出了优异的性能,这很大程度上依赖过度参数化的模型结构,以及各类数据增强技术提供的数据量保证。在此发展趋势下,神经网络的损失表面愈加复杂,仅通过最小化训练损失已经无法保证模型的泛化性能。对神经网络的泛化误差与收敛点特性展开研究,设计更高效的性能提升算法尤为重要。统计学习理论通过假设空间与样本数量构建泛化误差上界,虽然无法完整解释神经网络的泛化性能,但此类理论具备重要的指导意