【摘 要】
:
随着互联网的出现,网络上的海量数据在数据规模和特征维度两方面都快速增长。如何挖掘数据之间的关联性并从大量数据中寻找相似信息是一个极具挑战性的问题。哈希散列方法通过快速查找近似邻近数据而非精准邻近结果成为相似度搜索主要技术,并逐渐成为解决大规模数据检索问题的重要技术手段。哈希检索技术可划分成两类,即单模态哈希检索和跨模态哈希检索。单模态哈希检索旨在面向单一模态数据(如图像)利用相似性度量手段寻找距离
论文部分内容阅读
随着互联网的出现,网络上的海量数据在数据规模和特征维度两方面都快速增长。如何挖掘数据之间的关联性并从大量数据中寻找相似信息是一个极具挑战性的问题。哈希散列方法通过快速查找近似邻近数据而非精准邻近结果成为相似度搜索主要技术,并逐渐成为解决大规模数据检索问题的重要技术手段。哈希检索技术可划分成两类,即单模态哈希检索和跨模态哈希检索。单模态哈希检索旨在面向单一模态数据(如图像)利用相似性度量手段寻找距离相近的数据并返回检索结果。跨模态哈希检索旨在面向多类型模态数据挖掘不同空间下的数据内在异构相似性,从而允许使用某一模态数据(如图像)查询其他模态的邻近数据(如文本),为用户提供多样化的检索结果。本文针对上述两类哈希检索技术从相似度度量、损失函数、离散学习、外样本学习等多个方面深入研究并探讨如何设计高效的哈希检索算法,主要工作包含如下内容:针对传统基于图学习的哈希方法难以有效进行特征选择的问题,提出一种无监督型稀疏图自适应学习的单模态哈希检索方法。利用聚类方法构造描述数据相似性的拉普拉斯图模型,并使用重加权1范数对图模型进行稀疏约束,从而自适应选择稀疏和判别性的流形结构特征用于数据的相似性度量;然后,使用线性回归方法将流形结构特征量化为紧凑的二进制代码。实验结果验证了该方法在特征学习方面的优势。针对子空间学习缺乏语义判别性的问题,提出一种监督型离散语义矩阵分解的跨模态哈希检索方法。首先将标签信息嵌入协同矩阵分解模型,获得具有语义判别性的异构数据协同子空间;然后,将协同矩阵分解模型转化为离散学习模型,获得紧凑的二进制代码,同时学习相应的哈希函数;最后,采用一种交替迭代的逐位求解方法,有效地优化目标函数的离散解。所提出的方法在多个公开数据集上均能获得更高的检索精度。针对哈希代码的异构语义学习和离散优化难点,提出一种监督型可扩展判别性离散学习的跨模态哈希检索方法。通过在正交且平衡的协同矩阵分解获得异构数据的二进制表示,充分挖掘不同模态数据的局部流形结构和异构相似性;然后,利用回归模型将标签的类内相似性和类间差异性信息嵌入哈希代码。区别于传统哈希方法逐位优化离散代码,该方法直接学习哈希代码的全部编码位,大幅提升了离散优化效率。最后,通过理论推导和实验结果验证了该方法在异构特征学习和离散优化速度方面的优异性。基于协同子空间学习的哈希方法通常忽略了不同模态数据的内在特性。为了克服这一问题,提出一种监督型联合特性和一致性学习的跨模态哈希检索方法。通过正交且平衡的矩阵分解学习每种模态数据的特定表示,以充分保持模态内相似性;其次,引入一种非对称的距离-距离差异最小化学习模型,以有监督方式充分捕获多特定模态表示之间的模态间相似性;然后,通过联合标签信息和多个特定模态表示将异构数据的特定信息和一致信息嵌入汉明空间;最后,采用一种交替迭代的优化方法高效地求解目标函数,有效降低优化过程的计算时间和存储需求。实验结果表明,该方法在检索精准度和训练时间上均获得优异的性能。综上所述,本文系统地对两种类型的哈希检索技术进行研究,并从多个方面针对不同模态数据设计相应的哈希特征学习和检索方法。同时,本文在多个公开数据集上进行了大量的对比实验,充分验证了本文所提出的哈希检索方法的有效性和高效性。
其他文献
21世纪以来,随着嵌入式、摄像头、传感器技术的发展,推动了各类机器人、无人机、无人车的出现及应用。而无论是机器人的关节控制,还是无人机的位姿控制、又或者是无人车的路径规划,都需要对动态系统的状态进行估计。本文基于扩张状态观测器,对于非线性系统中存在干扰、时滞、丢包的问题,针对两类受到干扰的网络化非线性系统论述其状态估计:(1)针对系统存在状态非线性不确定时滞、输出有界非线性时滞及输入信号缺失的问题
近年来,自动驾驶、自主无人机、智能机器人等行业得到飞速发展,在服务业、农业、医疗方面有了大量成熟的应用。定位技术是机器人完成相关任务中最基本的需求之一,主要有基于激光雷达和相机的方法。单一传感器已经不能满足实际应用场景的需求,把激光雷达与相机的优点结合,利用激光雷达与相机各自的优势可以实现精度更高、稳定性更强的定位方法。本文在基于稀疏直接法的DSO(Direct Sparse Odometry)算
科技的进步带来了不断提高的生产、生活需要,从而使得工程系统越来越复杂,出现了如航空发动机、车辆动力学、电力网络、电机等安全关键系统。这些系统十分重要,且倘若它们发生故障,将会极大损害社会的利益财产安全,轻则影响社会正常运作,重则可能造成重大的安全事故。故障检测方法能有效保障这些系统的安全运行,在实际生产中意义重大。本文将确定性学习理论与线性自适应观测器技术相结合,提出了一类非线性系统的故障诊断方法
由于市场的需求和自动化领域的迅猛发展,工业机器人的使用和进步在控制行业已经是不可避免的潮流。但是相对于国外的发展情况,我国在这方面有着不小的差距,主要是国外垄断着他们的完整的控制产业链,并且企业和机构研发的工业机器人控制系统都采用专用的控制器,使系统缺乏通用性、灵活性。这两个主要因素直接导致了我国工业机器人的提高举步维艰。所以,设计一种具有可重构性的、开放性的控制系统具有重大科研意义和广泛的市场价
近年来,各种突发事故和人类的破坏活动导致灾难频发,对全人类的生命安全造成了威胁,引起社会各界人士的广泛关注。RoboCup Rescue机器人仿真系统是一个先模拟发生地震或火灾等自然灾害的城市环境,再利用机器人在该场景中展开救援工作的系统。在该系统中,机器人需要完成抢救灾难中的伤者、扑灭可能发生的火灾等任务,其目的是减少灾难中的损失,提升救援的整体效果。RoboCup Rescue中机器人的行动策
随着车联网与人工智能的深度交融,越来越多的人工智能应用已经落地到车联网场景中,比如行人检测、疲劳监测、自动泊车等。在车联网的人工智能应用中,主要使用到了机器学习技术,而机器学习技术的应用就需要先进行模型的训练。在传统的机器学习模型训练方案中,模型训练一般都是在中心服务器上进行的。这就需要将大量的用户数据传输到中心服务器上,在服务器上进行数据处理与模型训练。虽然这种中心化的训练方式能有效提高机器学习
组件法是研究钢结构节点的重要方法,然而由于各个组件力学性能和组件间的相关关系不明确,目前的分析结果还无法应用于实际工程中。T型件是组件法中一个重要组件,理清T型件的受力过程对节点的力学性能分析有重要意义。几十年来,国内外学者对T型件进行了大量的试验与数值分析,对T型件撬力和弯矩进行深入的探讨,并建立了T型件的力学模型。然而对于节点或T型件的螺栓内力的研究往往集中在无加劲肋的情况下,带加劲肋节点或T
在如今的社会生活中,人们的出行需求日渐增长,有限的车辆资源难以支撑当前迅速增长的出行需求,这种供需矛盾在当下显得十分严重。特别是传统的打车情况和一人一车的服务模式,严重地加剧了供需冲突。在大规模的城市交通数据中,拼车不仅可以减少城市车辆,而且符合节能减排的号召。合理的调度算法能够为城市出租车调度提供可靠的决策依据,辅助城市共享自动驾驶出租车运营。本文基于大规模城市出行中自动驾驶出租车的共享调度,提
二维单人姿态估计是整个人体姿态估计领域的基础和重点。目前,二维单人姿态估计算法都是基于全卷积神经网络实现,并能够克服背景嘈杂、人体形态各异、服装差异等难点。然而,现有二维单人姿态估计算法的计算复杂度非常高,无法在普通台式机、树莓派等计算能力有限的设备上实时运行。这极大限制了人体姿态估计的应用价值。因此,对二维单人姿态估计算法有效轻量化,在不同硬件平台上实时准确地运行,以具体运用于实际场景,是一项具
农村是我国发展历程中的重要一环,农村地区发展的不充分,是制约我国城乡协调发展的重要因素。自从进入新时代以来,在党中央的领导下,我国的农村面貌已经发生了巨大的变化。党中央着力解决城乡发展不平衡不充分的问题,满足人民对的美好生活的向往;十九大提出的乡村振兴战略,是要实现乡村的全面振兴,是要实现乡村繁荣昌盛。2018年的两会,习总书记强调“乡村振兴首要的是实现产业振兴”;产业是乡村振兴的基础和保障,只有