哈希学习方法及其应用研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:puzz777
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近邻查找是机器学习领域的一个基础问题,在数据挖掘、计算机视觉、信息检索等领域有着广泛的应用。然而,随着实际应用中数据爆炸式增加,各行各业都积累了大量的视频、图像、文本数据。大数据时代,传统的近邻查找技术面临着数据存储量大、检索成本高以及高维数据导致的维度灾难等问题。哈希学习通过将数据从原始空间映射到低维的二进制空间,保持数据在原始空间的近邻关系不变。因此,近邻查找问题可以在二进制空间存储和计算,显著的降低了数据存储开销、提高了查找效率。本文围绕哈希学习方法及其应用研究展开,有如下工作:(1)提出了局部约束离散图哈希方法:哈希学习的目标是保持数据在原始空间的近邻关系,将数据从原始空间映射到低维二进制空间,其本质是一个带约束的离散优化问题。现有的离散图哈希方法在放松约束处理上没有考虑哈希学习保持相似性的目标。因此,提出了一种局部约束离散图哈希方法,通过引入松弛变量来放松哈希码的有效性约束(位平衡和位不相关),以保持相似性为目标最小化约束损失。为了使得算法能平稳收敛,对松弛变量也进行了相似性保持。该方法与哈希学习保持相似性的目标是一致的。(2)提出了改进的哈希学习高效推荐方法:基于哈希的推荐方法通过采用二进制码来表示用户和项目,使得用户对项目的偏好能在二进制空间中计算,进而加快推荐效率。然而,现有的哈希推荐方法存在一个问题,哈希学习关注的是相似性保持,而推荐关注于建模用户对项目的偏好。因此,提出一种改进的哈希学习高效推荐方法。采用偏置项来表示用户和项目自身的偏好特点,通过去偏置将评分映射到相似性区间,以保持相似性为目标,提出了两种方式得到用户和项目的二进制码。该方法缓解了偏好与相似性之间存在的距离问题。(3)提出了基于贝叶斯聚类的文本语义哈希方法:哈希学习作为加速文本检索的方法,其通过低维的二进制表示使得相似的文档有相似的二进制码。然而,现存的文本语义哈希方法的时间复杂度为平方级,难以适用于大规模数据。因此,提出了一种基于贝叶斯聚类的语义哈希方法。通过朴素贝叶斯模型来抽取文档的语义信息进行二类聚类,并将二类聚类推广到r维来得到文档的r位二进制码。为了保证每一次聚类的有效性,对二进制码进行位平衡和位不相关约束。该方法样本时间复杂度为线性,语义抽取能获得高质量的哈希码。
其他文献
采用新型氧化还原引发体系,以丙烯酰胺(AM)和丙烯酸(AA)为单体进行水溶液自由基共聚合。合成了分子量高达2.014×107,水解度26.3%,过滤比13.5的超高分子量聚丙烯酰胺。并研究了pH值、引
本文利用柠檬黄、日落黄和胭脂红的吸收光谱差异,采用多元线性回归分光光度法同时测定食品中三组分。该方法省去了测定单组分时的萃取、柱层析等步骤,操作简单、方便、准确,
ZPW-2000A型无绝缘移频轨道电路对铁路扩能、提速、提效起着非常重要的作用,是一种具有国际先进水平的新型自动闭塞,在感受它技术先进、性能优越等特点的同时,在日常使用、维
《国务院办公厅关于强化学校体育促进学生身心健康全面发展的意见》明确指出加强学校体育改革工作,不仅要关注课内体育教学,还要充实课外体育活动、校园竞赛、运动训练等一系列内容,要构建学校常态化课外体育活动和体育竞赛体系,保证每学年至少开展一次综合性校园运动会。丰富校园体育竞赛内容和形式,培养青少年学生参与体育活动的兴趣爱好,激发参与主动参与体育锻炼的内外在动机,提高青少年学生对体育促进健康生活的认知水平
介绍了纳米α-Fe2O3的特性,综述了纳米α-Fe2O3的主要制备方法。其中包括:沉淀法、溶胶-凝胶法、强迫水解法、胶体化学法、微乳液法、水热法等。详细介绍了各种制备方法的特
固定床氧化锌脱硫是目前燃料电池重整系统普遍采用的脱硫工艺。针对氧化锌脱除H2S的固定床反应体系,采用微分方程递推的方法建立脱硫反应的数学模型,计算了不同反应温度、空
通过区域地质背景、成矿控制地质特征、成矿规律和成矿成因,系统的研究西秦岭贡北金矿区少有的灰质砾岩、砂岩型金矿床。对矿区西部及南部的远景预测和找矿靶区的定位。初步
老子道德经里谈到:五色令人目盲,驰骋田猎令人心发狂,难得之货,令人行妨,五味使人之口爽,五音使人之耳聋。是以圣人之治也,为腹不为目,故此彼取此。意思是:五颜六色使人目眩,驰骋田猎使
利用复合抛物面与自由曲面相结合的方法,设计出一款体积小、能效高的LED光源准直配光透镜。将LED光源发出的光线分两部分分别进行配光设计。光源发出的一部分发散角为0o~20o
语文课堂教学整体优化以协同学的基本原理为其方法论基础,按照最优化的标准,着眼于全体学生的全面发展,根据语文教学的学科体系和特点,对课堂教学诸要素进行最佳组合,强调课