【摘 要】
:
经过数十年信息技术的发展,当今社会早已经迈进大数据时代。从个体层面来看,现如今我们每个人都无时无刻不在接触各种类型的媒体数据,比方说音频、短讯、图片、视频等;从整体层面来看,当今社会上每天产生的数据量已经超过了旧社会几千年数据量的总和;不仅如此,数据本身也变的越来越复杂,数据的特征维度正迅速增加,数据产生时也往往包含了多种模态。对数据的处理越来越离不开机器学习技术的进步。数据检索一直都是计算机科学
论文部分内容阅读
经过数十年信息技术的发展,当今社会早已经迈进大数据时代。从个体层面来看,现如今我们每个人都无时无刻不在接触各种类型的媒体数据,比方说音频、短讯、图片、视频等;从整体层面来看,当今社会上每天产生的数据量已经超过了旧社会几千年数据量的总和;不仅如此,数据本身也变的越来越复杂,数据的特征维度正迅速增加,数据产生时也往往包含了多种模态。对数据的处理越来越离不开机器学习技术的进步。数据检索一直都是计算机科学范畴的研讨热点。在经典的数据检索任务中,最近邻检索是常被使用的一种办法;然而到了大数据时代,随着数据的存储和检索方面的挑战有增无已,想实现数据的最近邻检索已经不现实。与此同时,由于机器学习方面的进展迅速,特别是以哈希方法为代表的近似近邻检索技术的出现,为人类在大数据时代进行信息检索提供了一种高效的工具。与传统的拿数据特征来直接计算数据相关性的方式不同,哈希方法会把高维数据映射为紧凑的二进制哈希码来表示,同时保持数据之间的相似关系及语义信息;利用哈希码之间的海明距离来表示相似性,可以提升检索的速度;同时用保存哈希码代替原数据也大大节省了所需的存储空间。当今越来越多的数据以多模态的形式出现,这使得实现数据不同模态之间的检索拥有更广阔的应用前景,比如新闻短讯检索音频视频,音频检索相似文本等,跨模态方法应运而生。与单模态的方法相比,跨模态哈希方法在保持数据相似性时,不仅要考虑模态内数据关系,数据模态之间的关系也要考虑。随着对这些方面的研究,近来很多新方法被提出来,然而其中一些问题仍然需要考虑。在保持数据之间的关系时,很多方法拿哈希码来保持相似性,但是由于哈希码的离散约束,这是一个难优化问题;为此有的方法松弛哈希码的二进制约束使得目标函数更易优化,但却会使得量化误差增加,造成方法的效果下降;有的方法把生成哈希码和学习哈希函数分开来完成;也有一些方法提出了较复杂的离散的优化策略,或者复杂的目标函数,这会使得方法的训练效率降低。好的哈希方法应该保持好数据关系的同时尽量避免过大的量化误差,同时其优化过程要高效,便于求解及应用。既然直接由哈希码来保持数据相似性时,有这么多问题难以解决,我们思考能不能学习一个变量来代替哈希码完成以上工作,同时保持其与哈希码的联系,便于统一生成最终的哈希码和哈希码函数。基于此考虑,我们提出一个新的跨模态检索方法--中间态相似性保持哈希。首先,该方法为数据的每个模态引入一个中间态表示,并利用中间态来保持相似性,然后学习转换矩阵把中间态映射成对应的哈希码。通过这样的方式,该方法可以把哈希码和哈希函数的学习过程统一起来,并且不会松弛二进制离散约束,从而能减小量化损失;在本文中,我们也提出了一个优化算法能快速优化目标函数,直接得到所有位哈希码。同时我们在Wiki,MIRFlickr-25k,NUS-WIDE三个数据集上验证该方法的性能,并和其他最新跨模态方法比较,结果证明了该方法的有效性。
其他文献
结肠癌(Colon cancer,CRC)是发生于结肠部位的消化道恶性肿瘤,发病率居胃肠道肿瘤的第三位。近年来,结肠癌的发病率与病死率在我国呈上升的趋势,已达到并超过了西方发达国家
吉林南部地区位于华北板块东北缘中朝准地台区,新元古界地层发育连续、分布广泛。近年来针对本地区新元古代沉积事件的研究取得很多认识,但是缺乏对新元古界沉积环境演化的研
近几年迎来信息爆炸的时代,互联网、电子商务、云计算及移动社交媒体等信息技术的迅速发展使得数据的数量和规模急剧增加,多类型大规模的数据对数据的处理速度及存储能力方面都有更高的需求,不仅要在可接受时间内处理大规模数据,同时数据的存储容量也要限制在可承受范围内,这对于当前大规模多模态数据的检索仍然是一个挑战。为了解决高维大规模数据的近似最近邻检索问题,基于哈希的近似最近邻检索方法应运而生,哈希方法将原始
在计算机图形学领域,精确的描绘材质和光源两者交互作用的结果,或者是让渲染结果看起来更真实一点,是研究人员追求一个传统而核心的话题。所以对材质表观精确而高效的建模,是领域人士想要努力达成的目标。本文选择从深度学习出发,构建一个神经网络并使用大量数据,代替需要足够先验知识才能完成建模的昂贵机器,完成对未知的空间变化情况下,平面材质的外观建模。本文用空间变化的表面函数表示,即SVBRDF(Spatial
目的:冻结步态是帕金森病常见的、致残的步态障碍。其定义为在打算行走时出现前进脚步短暂的、偶发的缺乏或明显减少,易导致跌倒、外伤、抑郁,严重影响患者的生活质量和社会
半航空电磁探测兼顾航空电磁法的效率与地面电磁法的精度,并且随着无人机技术的成熟,被广泛应用于石油、金属矿、地质结构勘探等领域。现有以工控机加采集卡组合形式的收录系
目的:分析代谢综合征患者(metabolic syndrome,MetS)血清生长分化因子-15(growth differentiation factor 15,GDF-15)的表达情况,并探讨GDF-15与炎症、血脂的相关性。方法:参
本文对张广才岭晚古生代福兴屯组进行了岩相学、锆石LA-ICP-MS U-Pb年代学和岩石地球化学研究。对福兴屯组的沉积时限进行了重新厘定,并对其进行了物源分析和构造背景判别,为
目的:初步探讨奥拉米特(Orazamide)对异烟肼(isoniazid,INH)联合利福平(rifampicin,RFP)所致药物性肝损伤的治疗作用及其可能机制。方法:选取60只SPF级雄性KM小鼠,体重20~22g
渲染是计算机图形学(CG)领域的一个重要分支,其主要研究的内容就是如何在一个三维场景下计算生成一张二维图片。渲染被应用于许多行业:动画,游戏,教育,航天,三维打印等等。衡量渲染算法优劣的指标包括精确度,速度。光学是物理学的一个重要分支,基于物理的渲染方式遵循自然界的光线传递反射规律,如能量守恒,能量非负,透射散射规律,所以渲染出来的图片质量比传统渲染模型更高,更加具有真实感。物理渲染所研究的核心内