【摘 要】
:
快速准确的检索到用户查询的相似图像,一直是基于内容的图像检索技术追求的终极目标。这项技术也越来越频繁的出现在大家的生活中,如人脸门禁、人脸支付、搜索引擎的图像搜索等。图像检索也从开始使用文本的检索技术过渡到如今基于内容的图像检索技术。基于内容的检索技术也在经历了初级视觉特征、SIFT等经典手工特征之后,越来越多的使用效果更好的基于深度学习提取的图像特征。但随着图像库规模保持数量级的增长,近邻查询时
论文部分内容阅读
快速准确的检索到用户查询的相似图像,一直是基于内容的图像检索技术追求的终极目标。这项技术也越来越频繁的出现在大家的生活中,如人脸门禁、人脸支付、搜索引擎的图像搜索等。图像检索也从开始使用文本的检索技术过渡到如今基于内容的图像检索技术。基于内容的检索技术也在经历了初级视觉特征、SIFT等经典手工特征之后,越来越多的使用效果更好的基于深度学习提取的图像特征。但随着图像库规模保持数量级的增长,近邻查询时间效率较低的缺点逐渐显露。自然的近似近邻查询技术也被提出并越来越多的使用在图像检索系统中,其中哈希码由于占用存储空间小,检索速度快,成为了关注的焦点。近年来一些研究者将深度学习技术结合哈希技术提出了效果较好的深度哈希方法,这些基于深度哈希的方法也大幅度提高了图像哈希检索的精度。目前基于深度监督哈希的主流方法是利用二元组与三元组构建图像对之间的相似性关系进行训练,如利用二元组的方法DPSH和利用三元组的DTSH等,这些方法只将采样组中的一对或两对进行交互,一方面未能充分发挥监督信息,二也不能充分增大(减少)类间距离(类内距离)。针对上述方法的不足,本文研究了改进方案,并有效提升检索精度。本文的主要工作总结如下:1、提出了基于余弦相似度的多负例哈希算法,上述讲到现在许多基于二元组和三元组的方法只进行一对或两对图像的交互,不能充分利用标签监督信息。本文使用多负例的学习方法,使得每个元组中多对图像对进行交互,保证了标签监督信息的充分使用,更好保持了图像语义关系。在此基础上引入了类Softmax函数作为多图像对交互的损失函数,并采用余弦相似度作为图像间相似度衡量方法,使得网络收敛更加稳定。为了保持图像之间的特征距离,巧妙的在损失函数中加入间隔超参数,同时受益于余弦相似度的使用,间隔超参数的取值也更容易被确定,整体提升了图像哈希检索的精度。2、针对单标签数据集,在基于余弦相似度的基础上,为了进一步增大(减少)类间距离(类内距离),本文在损失函数中加入类中心损失项。在训练过程中,计算出训练集中每个类中心点,然后在后续的训练中对样本距本类类中心点大的加大惩罚,对距本类类中心点小的减小惩罚。这样更加充分利用标签监督信息,控制图像哈希码的类内距离和类间距离,进一步提升了图像哈希检索精度。最后本文选取经典网络结构Alexnet、Vgg16、Res Net50,并在公开数据集CIFAR-10、NUS-WISE、SVHN进行了大量的验证试验,通过对平均检索精度、精确率-召回曲线、Topk检索精度的对比分析,表明本文提出的算法在检索精度上有较大优势,同时实验分析了一些间隔超参数和多负例采样数目对试验结果的影响,最后对基于余弦相似度的多负例哈希给出了可视化的效果。
其他文献
本文以泰国汉语学习者为研究对象,以寻找泰国汉语学习者出现音段延长的词汇与该词汇的句中位置、音节数量、结构关系、词性的关系为目的,试图发现位于句子的哪个位置、音节数量为多少、何种结构关系、何种词性的词汇容易出现拖音现象,以期从中总结出一定的规律。研究聚焦于韵律三要素之中的音长问题,使用语音分析软件Audacity和Praat对中泰两国学生说汉语句子的发音进行录音、切分和语图分析,然后用数学软件Mat
论文在“互动语言学”视角下,采用会话分析、定量与定性分析的方法,通过《非正式会谈》考察二语者在自然口语中语气词的使用情况,并对二语者使用频次最高的“了”进行个案分析,考察其在形式连贯和人际互动方面的功能。在此基础上,进一步考察目前语气词的教学现状,并根据存在问题对语气词提出教学建议及教学设计。在考察二语者语气词使用情况时,首先对母语者和二语者的语气词使用频次进行统计,结果表明,与母语者一致,二语者
叹词是汉语母语者在交际互动中经常使用的一类词汇,在形式连贯和人际互动中都起到重要作用,但笔者通过数据统计与分析发现,二语学习者在叹词的使用上,不仅频率远低于母语者,其丰富程度和使用水平也较母语者有较大差距。本文检索自建多模态口语语料库,统计得到频率最高、情况最复杂的叹词“啊”、“哎”、“哎呀(哎哟)”,以它们为切入点探讨叹词互动功能,为二语学习者了解叹词互动功能、提升叹词使用能力和水平提出建议。笔
“2021中国东盟数字经济发展合作论坛”在湖北省武汉市召开。论坛以“共享数字新机遇,共商合作新未来”为主题,广泛邀请中国和东盟国家数字经济相关政府、企业、学界重量级嘉宾出席,推动中国东盟数字经济合作伙伴关系向更广范围、更深层次、更高水平方向发展。经验教训。综上所述,译者在此次口译实践中提出的案例较为典型,因此对提高口译译者在“2021中国东盟数字经济发展合作论坛”中担任口译员一职,承担实地调研、欢
中国自然资源丰富,历史底蕴深厚,独特的民族文化对入境外国游客产生了强大的吸引力,研究文化距离对我国旅游服务贸易出口的影响具有重要意义。利用定性分析法、比较分析法,运用较新的数据从出口规模、客源市场和发展新态势三方面描述中国旅游服务贸易出口发展概况。在此基础上利用2005-2019年中国入境游面板数据,基于霍夫斯泰德文化维度理论计算出随时间变化的文化距离变量,建立包含文化距离变量的旅游贸易引力模型,
近年来,随着我国经济进入新常态,区域经济发展呈现出新形势。我国南北方经济差距日益显著并呈扩大趋势,受到日益广泛的关注。在此背景下,清华大学国情研究院“国情讲坛”第49讲,《上市公司表现与我国南北方经济差异》具有重要意义。讲座主要内容为汤珂教授从上市公司这一微观角度对中国南北方经济差异进行分析。对本次讲座的翻译将有助于增强对中国区域经济发展差距的了解,因而具有较强的现实意义。本次口译实践报告基于笔者
《观察》创刊于1946年9月,停刊于1948年12月,是20世纪40年代中后期风行全国的社会时政类刊物。办刊理念不仅为期刊的发展明确方向、确定宗旨,而且也是期刊葆有固定读者群体的基础,其形成与塑造脱离不了特定时代背景下社会环境的深刻影响。同时,受办刊理念指导而形成的刊物内容,以及确定的作者群体,通过期刊这一传播载体,反向对外部环境输出其思想文化和价值主张,从而影响社会环境的改变与革新。《观察》的办
和谐管理模式是英国学者Spencer-Oatey提出的、通过语言管理人际关系的理论。该理论认为,人际和谐管理涉及三个相互关联的主要成分,即面子管理、社交权管理、交际目标管理;这三大成分可再分为七个小成分;对其中任何一个成分管理不当都会在交际中威胁到人际和谐。威胁人际和谐的话语可表现为公开威胁或隐蔽威胁。隐蔽威胁和谐的话语是交际者威胁人际和谐时表现为隐蔽威胁特征的话语。本文从《红楼梦》前80回中收集
“天下最美是广西,人爱唱歌鸟爱啼;三姐撒下山歌种,八桂处处是歌圩。”壮族,是一个“善歌”的少数民族。“歌圩”正是壮族山歌传承重要的自然载体,在当前全球非物质文化遗产保护的新生代语境下,向都霜降歌圩面临着同其他“非遗”一样“青黄不接”的危机。新媒体时代网络技术的革新,不仅改变了个人接触文化的方式,而且更改了各类传统文化的组织形态。据此,网络歌圩纷纷涌现,经研究发现,发展到当前多以微信群的形式存在。本
随着软件系统中的侧信道攻击(side channel attack)对用户的隐私信息构成越来越严重的威胁,如何检测软件中的侧信道泄漏成为安全软件开发的关键。近几年有多种检测技术被相继提出,分别是基于无干扰特性(non-interference property)验证的检测技术、基于安全信息流(secure information flow)的检测技术、基于自动化资源边界计算(automatic r