【摘 要】
:
随着数字信息的迅猛发展,各种网络平台和社交软件的数据库存储着上百亿幅图像,如何在海量图像中搜索到目标图像是图像检索任务的关键。近年来,基于内容的图像检索方法已成为该领域的研究热点,而特征匹配是其关键环节。随着深度学习的快速发展,基于颜色、纹理、形状等图像底层特征的传统方法具有一定的局限性,与之相比基于深度学习的方法能够获得更为丰富的特征信息,但受不同局部区域高相似性描述子影响,误匹配问题降低了图像
论文部分内容阅读
随着数字信息的迅猛发展,各种网络平台和社交软件的数据库存储着上百亿幅图像,如何在海量图像中搜索到目标图像是图像检索任务的关键。近年来,基于内容的图像检索方法已成为该领域的研究热点,而特征匹配是其关键环节。随着深度学习的快速发展,基于颜色、纹理、形状等图像底层特征的传统方法具有一定的局限性,与之相比基于深度学习的方法能够获得更为丰富的特征信息,但受不同局部区域高相似性描述子影响,误匹配问题降低了图像检索精度。因此,如何准确并快速的获得图像检索结果成为解决上述问题的关键,主要工作如下:(1)通过语义分割网络获得每个卷积层的可视化特征图,针对最后一个卷积层具有更强空间信息和语义信息的特点,利用梯度得分获得特征图中每个通道的权重,通过线性融合的方式,在通道维度上加权求和并归一化,利用双线性插值获得最终的热力图。(2)提出基于注意力的深度局部特征提取模型,该模型使用残差网络提取密集局部特征,通过注意力网络生成特征的注意力得分,筛选与检索对象相关的特征点,采用主成分分析方法得到深度特征描述子。(3)利用语义分割网络所获得的类别信息和热力值信息构造多维度复合热力特征描述子,给出针对这类特征描述子的K-Dimensional树结构,基于该结构结合Best Bin First(BBF)和随机抽样一致算法实现特征匹配。在Oxford5K和Paris6K数据集上进行实验,实验结果表明,该方法能够较好地避免不同区域高相似性描述子所导致的误匹配问题,相较于Deep Local Features(DELF)和D2-Net算法,在查准率以及时间效率上都有所提高,与Fine-tuning CNN、DAME WEB等方法相比检索精度提高近2%,实验结果验证了该方法的有效性。该论文有图37幅,表9个,参考文献70篇。
其他文献
分类树由机器可解释的语义组成,为许多web应用程序提供了有价值的知识。分类树已被广泛应用于各个领域,特别在电子商务领域中起着至关重要的作用,用于推荐、浏览和查询理解。例如,在线零售商(如亚马逊)使用分类树进行产品推荐,而网络搜索引擎(如百度)利用分类树来增强查询理解。由于手工构建分类树需要付出巨大的人力代价,并且在构建过程中存在较多主观的因素,因此分类树的质量参差不齐。同时,随着web内容量的快速
光流估计是计算机视觉的核心问题之一,在行为识别、视频编辑、自动驾驶等方面都有着广泛的应用。光流表征着三维空间中运动对象在投影面上像素位移的瞬时状态。传统光流估计方法以变分法为基础,但这类方法的准确率与实时性较低。近年来,基于深度学习的光流估计方法凭借实时性高、结果精确等优点,已成为光流研究领域的主要研究热点。目前,现有基于深度学习的方法缺少视频帧间相关度的分析与利用,为此提出一种基于视频帧间相关度
《义务教育语文课程标准(2022年版)》提出了跨学科学习任务群,要求教师引导学生在语文实践活动中,联结课堂内外,使学生获得全面发展。本研究通过设计新型教学实验课,让学生自主进行课题研究,培养其综合运用多学科知识发现、分析、解决问题以及运用语言文字的能力,并通过问卷调查法和访谈法收集学生能力发展情况及自我同一性建立情况,证明学生通过跨学科学习可以有效提高记忆留存度、提高元认知策略发展及学生学习意愿。
卡通是一种流行的艺术形式,日常生活用于数字娱乐、游戏甚至是在人们的社交账户简介中使用。现代卡通动画工作允许艺术家使用各种来源来创作内容。现实中许多著名的作品是通过将真实世界的照片转化为可用的卡通场景材料而创作的,这一过程被称为图像卡通化。目前基于深度学习的图像卡通风格化方法因计算量过大、执行效率低而无法在实际应用中得到广泛推广。另外卡通图片是将真实世界的照片进行高度简化和抽象,这与其他形式的艺术作
基于深度学习的单图像超分辨率重建方法已经比较完善,重建图像具有较高的客观评价值或具有较好的视觉效果,例如ESRGAN能够还原出符合人眼视觉效果的图像,但是重建过程中虚构出部分高频信息,使得客观评价指标较低。ESPCN重建图像使用亚像素卷积层对高分辨率信息进行恢复,更符合峰值信噪比和结构相似性的评价,具有较高的客观评价指标值,但是高频信息和低频信息的区分度、融合处理不够合理,整体细节较为模糊,视觉感
近年来,随着GPS定位和移动网络技术的不断发展以及智能设备的普及和应用,出现了大量包含位置信息和文本信息的空间-文本对象,使得基于位置的服务(Location Based Service,LBS)得到了广泛应用。带有位置和文本信息的空间-文本数据的规模迅速增长,以空间-文本数据为背景的空间关键字查询技术是基于位置服务系统的重要支撑技术,使得其成为空间数据库和信息检索领域的研究热点。集合空间关键字查
推荐系统是解决信息过载问题的关键技术,推荐的重点在于预测用户偏好和拓宽用户视野。现有的推荐方法主要利用直接反映用户偏好的显式反馈信息或间接反映用户偏好的隐式反馈信息进行推荐。然而,显式反馈的推荐模型,一般无法考虑用户对打分机制的宽容度差异,在一定程度上会造成数据误差,从而影响推荐结果。因此研究者开始利用隐式反馈信息,但是在使用隐式反馈时,经常忽略那些用户不浏览或不点击的隐式负反馈数据,这类数据信息
到目前为止,我国已经建成全世界最大的视频监控系统,每天都会产生大量的视频数据,仅仅依靠人工方法对这些数据进行分析的效率会非常低。行人重识别技术是一项可以在跨场景跨摄像头的情形下,在大量的视频序列或图像中寻找到特定行人的技术,已经在公共安全、智慧安防等领域起着重要的作用。但是在现实场景中,由于存在着遮挡、低分辨率以及光照等因素影响,无法提取到具有鲁棒性的行人特征,导致出现行人重识别率低的情况。针对目