【摘 要】
:
由于多媒体技术迅猛的发展,产生了越来越多的图像数据,所以就需要有新的技术去管理这些数量巨大的图像数据集。场景分类作为一种图像理解和管理的有效方法正成为热门的研究领域。为了提高图像场景分类的效率,本文将视觉注意机制融入到图像的场景分类算法中,由此可以得到本文的主要工作如下:(1)针对传统的基于背景的显著性检测算法无法精确的选择出背景种子点从而导致显著性检测的结果不够精确的问题,提出了一种基于背景种子
论文部分内容阅读
由于多媒体技术迅猛的发展,产生了越来越多的图像数据,所以就需要有新的技术去管理这些数量巨大的图像数据集。场景分类作为一种图像理解和管理的有效方法正成为热门的研究领域。为了提高图像场景分类的效率,本文将视觉注意机制融入到图像的场景分类算法中,由此可以得到本文的主要工作如下:(1)针对传统的基于背景的显著性检测算法无法精确的选择出背景种子点从而导致显著性检测的结果不够精确的问题,提出了一种基于背景种子点的图像视觉显著性检测算法。该算法首先对图像进行加权中值滤波、SLIC超像素分割、Canny边缘检测的预处理,然后采用一种最小能量损耗路径的算法找出更多且精确的属于背景的种子点,最后基于背景种子点采用流型排序算法得到图像的显著图。实验结果表明,该算法可以很好的提高显著性检测区域的完整性、精确性。(2)针对传统的基于视觉词袋的图像场景分类算法没有对图像前后景进行区分从而导致分类精度不够的问题,提出了一种基于显著性检测和视觉词袋的图像场景分类算法。该算法首先对图像提取SURF(加速稳健)局部特征,然后采用(1)中的方法计算各个特征点的视觉显著性值,接着将提取的特征和视觉显著性值融合来达到对图像前后景区分的目的,再采用一种分层的聚类算法得到视觉词典,最后将输入图像表示成基于视觉词典的直方图,构建二叉树结构的SVM多分类器用于场景的分类。实验结果表明,本章提出的改进的视觉词袋模型比传统的视觉词袋模型平均分类精度提高了10%。(3)针对图像的背景信息对深度网络分类精度以及训练成本的影响问题,提出了一种基于显著性检测和深度学习的图像场景分类算法。该算法首先对输入图像进行(1)中的算法得到图像的显著性检测的结果,然后基于显著性检测的结果再对原彩色图像进行前景分割后得到前景图,这样就去除了背景信息对网络模型的影响。接着采用了一种多尺度的残差神经网络用于前景图的特征选择,基于选择的特征采用Softmax分类器完成最终的场景分类任务。实验结果表明,本章提出的方法相对于传统的卷积神经网络可以使分类精度提高约2%左右。
其他文献
治疗性侧方淋巴清扫临床意义分析目的评估新辅助放化疗后直肠MR提示髂血管周淋巴结肿大(淋巴结短径大于10mm)的腹膜返折之下的进展期直肠癌行治疗性侧方淋巴结清扫的临床价值
随着互联网技术的进步与发展,作品的来源不再局限于作家的创作,作品的传播方式也不再局限于传统纸质卷的传递。在新背景下,作品内容的产生和传播借助“信息的接收者“和“信息的传播平台”,即用户与网络平台,变得愈加容易和普遍。经实践证明,这两种方式已经成为现代人们获取知识行之有效的重要方式。根据中国互联网络信息中心(CNNIC)2019年2月28日在北京发布第43次《中国互联网络发展状况统计报告》1显示,截
近年来我国高速铁路发展迅速,相比于航空、公路、水路等运输方式,高速铁路具备运量大、安全性高、乘坐舒适、准点率高等优势,在中等距离运输上拥有较强的竞争力,是我国综合交通运输体系的核心。随着高铁线路的增多,路网规模的增大,恶劣天气、设备故障以及人为因素等系统干扰逐渐增多,使得列车运行状态异常,进而偏离既定的运行计划导致列车晚点。面对系统扰动的影响,调度员根据历史经验以及现场情况按照技术规范实时调整运行
股票市场作为最重要的资本市场之一,它的表现不仅影响着政府、机构,同时也影响着每一个投资者,因此对于股票收益率影响因素的研究可以说是最热门的研究领域,无数学者投入其中。最为经典的当属CAPM模型[1],该模型认为在均衡市场环境下,系统性风险是影响股票收益率的唯一因素,尽管CAPM模型作为股票收益率影响因素研究的开山之作,具有非常巨大的理论意义,但是其实证效果却难以令人满意。之后,Fama和Frenc
复合轧辊兼具两种金属材料的力学性能优点,既能满足轧机对辊身工作层耐磨性、抗热疲劳和抗氧化等性能的要求,又能保证对辊芯韧性的要求,是轧辊的主要发展方向。本论文涉及的
瑞利-泰勒不稳定性(Rayleigh-Taylor instability,RTI)广泛存在于天体物理、地球物理以及工程界。由于涉及复杂界面动力学、拓扑变化以及时空尺度的跨越性,人们对其后期演化
利用特殊浸润性的表面控制退浸润过程中液体的空间分布和几何形状,从而制备大面积结构长程有序、尺寸图案可控的微纳米结构阵列,对基于液相可加工的有机光电器件应用研究至关重要。可控的微纳米结构图案化制备和加工主要受限于固体不可控的液体运输过程。基于这一背景,我们将特殊浸润性的界面应用于有机半导体纳米材料的图案化制备,即对硅柱表面微结构进行化学修饰,调控液体的退浸润过程,控制毛细液桥形成,从而实现对有机半导
随着互联网技术的迅猛发展,网络对大学生学习、生活和交往的影响日益加重,网络文化与校园文化的碰撞产生了一种新兴的校园网络文化。校园网络文化衍生于校园文化,同时又有别于校园文化,具有其自身独特的内涵。校园网络文化的发展,为大学生思想政治教育提出了重要课题。本文在研究校园网络文化的内涵、特征、功能,把握校园网络文化与大学生思想政治教育关系的基础上,分析校园网络文化视域下大学生思想政治教育面临的机遇和挑战
冬小麦是我国重要的粮食作物,土壤颗粒有机碳(Particulate organic carbon,POC)作为土壤肥力的决定因素之一,可以影响农田土壤质量,近而影响冬小麦作物产量,实现其准确、快速
自然语言处理是人工智能的一个重要分支,近年来,深度学习与自然语言处理的结合为该领域带来一个新的突破口,然而,深度学习中神经网络模型的确定依赖的基本要素是训练集数据质量。近年来,“数据不足”的问题时常发生,针对该问题,“数据增强”应用而生。数据增强是利用现有训练数据通过一定的方法扩充数据,从而增强分类器的准确性、鲁棒性。关于数据增强的研究主要分为“图像增强”与“文本数据增强”,关于“图像增强”的方法