面向高维特征空间的显著性传播算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ljl640211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息科学技术的发展,越来越多的数字化设备被应用于工作和生活中来记录和传播信息,进而使得照片和视频资源呈现几何级数的增长。如何快速从海量的视觉媒体信息中筛选出有效的信息成了视觉信息处理领域的热点课题。视觉显著性检测尝试模拟人类的视觉机理,自动检测和定位人类感兴趣的图像和视频区域,为快速处理视觉数据提供了可能。本文在深入分析国内外显著性检测研究成果之后,发现现有模型在复杂场景下的表现不尽如人意,例如背景中重复出现的鲜艳小结构容易被检测为前景目标,显著物体拥有多种特征区域时只有部分区域被检测出来,背景物体比前景物体颜色更加鲜艳时容易把背景检测成前景,前背景相似时导致前背景边界不清晰。面对以上复杂场景,本文针对简单特征空间不足以反映像素差异和传播算法缺乏全局信息及背景先验不可靠的问题进行研究,主要的研究内容和创新点如下:1.构建了一个适合复杂场景的高维特征空间。针对现有算法简单使用颜色空间作为特征空间从而导致在复杂场景下难以区分不同超像素的细微差异的现象,本文提出建立一个高维特征空间,尝试使用更多的特征来描述超像素,包括CIELab颜色空间,颜色直方图,纹理空间,基于轮廓检测和似物性采样的物体完整性特征和基于深度卷积网络的高层语义信息。基于将显著物体的轮廓与内部完整地从背景中突出的目的,物体完整性特征充分利用了轮廓检测对于物体边界的界定作用和似物性采样对于物体的识别作用,将位于显著物体轮廓边缘的像素级的显著值传播到显著物体内部。基于深度卷积网络的高层语义信息是为了界定图像中哪一个物体是人类感兴趣的显著物体。2.改进了现有的传播模型。目前的传播模型缺乏全局信息以及对于背景先验知识的处理过于简单,直接将图像四周当作背景或者四条边筛选三条作为图像的背景又或者简单使用颜色对比来去除对比度高的像素,当显著物体触及多条边界或者图像相对杂乱时,算法性能较差。本文通过边界筛选,边界连接和引入汇点三方面来改进完善。边界筛选是为了将图像边界中可能属于前景的超像素剔除掉,为传播算法提供更准确的背景先验种子点;边界连接是将超像素与筛选过后的边界像素连接,为传播算法提供全局信息;引入汇点是为传播过程提供稳定的背景参考点。本文算法在七个公开的显著物体检测数据库进行实验,并且与十种经典和先进的算法进行定性和定量的分析。本文算法在准确率-召回率曲线,ROC曲线,F-measure曲线以及平均绝对误差MAE四个指标上与改进前的算法相比性能有着大幅度的提升,且将本文得到的高维特征空间应用于其他算法上,性能也有着显著的提升。
其他文献
随着存储着海量数据的分布式文件系统的进一步发展,为了满足各种企业、学术机构等组织对数据存取速度的需求,诞生了内存分布式文件系统这一概念。以开源的Alluxio为代表的内
智能手机等移动设备为访问信息和使用计算资源提供了极大的便利,但是,受限于自身的尺寸、大容量电池制造技术的滞后、无线通信网络不稳定等因素,使其越来越无法满足移动用户
近年来,云计算、IPTV和4K/8K高清电视等高速服务的快速发展进一步提高了对于接入网带宽的要求。目前在无源光网络(Passive Optical Network,PON)中,强度调制/直接检测(Intensity
随着DNA微阵列技术、高通量测序技术的不断延伸和迅猛发展,产生了许多的基因表达谱数据、分子相互作用数据、基因组数据。这些数据在研究基因突变、基因识别、基因分型和癌症
当下,计算机技术飞速发展,计算机并发体系结构已成为主流。为使并发体系结构的性能得到充分发挥,多线程编程思想应运而生。但是由于多线程程序运行的不确定性,导致编程人员在
随着汉语学习在世界范围内的推广,汉语教学的学科体系日渐成熟,教学理论日渐丰富,相关研究不断深入细化,课堂活动在汉语教学中的重要性也越来越多地被提及。针对课堂活动的调
作为物联网产业的核心技术,无线传感网络已被应用于生产生活的许多领域。无线传感网络往往被部署于复杂多变或干扰因素诸多的环境中,常会造成感知数据偏离实际,从而导致感知
随着计算机技术突飞猛进式的发展,不管是从硬件还是从软件上,都越来越能满足人们的需求。在计算机技术领域发展中,三维重建越来越成为机器视觉的研究重点,并在地图制图,建筑
近年来,随着多媒体技术飞速发展,越来越多的蒙古文古籍文献被扫描转化为数字图像,以便长久保存。这样做不仅有利于古籍文献的保存,同时也给相关研究人员提供了十分珍贵的研究
多标签分类问题一直是机器学习中的热点问题。在过去的研究中,人们解决该问题的关键在于如何建模标签之间的依赖关系,从而提升模型的性能。然而在本文中,笔者受到多视角学习