基于重构的自底向上视觉注意模型研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ahcyw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
每秒钟大约有10~8阶比特数据流进入人眼,远超过大脑能全部处理和吸收的信息量。面对如此大量与复杂的视觉输入,人类视觉系统仍能够有效地获取场景重要内容,来增加对外部世界的了解。这主要是因为选择性视觉注意机制的存在。对于视觉注意的研究一方面可以揭示出更多人类视觉系统内在的工作机理;另一方面,随着互联网和多媒体技术的飞速发展,视觉注意建模能够为大数据的分析与处理提供可行的解决方案。研究发现重构信号与实际输入之间的感知差将驱动视觉显著性。因此,基于中心–周围对比度的显著性假设,本文将从重构的角度衡量中心–周围对比度,来对基于重构自底向上的视觉注意模型进行研究。本文的主要创新点包括以下几个方面:第一,提出一种基于线性稀疏重构的显著性估计模型。之前的模型通常致力于寻找和选择有效的显著性特征。但是,通常很难找到一组适用于不同场景的特征。为了处理更加多样化的视觉输入,越来越多类型的特征被整合到模型中,来从不同角度突出显著性。相比之下,本文将以探索中心–周围对比度的计算机制为出发点,提出用非局部周围图像块来对中心图像块进行线性稀疏重构,并用重构残差来反应中心与周围的差异程度,进而表示显著性。通过重构残差的计算,周围与中心的相似成分将被去除,因而可以自适应地突出不同情况下的差异性。在公共数据库上的实验中,作为纯数据驱动的模型,该算法可以胜过基于人类眼动数据学习的模型。第二,提出一种基于深层自动编码器的显著性估计模型。对于之前基于重构的显著性模型,每个区域重构参数的计算是彼此独立的,没有考虑不同区域在全局的竞争关系。另外,现有的重构过程往往是线性的,而研究表明即使在最早的阶段,视觉处理的本质角色仍是非线性计算;同时,在计算方面,非线性模型具有更强的表示能力,来处理更多类型场景的显著性。针对这些问题,本文将首先构建一个基于深层自动编码器的网络来形成由周围块到中心块的非线性推断,再通过从全局均匀采样训练样本来训练当前场景对应的中心–周围重构参数。最后,每个点的显著性将由网络重构残差表示。通过将全局采样中的竞争关系引入重构模式的学习,重构网络将偏向于重复冗余区域的表示,而突出全局罕见区域。在实验中,可视化结果表明,对于不同的视觉输入,网络的中心层能够自适应地形成不同特征。此外,多个公共数据库上的综合比较也能展示出该模型的优势。第三,提出一种基于背景建模的立体显著性估计模型。研究表明深度信息是人类视觉系统一个基本属性并且有助于视觉注意。基于此,立体显著性模型被提出,来利用深度信息补足之前基于二维输入的显著性估计结果。但是,对于深度信息的使用以及与其他线索的整合通常较为简单。受之前立体环境下视觉注意实验研究的启发,本文将首先利用深度信息来建模背景区域。在此基础上,再通过从背景区域采样来训练基于自动编码器的中心–周围重构网络,并用该网络残差表示立体显著性。通过强调背景的学习,该模型将能够更好地区分背景与显著性区域,从而产生更低的虚警率。实验结果表明该算法能超过基于后处理整合深度信息的立体显著性模型,并展现出有效的原型目标检测能力。第四,提出一种基于深层自动编码器的视觉扫视路径预测模型。目前关于视觉注意计算的研究通常都集中在静态显著性图的生成上。然而,实际的视觉注意是一个动态的过程,对由注视点跳转形成的扫视路径进行建模同样是十分必要的,这也是之前视觉注意研究中忽视的方向。同样在基于深层自动编码器的重构模型下,本文通过用当前关注区域数据不断更新重构模型参数来建模动态的视觉感知。该算法中,视觉扫视过程可以描述为一个寻找当前重构残差最大区域并基于该位置更新重构网络的迭代过程。对比于现存的扫视路径生成方法,该模型能生成与人类扫视路径更一致的结果。综上所述,本论文以基于重构的中心–周围计算机制为主线,从非局部线性稀疏重构,到深层网络呈现的全局非线性重构,再到深度信息调制的基于背景学习的重构,到最后不断变化与更新的重构,在统一的框架下,来同时对静态显著性与动态扫视过程进行模拟,更加完整地描述与建模人类视觉系统中自底向上场景数据驱动的注意过程。
其他文献
阅读教学是高中语文教学中必不可少的一部分,课堂阅读教学在实际教学中占有很大的比重。随着教学的不断发展和改革,高中语文教师在课堂教学中更加强调培养学生的语文阅读能力
背景整体观是祖国医学基本哲学观,整体观哲学强调人是有机的整体,机体整体与局部在生理与病理中都存在相互联系及影响。近年来2型糖尿病与退行性腰椎管狭窄症之间的关系研究
美国现代诗歌受到中国文化的影响已是一个广为人知的事实,但是道家思想在里边起到了什么作用,是一个人们并不太清楚的问题。叶维廉在研究美国现代派诗歌时,采用了非常明晰的