视觉注意模型的研究与应用

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:czfczfc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉注意是指人在面对复杂场景时,会迅速将注意力集中在少数重要区域,并利用有限的处理能力对其优先处理。而目前许多图像处理任务在处理复杂场景时要浪费大量时间与计算能力。因此将视觉注意机制进行建模并引入计算机图像处理过程有着重要的意义。本文首先详细介绍了视觉注意的生理基础,沿着视觉通路一一介绍与视觉相关的生理结构。接下来介绍了几种重要的自顶向下的视觉注意算法。包括严格按照生理结构建模的、应用最广泛的Iiit模型;效率最高的谱剩余算法;对谱剩余进行扩展的PQFT算法;以及最新、效果最好的全局对比度算法。然而这些算法都有各自的缺点。例如Itti算法的效率不高、谱剩余算法没有利用颜色信息、谱剩余和PQFT算法倾向于提取物体轮廓、全局对比度算法无法处理复杂纹理的背景等等。最后本文提出了新的显著区域检测算法。该算法的设计目标是:1.能够均匀地突出整个显著区域,而不是仅仅突出显著目标的边缘或者轮廓。2.能够从纹理复杂的背景中检测目标。3.计算效率比较高,才能够适应大规模图像处理和高效的图像检索与分类的应用需求。经过分析,本文提出了基于频域与空间域分析的显著区域检测算法。我们认为图像中不引起视觉注意的背景多为重复性出现,因此在幅度谱中表现出较为锋利的尖刺。该算法利用中值滤波器,将幅度谱中的尖刺结构去除,从而实现了抑制重复出现的背景。对于中值滤波器的窗口大小选择问题,本算法先计算出不同窗口大小的滤波结果,将这些结果都转换为空间域的显著图,然后再利用空间标准差来确定候选显著图,最后利用对比函数选择最佳显著图。该算法充分利用了图像的亮度与颜色信息,同时还利用了全局对比算法对结果进行改善。本算法的频域处理方法可以实现复杂背景中检测目标,而且效率较高,同时空间域的分析可以克服频域处理倾向于突出目标边缘的缺陷,使得整个显著物体均匀突出。所以实现了算法的设计目标。最后本算法在经典的MSRA显著目标数据库,以及目前最大的显著目标精确标记数据库上进行了实验,同时与其他10种经典的视觉注意算法进行了对比。结果显示本文提出的算法无论是精确率、召回率、F-测量,还是ROC曲线下面积,都超过了现有的算法,得到了目前最佳的结果。
其他文献
通过对当前石河子地区酿酒葡萄常用的灌溉方式进行分析,探索科学合理的节水灌溉方法,以期在一定程度上解决酿酒葡萄地块因灌水不匀造成的葡萄长势长相"南弱北强、东弱西强"的
1776年,瑞典政府颁布了《出版自由法》,开创了政府信息公开的先河,此后,随着知情权的逐渐深入人心,政府信息公开在世界各国得到了迅速的发展。关于政府信息公开的法律也相继
随着我国工程建设事业和房地产市场的蓬勃发展,在高层建筑、桥梁、港口码头等工程中大量采用桩基础。因有诸多优点,混凝土冲孔灌注桩是目前高层建筑工程桩基础中常见的基础形
全国最大规模和最有价值的数据资产,成为中关村大数据产业发展得天独厚的优势。中关村大数据技术发展已与硅谷同步,海量数据挖掘等技术都处于国内领先地位,大数据产业链雏形已经
[摘 要] 为有效提高有机化学教学质量,针对教学中存在的问题,探究了基于MOOC时代的将化学专业软件引入有机化学理论教学的改革,以期丰富教学多样性,将抽象知识具体化。  [关键词] MOOC;有机化学;教学改革;专业软件  [基金项目] 2018年度江西省省级重点教改课题“MOOC时代化学专业软件在有机化学理论教学中的应用研究”(JXJG-18-1-20)  [作者简介] 刘艳珠(1979—),女
日语的拟声拟态词是一种富有临场感的生动的语言,在语言表达方面,发挥着独特的作用。一般来说,通过拟声拟态词的恰当使用,语言表现力可以得到提高。但是,尽管拟声拟态词在日
目的:考察不同的制备人血白蛋白微球的方法,选择适于工业化生产的制备方法,研究该方法制备不同粒径人血白蛋白微粒的最佳条件,并对于其装载人参皂苷Rb1、阿霉素、异硫氰酸荧
该文以某双塔混合梁斜拉桥为工程背景,并利用桥梁专业软件Midas/Civil建立了全桥有限元模型。对比分析在成桥阶段,体系温差、索梁温差、索塔温差及梯度温度等温度效应对含叠
目的:本研究采用mRS (Modified Rankin Scale)评分对联合血管重建术治疗烟雾病患者术前后进行功能评估,并采用磁共振灌注成像技术对患者术前后血流动力学参数进行对比,采用统
目的:在中医药理论指导下,观察加味八珍汤对人工全膝关节置换(Total Knee Arthroplasty,TKA)术后隐性失血的影响,比较手术前后血红蛋白(HB)、红细胞比容(HCT),并观察术中出血