基于视觉注意机制的感兴趣目标检测研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:SongSan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,如何从大规模图像视频数据中有效的定位所需的图像块,已经成为图像和视频处理中热门的领域。视觉注意感兴趣区域提取是过滤无用信息,获取有用信息的重要方法。本文首先介绍视觉注意模型的研究现状,从不同角度讨论了现有视觉注意模型优缺点。本文在自底向上的注意模型基础上,加入了自顶向下的上下文场景信息,并且尝试引入神经网络反馈机制。本文所建立的场景记忆视觉模型能提取空间和非空间特征,用以建立最终的视觉注意显著图。其次,本文重点介绍了场景记忆注意模型的建立流程。注意模型提取非空间特征(颜色、亮度和方向)和空间特征,运用背侧通路对腹侧通路的交互作用,把空间特征对非空间特征进行调制。再运用中央-外围差分算法,在高斯金字塔下进行多特征图融合生成总显著图,并进行注意目标选择和焦点转移。为了提高目标显著性,本文引入了上下文场景显著性检测,用静态和动态上下文场景信息校正显著图。通过融合空间、非空间和上下文场景特征并且引入信号调制机制,可以解决其它模型在焦点选择不合理的问题。最后,本文运用四组不同场景视频、三组静态图像和行人视频进行注意测试,结果表明,本文建立的场景记忆视觉注意模型提取的感兴趣目标,更符合人眼的视觉注意机制,准确度也更好。综上所述,本论文的主要贡献:解决了自底向上和自顶向下模型的不同特征融合问题,引入神经调制机制,加入上下文场景信息显著性检测,使空间和非空间特征在高斯尺度空间实现多特征融合。这些改进能有效地保持图像的重要信息,在总显著图中首次注意和焦点转移也优于其它传统的视觉注意模型产生的效果,更符合人类视觉注意机制。未来多角度改进本文的注意模型后能运用到智能跟踪设备中。
其他文献
随着社会的进步和计算机技术的发展,说话人识别作为身份鉴别技术的一种,由于其独到的优势得到越来越广泛的使用。在说话人识别领域中,与文本无关的说话人确认技术是目前的研
随着人类社会发展,人们越来越关注健康和长寿,因此也有越来越多的人投入到衰老机制的研究中。很多文章表明从变温动物到恒温动物,寿命都是受外界条件和遗传因素共同调节的,如线虫
作为我国传统文化的重要组成部分,食用菌文化在现代景观设计中具备较高借鉴价值,基于食用菌文化主题的景观工程大量涌现.通过分析食用菌文化及其景观价值,并基于景观设计中食
针对食用菌菌种在管理工作中存在的缺乏知识产权保护意识、品种权受到侵害、产业销售混乱以及标准体系不健全等问题,重构食用菌产业安全法律责任体系.通过构建食用菌菌种企业
依照食用菌产业链关系,有效反映以价值转让和食用菌产品生产为主线的企业联系,并体现企业彼此间在市场供需关系基础上建立的内在关联.发展食用菌产业具备成本低、周期短、市
为了实现双孢蘑菇的无损伤采摘,利用图像采集卡和CCD相结合的方式组建采摘机器的视觉系统,建立图像的识别算法,设计采摘机器智能控制系统总体方案.
实证考察不同法律环境影响下食用菌的出口集中度稳定性.各国法律环境指数涉及到的3项综合指标为:保护生产者合法权益程度、保护消费者合法权益程度及保护知识产权程度,并用赫
磁共振成像中的相位图像包含丰富的组织磁化率变化信息,同时获取相位图像不需要额外的扫描时间。定量磁化率成像技术目前已经成为科学和临床研究中的一个热点问题,这种技术可
脉冲耦合神经网络,是由艾克红等人根据哺乳动物大脑视觉皮层神经元模型在受到刺激的情况下能发放脉冲串并引起同步振荡这一现象的基础上不断研究总结得到。该模型基于生物学
根据国内汽车垫片生产商对表面轮廓仪的需求,本课题综合成本、精度、检测速度及操作性等多因素,提出了基于FPGA的二维形貌检测方法。本文首先对课题的来源及解决方案进行了叙