基于多通道信息融合的注视点检测算法研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:zjwx2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类视觉系统存在一种视觉注意力机制,即优先关注和处理图像的某些局部,而后对图像中的其他部分进行处理或者不做处理。这种视觉注意机制很好的解决了输入信息量和处理信息量之间存在巨大差异的矛盾。显著性检测旨在模拟人的视觉注意力机制,在复杂的图像中选择出能吸引人眼关注的区域,显著性检测技术在实际工程应用中都有着巨大的发展潜力和广阔的应用前景,如图像分割,自适应图像压缩,基于内容的图像编辑,目标检测与识别,以及图像检索等。本文在阅读大量文献,研究分析了大量算法,总结现有的注视点检测技术并结合当今前沿技术的基础上,提出了一种新的人眼注视点检测算法。考虑到自然场景图像的多样性与人眼的注意力机制,本文算法采用多通道的检测框架,不同的通道对应于不同级别的信息。在底层信息通道中,本文用底层颜色信息去检测图像中与其他区域具有强对比度的区域。在显著目标检测通道中,采用多示例学习(MIL)算法与监督学习分类算法相结合方式,对图像中能吸引人眼关注的目标进行检测。多示例学习算法可以避免监督学习中样本选择的模糊性问题,两者存在一个互补的关系。另外,根据图像的内容,观察者或多或少会倾向于看图像的中心。考虑到这种倾向,增加了一个中心偏置通道。为了更科学地融合这些信息,本文训练了一个深度神经网络来判断各个通道的检测结果的可靠性。并用网络的输出来确定各个通道检测结果的融合权重。最后,本文算法添加了三种语义检测器来进一步提升效果。本文的主要贡献:(1)采用多通道的检测框架,应用高、中、低三个层次的信息对注视点进行检测,针对于包含各种内容的图像均有不错的检测效果;(2)首次将多示例学习(MIL)算法应用于注视点检测中,以确定图像中的目标是否显著,解决样本选择的模糊性问题,弥补了监督学习中样本选择不准确的问题;(3)提出了一种基于深度学习框架的融合多层次信息的新型自适应权重融合方法,使各级信息的整合变得更加科学。本文算法在三个国际通用的数据库上进行了评估,包括MIT1003,MIT300,以及Toronto120,并与六种国际上的优秀算法进行了比较,实验表明,本文算法在各个评价标准上都超越了其他算法,拥有优秀的检测效果。
其他文献
西方哥特主义萌芽于18世纪晚期,在当代和现代作品中仍然盛行。哥特主义是西方浪漫主义的一个特殊分支,被评论家称作"黑色浪漫主义"。文章介绍了哥特小说的起源、背景、发展和
本文首先介绍了美国数字版权刑事制裁立法发展,即不以商业目的为刑事制裁的主观要件的规定.文章第二部分表明放弃商业目的的限制以追究刑事责任的做法,以及不明确规定合理使
文章对燃料电池汽车氢喷射器噪声现象、产生原因、传播路径进行了系统的分析,并根据分析结果进行了相应的优化措施,有效地降低了氢喷射噪声。
本文介绍了湖北茶树种质资源收集保存与品种创新研究的主要成就,并提出了"十一五"期间茶树资源与育种工作的主要研究目标和展望。
本文介绍了绿茶饮料的褐变机理、护色机理及技术,阐述了包埋法、酶处理法、离子护色法、加抗氧化剂法、pH值调色法、包装技术、灭菌技术、除氧技术等护色技术,以及不同护色技
一个企业最终走向衰败的原因,往往是由于企业内部出现严重的问题,在这个经济飞速增长的市场中,许多企业只注重效率,而忽略企业内控管理。加强企业内部控制管理,有利于企业财
<正>新课程改革的目的之一是让课堂活起来,动起来,使各层次的学生通过互动、交流、合作,真正成为学习活动的主体。互动式教学是指在教学过程中的新
根据PC5282颚式破碎机主要结构性能参数,对机构进行了运动仿真,得出理想的运动轨迹和行程,并进行了受力分析。建立了动颚的三维模型。基于COSMOSWORKS平台对动颚进行了有限元
<正>炭催化剂作为化学战剂的主要吸附剂,是各种军用滤毒罐和集体防护器材的关键装填材料。随着炭催化剂工业的发展,对炭催化剂的需求不断增大,同时对炭催化剂质量的要求也逐
1988~1991年,我们将超氧化物歧化酶(SOD)霜剂用于治疗数种皮肤病,现将结果报告如下。一、临床资料总共142例,均为本院门诊病例,比较集中者可分为三大类。①各种皮炎36例,男5例,女31例,年龄17~68岁,平均33.5岁。其中接