基于检测器组件的选择性集成方法用于场景适应的人体检测研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:kilmic1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能以及计算机视觉领域的不断发展,计算机视觉领域中的识别、追踪、检测等研究技术也被广泛地应用,譬如自动驾驶等智能交通、维护社会安稳的智能监控和智能家居等应用领域。作为计算机视觉领域其中的一个重要研究方向,人体目标检测在近十几年来吸引了大量的研究工作,因此得到快速的发展并且它的性能也得以不断地提升。然而人体目标检测技术仍然存在极大的挑战,基于不同场景中的迁移学习以及半监督学习的人体目标检测是目前需要解决的一大难题。从不同的场景中收集到的图像之间的差异是较大的,尤其是特定场景之间。譬如车载摄像头和广场的监控摄像头拍摄的图片,它们的视角、遮挡情况、背景等都是不同的。因此,将一般性的人体目标检测器直接应用到特定场景的时候往往会导致该检测器的性能下降。所以将一般性的检测器适应到特定场景的方法具有显著的意义。基于以上的需要和挑战,本文旨在解决场景适应的人体目标检测任务。本文首先对人体目标检测的研究背景和意义进行介绍,并且根据目前国内外的研究现状,围绕如何从一般性的场景中迁移有用的知识或者特征使得检测器能够适应特定场景进行了研究,提出了一种选择性集成的方法来将检测器适应到特定场景中,并结合深度学习技术提升检测器在特定场景中的检测性能。首先,我们设计一种选择性集成的方法来选择一组决策树并赋予每棵树合适的权重来进行重组。本文认为使用一般性场景的数据集训练的决策森林中的决策树能够捕捉到重要的对目标场景的人体目标检测有帮助的人体特征。重组后的决策森林用于从目标场景中收集大量的高置信度的样本,从而扩增训练样本。此外,我们设计了一个加权的卷积神经网络,并且使用扩增的训练集来训练该神经网络,使得能够基于少量人工标注的样本和大量的高置信度的样本得到性能更好的场景适应的检测器。该卷积神经网络和前面的重组决策森林级联在一起,从而构成了一个级联的检测器。最后,通过实验验证了我们所提出的场景适应方法和级联检测器的有效性,并且与其他顶尖的领域适应的人体目标检测方法进行了对比实验,阐明了本文方法的优越性和价值,以及对实验结果进行了详细的分析。最后本文总结了主要研究工作和贡献,以及本文所提出的级联检测器仍存在的不足之处并思考了一些改进的方案,然后对未来的研究方向进行了猜想。
其他文献
通信设备企业作为高新技术产业中的代表性企业,其技术变革的速度非常迅速。为了提高自身技术水平和技术创新能力,通信设备企业更多地选择与其他有竞争性的企业构建技术联盟作
多目标跟踪自提出以来,涌现了诸多经典目标跟踪算法,诸如卡尔曼滤波、粒子滤波等经典目标跟踪算法都有着较好的滤波性能,目前已经被广泛应用于军事,民用等诸多领域。但由于经
随着经济的发展,科技的进步,大跨度空间钢结构在工程中应用越来越广泛。利用其轻质高强的性质,越来越多的大跨度、大空间的复杂结构形式不断出现。然而,伴随着优越性能的同时,是复杂的施工过程和对其工程质量更高的要求。一旦结构在施工建造、拼装焊接的过程中发生破坏甚至倒塌,将会造成巨大的经济损失,甚至会对人身安全造成威胁。为了保证结构施工过程安全可靠,大跨钢结构多采用地面拼装,整体顶升的施工工艺,因此,保证顶
随着互联网的飞速发展,图像数量呈爆炸式增长。针对海量图像进行分类和管理已经成为新的研究热点,其目标是将特定的图像归类到某一特定的语义类别之中。近年来,视觉词袋模型
情感的理解和表达是人类进行交流活动的重要手段。随着人工智能等领域的快速发展,智能化的人机交互需要满足用户与机器之间的“自然”交互,而达到“自然”交互的关键是让机器
FCM算法的有效性很大程度上局限于类内紧致、类间较好分离以及球状的星团,虽然可以采用映射非线性数据到高维特征空间来解决这个问题,然而在高维特征空间里面,对于核的选择有
随着互联网的不断发展,微博、电商、新闻媒体等主流应用中涌现了大量的文本数据流且其中的概念漂移也出现了新的特点:如快速,频繁、多样。而传统的概念漂移检测方法多基于分
图像分割就是根据灰度、颜色、形状等特征把图像分成若干个区域的过程,是图像处理的重要环节之一。医学图像为医生提供了丰富的组织器官信息,随着医学图像技术在临床诊断和治
实验仪器和设备,往往是科学研究与理论考证进行应用实践的重要物理基础。关系着科研水平的提高,甚至会成为决定科研成败的关键。为加强实验设备管理及提高实验设备的工作效率
随着移动互联网的快速普及和高校信息化建设的深入开展,基于移动互联网的在线教学模式和平台逐渐被各类教育机构所接受,并不断研发和使用基于移动互联网的在线教学平台。与传