融合多层级特征与概念语义的视觉事件识别方法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:yahu911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着图像技术的发展和成熟,视觉数据在各领域中日益普及,并呈爆炸性增长。如何对视觉事件进行识别,自动有效的建模、分析并从中发现有价值的信息和知识,是当今智能时代的难题之一。视觉事件识别的关键之一在于寻求有效的图像表征,突显视觉图像的内在结构和特定特征信息。深度卷积神经网络(CNN)已成为一种有效的图像表征方法,而图像事件的描述极其复杂,图像事件不仅与其所包含的许多视觉线索高度相关,还包含某些特定的概念和概念间的潜在语义关系,仅通过CNN无法充分提取图像事件的表征信息。而多视图表征学习很好的关联不同视图数据信息来提高其表征的判别能力,本文利用多视图表征学习融合图像视觉特征和概念间语义关系,将含有丰富概念语义信息的外部知识融入图像表征信息实现图像事件识别。具体研究成果主要分为如下四个方面:1基于多尺度融合dropout的图像多层级特征提取CNN在图像识别领域取得了巨大成功,许多研究领域也将CNN看作一个基础模块。本文利用CNN在图像识别中的优异性能提取图像多层级特征,而同一模型采用不同dropout率对数据集中同一对象的识别性能不同。为了解决上述问题,本文提出了一种多尺度融合Dropout算法(MSF dropout),将不同尺度的深度神经网络的输出按最优的权重系数进行融合,实验结果表明该算法能获得鲁棒性更好的识别模型。同时通过MSF dropout优化后的CNN提取图像概念评分,识别模型特征层所提取的概念评分向量每一个维度都对应与现实世界中的一个特定概念。最后结合通道信息形成最终的图像表征,为后续基于概念评分的图像事件识别算法的研究作铺垫。2多特征融合的概念语义增强图像事件识别方法图像事件识别不同于对象识别、行为识别和场景识别。事件相比于对象、行为和场景是更高级的概念。针对图像事件识别中语义缺失的问题,本文首先提出了一种基于Word Net的概念语义相似度优化算法,考虑Word Net树中概念语义距离、概念节点深度、概念节点密度、概念语义重合度四个影响因子来描述不同概念间的语义关系。在此基础上,提出一种基于概念评分的图像事件识别算法(CS-IER),利用多视图表征学习融合概念评分和概念间语义关系提高其图像表征的判别能力。但利用CNN提取概念评分时若给定一个错误概念较高评分,多视图表征学习也会同时放大与其错误概念语义相近的概念评分,而使得图像表征信息失真。针对上述问题,本文通过提取CNN通道信息得到图像的局部特征,并将其与优化后的概念评分特征进行融合,从而形成图像最终的表征实现图像事件识别。在实验中,利用Chalearn、WIDER、PECD数据集明确了CS-IER算法中的关键参数的取值,验证了所提出算法的有效性。3融合帧级概念语义的视频事件识别方法图像事件识别任务中,处理视频数据难点在于视频数据同时含有空间和时间特征,提取单一帧的空间特征的同时需要考虑连续帧之间的关系。本文提出了一种基于帧级概念评分的视频事件识别算法(CS-VER)。首先利用CNN提取视频帧级概念评分,同时利用多视图表征学习将概念语义融入视频帧级概念评分。针对帧级概念评分形成的特征空间中,行与列都包含特定的视频特征信息,采用条状池化方法融合概念评分。针对融合后的概念评分特征分部存在突发性和稀疏性等问题,提出了一种概念幂归一化算法,使幂参数与概念评分的离散程度成比例,动态调整幂参数解决原始概念评分的稀疏性和突发性问题。本文所提出算法在CCV、USAA、UCF101、Activity Net四个数据集上获得了良好的效果。4融合概念语义的异常事件主动识别方法异常事件识别是事件识别中一个特殊问题。异常事件通常是未标注的,目前视频异常事件识别方法大多局限于处理高纬度的视频数据和视频数据时空信息的异常,利用主动学习进行验证和改进也是在人为干预下进行。本文提出了一种基于帧级概念语义和主动学习的视频异常事件识别算法(CS-ISTL),该识别方法可以学习视频中的空间和时间特征,实现基于实时视频数据的异常事件识别。同时,引入外部知识(概念语义)和主动学习,利用主动学习获取外部知识中包含的概念语义信息,完善模型对异常事件的表征能力实现视频异常事件识别。实验结果表明,所提方法引入外部知识和主动学习的特性,同主流方法相比更为有效。通过以上研究,本文对面向概念语义的事件表征和计算模型进行了深入的探索,为事件识别研究中所面临的关键问题提供了切实的解决方案。结果表明:概念语义在事件识别起到了重要作用。通过融合概念语义信息,可以提取更加丰富和易于理解的图像表征信息,从而提升识别任务的准确性;结合主动学习,可进一步对异常事件进行合理的解释和建模,同时能够有效的解决异常事件识别等实际问题。
其他文献
电动汽车无线电能传输(Wireless Power Transfer,WPT)系统中广泛使用各种高阶补偿网络,以补偿松耦合变压器的漏感。补偿网络的恒流恒压输出和纯阻输入特性至关重要:恒流-恒压充电,可确保电池有效利用与充电安全,延长电池使用寿命;零相角(Zero Phase Angle,ZPA),即纯阻输入,可最小化系统中逆变器的伏安容量,增强系统功率传输能力,易于实现软开关,提高系统效率。本文针
学位
随着船舶数量的不断增加、运输任务的持续提升、经济活动的日益频繁,内河水域船舶的通航效率与运输效益问题日趋严重。船舶运行数据分析及能源效益优化是保障船舶航行安全、提升船舶营运效益的有效方法和主要手段。本文以内河水域船舶为研究对象,基于完整运输航程的运行数据,考虑复杂环境等多影响因素,提出了船舶航行状态识别、多站点日水位预测、运输航段划分等方法;构建了船舶缺失轨迹数据修复、航速估计、油耗率估计等模型;
学位
本文尝试分析现当代的动画影像创作者,如何以数字技术为创作材料表现诗意。计算机作为虚拟世界的摹仿机器,其语言是一种有别于自然语言的人工语言,然而数字诗歌的实践向人们表明,计算机语言也是一种诗意语言。起初,数字诗学是研究数字诗歌的艺术创造性的学说,然而由于数字诗歌在先锋艺术运动中的潜在影响,以及其对诗意的表达所饱含的实验精神,让数字诗学成为一种讨论多元话语和多元视角的艺术学说。笔者追溯马克思·本斯的信
学位
后现代转向是动态的变化过程,它涉及到从现代到后现代的众多领域,指向一种考察世界、解释世界的新范式。对艺术的后现代转向研究不能孤立看待,而需要结合其他领域知识理论形成空间结构,即把艺术的视域从单纯表现艺术作品之间的关系,扩展到艺术与城市、传播、文化等相关空间领域。在这一过程中,既要强调理论工具的指导作用,又要重视艺术实践的个体情况。著名地理学家、人类学家大卫·哈维,将马克思历史唯物主义拓展到空间维度
学位
艺术博物馆是博物馆的主要形式,被认为是现代博物馆的原型。在我国,艺术博物馆作为“西学东渐”文化移植中的重要产物,在中国的历史和文化语境中,逐步生成其特有的机构管理体系及运作模式。与此同时,作为世界博物馆发展史的组成部分,中国艺术博物馆的萌芽与兴起,同步于世界近现代公共博物馆发展的成熟阶段,这使得我国艺术博物馆的理论与实践不可避免地受到西方理论及经验方法的影响。在自我建构与发展的过程中,中国艺术博物
学位
图像分类作为数字图像处理过程中需要解决的核心问题之一,一直以来都是机器学习、计算机视觉和模式识别等领域的热门研究课题。近年来,各种不同的图像分类方法已经被广泛地应用于如机场火车站的自动身份验证、移动设备拍摄图像内容的快速检索、各类单据信息的自动录入等现实生活的诸多场景。处理现实应用场景下的图像分类问题需要面对如下三种挑战:(1)属于不同图像类别的数据样本含有相似的共享信息。这些共享信息会显著地降低
学位
当代艺术图像作为视觉文化的图景之一,不仅拓宽了当代人的视觉经验,也是对全球视觉景观的最新审视。它与当代设计在引领视觉消费和时尚生活的使命上不谋而合,体现了当代社会对审美力的要求。同时,当代艺术家广泛参与设计活动以及设计师大量融入当代艺术的经验和特征的实践,无疑显示出二者跨界的积极意义。因此,对当代艺术图像的设计表达研究,不仅是当代艺术与设计融合的具体体现,也是当代设计发展的理论需要,既有益于找到当
学位
无线传感器网络(Wireless Sensor Networks,WSNs)是21世纪改变世界的最具影响力的高新技术之一,作为继互联网之后的第二大网络,它引起了全世界的瞩目,为物联网、大数据和新一代人工智能的蓬勃发展奠定了基础。虽然无线传感器网络的应用前景十分美好,但是传感器的能量消耗和维持问题,仍然是影响其大规模部署和广泛使用的一大瓶颈。无线充电技术和无人机(Unmanned Aerial Ve
学位
版画由着它所具有的特殊属性与技术方式,随着不断流变的时间进程在中西方不同文化背景下迎接着时代变迁与历史境遇。版画之所以能够成为一种独立的绘画艺术门类,在于其特殊制作过程所呈现的独特作品形态。作品形态的生成关系到此画种的内在语言结构及画者的审美取向,其中“过程性”起到关键性的作用。版画艺术“过程性”的研究,是以版画独特的历史发展轨迹为基调,将版画制作者具体的制作过程放置在不断流变的版画技术与概念中进
学位
5G的三大业务场景包括增强型移动宽带场景、超高可靠低时延场景和大规模机器类通信场景。这三大业务场景具有差异化的性能需求和较高的资源需求。边云协同多级计算是满足5G业务需求的关键。边云协同多级计算系统通过边缘层、区域云数据中心和核心云数据中心来为5G业务提供充足的资源。但是,该系统内的网络规模较大,包含基站、交换机和路由器等大量的网络设备。当这些网络设备来自不同的供应商时,设备上的控制协议或编程接口
学位