【摘 要】
:
在当今的信息社会时代,视频数据呈现爆炸增长的趋势。从海量视频中获取有价值的关键信息变得尤为重要。随着深度学习技术的快速发展,视频理解已成为研究热点。本文从视频亮点检测、时序动作定位等方面进行视频语义研究。在节省视频浏览时间、节约制作视频的成本等方面具有一定的实际应用价值。鉴于视频数据包含图像、文本、音频多个模态的信息,本文提出了一种用于实时自动剪辑视频亮点的多模态分析方法(MAA)。目前,与提取亮
论文部分内容阅读
在当今的信息社会时代,视频数据呈现爆炸增长的趋势。从海量视频中获取有价值的关键信息变得尤为重要。随着深度学习技术的快速发展,视频理解已成为研究热点。本文从视频亮点检测、时序动作定位等方面进行视频语义研究。在节省视频浏览时间、节约制作视频的成本等方面具有一定的实际应用价值。鉴于视频数据包含图像、文本、音频多个模态的信息,本文提出了一种用于实时自动剪辑视频亮点的多模态分析方法(MAA)。目前,与提取亮点相关的大部分工作均是使用单一方法检测单个或多个亮点。而本文结合了计算机视觉领域中的多种算法,对多种视频语义信息进行建模,实现了更加多元化的亮点检测。构建了四种丰富的以体育视频为中心的数据集用于多模态分析。通过自动编辑亮点实验系统测试直播流,一方面,针对定义的精彩事件验证实验结果。另一方面,通过打分机制与专业视频编辑人员制作的亮点视频进行分析对比,评估亮点的质量,进而证明MAA的有效性。针对未修剪的冗长视频,本文提出了一种新的时序动作定位算法,设计了多流时序网络(MTN)和提议评分网络(PSN)。将图像、音频、动作等多模态信息对视频内容进行多维度编码作为网络的输入,丰富特征编码信息。对不同模态的特征采用早期融合方式进行时序运算,目的是使对定位真实的目标动作更有利的某模态特征得到最大化利用。加入不同模态的中间层特征融合支路和用来提取视频提议级别特征的时序卷积层,使多模态信息深度融合并能高度表征视频的关键内容。最后,在两个公开数据集和一个手工创建的数据集上展示了本文算法的有效性和优势。
其他文献
高维多目标优化问题在社会工程中已广泛应用,然而由于高维多目标优化问题的前沿特殊性,使之成为优化研究的难点问题。随着目标数量的增加,算法存在多样性与收敛性冲突加剧,选择压力缺失及多样性维护不足等问题。针对上述问题,本文旨在探索和设计具有较高搜索能力和搜索效率的匹配选择策略及环境选择策略,提出了两种高维多目标优化算法,即Ma OEA-MS和Ma OEA-ES算法,并应用于无线传感器网络低能量自适应聚簇
本论文主要是对大规模图网络数据的结构分析与表达学习进行研究。当前,多样型的大规模图网络结构在现实生活中是非常常见的,比如社交网络、引文网络、交通网、物联网、物流网、生物分子网络等等。基于这些网络结构数据产生了众多需要解决的图分析任务,例如链接预测(如社交网络上的好友推荐)、多标签分类(如引文网络上的同主题论文归类)、异常点检测(如交通网上的拥堵点检测)等等。然而传统的图论或者统计方法面对这种大规模
随着信息技术的广泛应用,很多行业的传统模式都发生了改变。企业信息技术系统快速发展,企业的各种活动越来越多的依靠各种信息系统的支撑。在这个信息技术高速发展的世界,网
阅读是我们获取信息、提高综合语言能力的重要途径,它在听、说、读、写四项技能中起着重要的作用。因此,加强阅读教学,培养学生阅读兴趣、提高学生的英语阅读成绩是大学英语阅读教学的中心任务和重要组成部分。目前,大部分大学英语教学仍采用以教师为中心、以教材为中心、以语法为中心的传统教学模式,在这种教学模式下,学生是被动的学习者,这可能会产生一系列的问题。因此,如何有效地提高学生的英语阅读水平和改进传统的英语
特征选择是当前机器学习和数据分析中去除不相关和冗余特征从而提供快速可靠分析的关键步骤。在众多的特征选择算法中,粗糙集属性约简不失为一种较为有效的方法。经典粗糙集理论之后出现了模糊粗糙集、邻域粗糙集、变精度粗糙集等更具实用价值的理论。然而,为了利用粗糙集属性约简算法获得最优解,需要对解空间进行遍历,计算量过于庞大。例如邻域粗糙集在单次求解的过程中需要比较每一个样本与其余样本之间的距离,时间复杂度相当
近年来,项目管理开始在大小型企业中得到越来越多的重视和使用。作为项目管理中最核心的组成部分之一的进度管理,是保障一个项目是否能从开始就能持续,健康和稳定发展的重要措施。随着C公司与国际知名企业的合作越来越深入,石油服务行业开始越来越注重为客户提供一站式解决方案,对于C公司来说,提升技术能力的同时如何提升管理水平,将日益复杂的项目有效管理起来,确保项目能够平稳进行是一件迫在眉睫的事情。随着国内石油服
地震断层破裂的方向性效应对近场地震动强度和空间分布有显著影响,开展破裂方向性效应影响研究对于认识强地震动工程特性和工程结构的抗震设防具有重要意义。本文利用国内外近年发生的重要地震事件中获取的强震动观测记录研究近场地震动空间分布和衰减特征,将观测结果与美国NGA-West2地震动经验预测模型进行对比,揭示近场强地震动的长周期特点,基于统计回归和残差分析定量考察地震破裂的方向性对地震动峰值加速度(PG
随着寿险公司市场竞争日趋激烈,而承保利润逐渐压缩甚至出现亏损的情况下,寿险资金运用投资关系着寿险企业的长期稳定经营发展,如何提高自身的投资收益率,用投资收益来弥补承保的亏损,是寿险企业面临现在需要面临的问题。我国正在改革保险资金运用管理,并拓宽了保险资金投资渠道,此时寿险企业带来机遇的同时也带来了挑战,因为收益与风险是并存的。寿险资金运用会带来投资回报,提高公司利润,但同时寿险资金运用也会受到内外
自古以来,我国便是农业大国,农业的稳定和发展始终是社会稳定、国家繁荣的基础性保障。随着经济的发展,城市化进程的不断推进,大量劳动力涌入城市,农村土地的利用率不断下降,
劳动保护向下竞争理论认为外资会选择进入劳动保护标准较低的国家。本文旨在使用中国数据检验这一理论,我们以2008年《劳动合同法》的实施为准自然实验构建双重差分模型,使用我国A股上市企业数据,样本长度为2003-2012年。研究发现我国《劳动合同法》的实施反而有助于外商直接投资的增长,实证结果表明,《劳动合同法》颁布后,在劳动密集度较高的企业中外资股权比例显著提高。进一步探究《劳动合同法》对外商直接投