【摘 要】
:
技术的目的是在缩短视频长度的同时,概括视频的主要内容,这样可以极大地节省人们浏览视频的时间。视频摘要技术的一个关键步骤是评估生成摘要的性能,现有的大多数方法是基于整个视频进行评估。然而,基于整个视频序列进行评估的计算成本很高,特别是对于长视频。而且在整个视频上评估生成摘要往往忽略了视频数据固有的时序关系,导致生成摘要缺乏故事情节的逻辑性。因此,提出了一个关注局部信息的视频摘要网络,称为自注意力和局
【机 构】
:
广东省广播电视网络股份有限公司中山分公司,华南理工大学计算机科学与工程学院
【基金项目】
:
国家自然科学基金(61370103),广州市产学研重大项目(201902920004)。
论文部分内容阅读
技术的目的是在缩短视频长度的同时,概括视频的主要内容,这样可以极大地节省人们浏览视频的时间。视频摘要技术的一个关键步骤是评估生成摘要的性能,现有的大多数方法是基于整个视频进行评估。然而,基于整个视频序列进行评估的计算成本很高,特别是对于长视频。而且在整个视频上评估生成摘要往往忽略了视频数据固有的时序关系,导致生成摘要缺乏故事情节的逻辑性。因此,提出了一个关注局部信息的视频摘要网络,称为自注意力和局部奖励视频摘要网络(ALRSN)。确切地说,该模型采用自注意力机制预测视频帧的重要性分数,然后通过重要性
其他文献
西咸新区空港新城幸福里小学是一所公办完全小学,位于空港新城底张办幸福里社区北,2019年9月建成投人使用。学校占地30余亩,校舍建筑面积15000平方米,校园环境优雅,硬件设施
人心,简单又复杂。无论是看清一个人的品性,还是发展一段亲密关系,都需要经过时间的考验。和懂你的人谈心,高山流水,和不懂你的人说话,对牛弹琴。和在乎你的人聊天,能听到真
命名实体识别技术是信息抽取、机器翻译、问答系统等多种自然语言处理技术中一项重要的基本任务。近年来,基于深度学习的命名实体识别技术成为一大研究热点。为了方便研究者
图像风格迁移是计算机视觉领域的一个热点研究方向。随着深度学习的兴起,图像风格迁移领域得到了突破性的发展。为了推进图像风格迁移领域的发展,对基于深度学习的图像风格迁移的现有研究方法进行综述。对基于深度学习的图像风格迁移方法进行分类和梳理,并对比分析基于卷积神经网络和基于生成对抗网络的风格迁移方法,介绍了图像风格迁移的改进性和拓展性工作,讨论了图像风格迁移领域目前面临的挑战和未来的研究方向。
机载软件的测试与验证是保障机载软件正确性和可靠性的重要方法。软件的测试与验证离不开工具的支持,使用工具能够提高效率、降低成本,对机载软件的测试验证工具研究是对其进
分析发现在非平衡Feistel结构的SM4算法中,前后轮次的中间数据具有相关性。因此,通过内部碰撞原理并结合模板匹配的方法后,可用于恢复SM4算法轮子密钥,并给出了一种针对SM4算
针对心电(ECG)信号智能分析模型中,复杂波形的特征提取困难,人工设计特征造成源信号特征丢失,标签样本不足等问题,提出了一种基于深度稀疏自编码器(Deep Sparse Auto-Encoder
针对传统压缩感知穿墙雷达成像算法存在的计算过程复杂、对噪声较敏感等问题,提出一种压缩感知框架下的基于非精确增广拉格朗日乘子(Inexact Augmented Lagrange Multiplier,
增强现实技术是近年来人机交互领域的研究热点。在增强现实环境下加入触觉感知,可使用户在真实场景中看到并感知到虚拟对象。为了实现增强现实环境下与虚拟对象之间更加自然
针对细粒度车型中子车系间识别率低的问题,同时为了增强卷积神经网络的表征能力,提出融合独立组件的残差网络(IC-ResNet)模型。优化ResNet网络,通过改进下采样层,减少特征信息损失,接着使用中心损失函数和Softmax损失函数联合学习策略,增强模型的类内聚性。在卷积层前引入独立组件(IC)层,获得相对独立的神经元,增强网络独立性,提高模型的特征表示能力,从而对细粒度车型实现更准确的分类。仿真