基于深度学习框架的小样本视频分类方法的研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:wxg1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和移动互联网技术的讯速发展,观看和分享视频成为人们日常生活的一部分,视频数据也成为重要的信息载体。人工处理视频数据显然不现实,使用传统的神经网络模型需要大量标注数据,而人工标注数据费时费力。因此,小样本场景下视频分类问题成为计算机视觉中热点研究问题。小样本视频分类问题是指在标注样本少的情况下完成视频分类任务。本文主要研究视频分类中两个基本任务:动作分类和背景类的检测,研究在视频标注少的情况下如何实现动作分类和背景类的检测。视频数据天然具有空间属性和时间属性,充分提取这两个维度的信息对视频分类任务尤为重要。已有研究工作未能考虑视频中帧与帧的相对关系及重要程度,因此在小样本场景下无法充分提取视频的时序特征。首先,为了解决小样本动作识别场景下特征提取及利用不充分的问题,本文提出了基于孪生网络的样本空间特征表示方法,利用ResNet-18和AlexNet网络组合成的孪生网络提取视频的空间特征;其次,提出了基于稀疏注意力机制的视频时序特征抽取方法,该方法的核心思想是在计算视频帧相对关系的同时,突出重点帧的影响,从而充分提取视频的时间特征;最后,根据上述提取的特征提出了基于对齐思想的深度关系模块,以充分利用样本中的时空特征。本文针对小样本背景类检测问题,提出了基于孪生网络的小样本背景类检测算法。在多个真实数据集上的实验结果表明,本文提出的基于稀疏注意力机制的小样本动作识别算法和基于孪生网络的小样本背景类检测算法,可以充分利用提取到的特征,显著提升分类结果的准确率。
其他文献
移动边缘计算(Mobile Edge Computing,MEC)的提出,在靠近用户的网络边缘提供了计算、存储和通信资源,解决了移动网络面对不断拓展的互联网应用场景和日益多样化的应用服务存在的资源短缺的问题。车联网作为5G重要的应用场景之一,涵盖了多种对时延、可靠性等性能有严苛要求的应用服务。作为车联网环境下的核心技术之一,MEC能够支撑密集接入的车联网应用对计算资源的需求,为用户提供低时延、高可
移动互联网时代,移动端设备越来越多,这就导致移动端的开发需求暴增,对移动端开发者技术要求也越来越高。目前移动设备主流平台主要是Android操作系统和IOS操作系统,相应的根据不同系统平台的特点,一样的功能代码在多个手机平台上要使用多种开发语言,开发成本就很高。在这种大背景下,就急需一种移动端跨平台开发框架来解决这种问题。本文首先介绍了四种主流的跨平台开发技术,总结各自优缺点基础上,最终选取Wee
近年来,随着互联网的迅猛发展,Linux系统被大范围地应用在移动终端、云服务、IoT等领域,其安全性与整个互联网生态息息相关。Linux中的1day漏洞可能严重影响计算机系统的安全。针对Linux系统的漏洞检测技术是安全领域的热点问题。Linux系统漏洞检测技术存在以下两个挑战:一方面由于Linux内核的开源性,可以在不同设备类型、不同指令集架构上使用,使得业界存在着差异性极大的二进制Linux内
当今时代,视频数据已经主导了互联网的流量。与静态图像相比,视频数据能够提供更加丰富的时序和多模态信息。视频语义分析和内容理解在实际应用中有着迫切的需求,因此也逐渐成为计算机应用领域的一个研究热点。人物作为视频中重要的实体,也是社会发展的核心。作为多媒体内容理解领域的一个关键问题,视频中人物的识别问题对于进一步的人物关系挖掘、知识图谱构建、人物行为和情感分析等具有重要的作用,在公安监察、社会管理、信
作为职代会工作的一项重要内容,组织职工代表专门小组开展监督检查活动,已经成为许多国有企业工会的日常工作之一。如何将这一制度落在实处,使其发挥维护职工权益、促进企业发展的作用,是值得国有企业工会实践与思考的课题。近年来,中车株洲电力有限公司根据企业实际,在总结过去行之有效做法的基础上,创新实践职工代表巡视制度,对此进行了有益的探索。
期刊
近些年,分布式光纤传感技术在大型土木工程、石油石化、隧道交通、高压输电线等领域得到了广泛应用。光纤的布里渊频移与温度和应变等环境因素呈线性关系,基于布里渊散射的分布式光纤传感系统就是根据这一原理实现传感。因为温度和应变同时对光纤的布里渊频移产生影响,所以布里渊频谱中只有单峰的光纤,无法同时测出温度和应变信息。对于复杂折射率分布的光纤,光纤中存在不止一个布里渊散射声模,因此布里渊频谱中含有多个峰值,
在5G移动通信系统中,宏基站均采用大规模天线阵列,在发送广播消息时,使用不同中心指向的窄波束进行扫描,完成数据的传输。然而在现有的模拟波束赋形方法中,当天线排布固定时,只能合成固定宽度的窄波束,波束形状单一,有时会产生覆盖不足或邻区干扰较大的情形。此时,在不改变天线数目和排布的前提下,急需找到合成不同宽度波束的方法。此外,在一定区域内,基站扇区之间如何能够合理的规划波束,在提升系统容量的同时降低邻
随着网络的飞速发展,工业领域也逐渐开始使用互联网进行通信,即工业互联网。其中,工业互联网使用的协议大多数是各个厂商自己制定的未公开协议,这些协议数据无法通过常用的协议工具进行解析,但是它们可能会对信息安全构成威胁。因此,尽可能的识别和分析这些协议数据对于保护工业互联网的信息安全极为重要。由于工业互联网中所使用的通信协议普遍都是未知的二进制协议,因此,工业互联网中的未知二进制协议是本文主要分析的数据
随着摩尔定律的失效,通用处理器的发展逐渐逼近天花板,定制化处理器开始兴起。人工智能、大数据和通信技术的蓬勃发展,推动物联网领域迅速发展。面对日益增长的数据量,物联网设备不能再像向过去一样只做简单的数据收集工作,而把复杂的计算任务交给云上服务器。同时物联网设备复杂的应用场景对处理器提出了高能耗比、小面积、灵活定制的要求。因此,本文对可配置的定制化处理器及其后端编译移植技术进行了深入分析和研究。本文首
随着科学技术的发展,人们对高速的信息速率的需求越来越迫切,与此同时,信息安全已经成为一个重要的研究内容。激光混沌安全通信是一种物理层的加密方法,它利用物理器件的硬件参数作为密钥,进行信息的加密、传输和解密。激光混沌源分为两种,即基于激光器内部非线性的全光混沌源和基于外部器件非线性的电光混沌源。外腔半导体激光器的混沌输出通常保留了激光器与外反射镜之间光路的时间延迟。因此,通过自相关函数等时序分析手段