论文部分内容阅读
时序动作检测作为视频理解中的一项基本任务,被广泛应用于人机交互、视频监控、智能安防等领域。基于卷积神经网络,提出了一种改进的编码-解码时序动作检测算法。改进后的算法分两阶段进行:首先,替换特征提取网络,用残差结构网络提取视频帧的深度特征;之后,构建编码-解码时序卷积网络。采用联接的方式进行特征融合,改进上采样的形式,并运用新的激活函数LReLU进行训练,提高网络的检测精度。实验结果表明,所提算法在时序动作检测数据集MERL Shopping和GTEA上取得了优良的效果。