论文部分内容阅读
提出一种弱监督方法定位视频中动作的位置,标注数据集时,只需在每个训练视频中标注一帧图像。首先在每个视频帧上给出若干个动作执行者的候选框,然后连接候选框形成多个候选动作轨迹,利用视频中标注的一个矩形框去除大部分错误的候选动作轨迹,只保留与标注的矩形框重叠度较高的候选动作轨迹,最后保留得分最高的候选动作轨迹作为视频中动作的位置。确定训练视频中动作的位置后,提取视频中动作轨迹的特征训练一个分类器模型,利用这个分类器可以确定任意视频中动作的位置。在J-HMDB数据集上的实验结果表明,在重叠度阈值取0.2时,