论文部分内容阅读
足球比赛视频持续时间长,数据量庞大,由于网络传输带宽限制及观众仅对精彩事件感兴趣这样的事实存在,足球视频的精彩事件检测已成为体育视频分析领域研究的热点。目前常见的主流方法主要包括两类:一类是机器学习的方法,另一类是基于人工规则的方法,其中,基于机器学习的方法语义事件模型复杂,模型训练对样本数据的充分性和典型性要求较高;基于规则的方法,人工语义规则制定需耗费较多的人力,事件检测性能不高等。因此,如何构建性能良好的语义事件模型、建立简单有效的语义规则、准确且全面地实现语义事件的检测是当前体育视频领域研究的难点。本文针对足球视频精彩进球事件,提出了两种检测方法。(1)基于HMM (Hidden Markov Model)和语义规则的进球事件检测方法。通过语义镜头标注,将视频片段描述为由远镜头、中镜头、特写镜头、观众镜头和回放镜头组成的序列;结合足球领域知识,构建了进球事件的HMM模型,实现了基于HMM模型的进球事件检测;基于对进球片段与非进球片段的内容分析,定义了一种新的镜头特征—语义观测权重,并利用新特征建立了归一化语义加权和规则,实现了基于语义规则的进球事件检测;最终利用基于逻辑距离的加权融合方案,将两种检测结果通过最优权重进行决策级融合,完成对进球事件的检测。实验结果表明该方法对进球事件的查准率达到了96.55%、查全率达到了100%,优于传统的HMM方法和语义规则的方法。(2)基于HCRF (Hidden Conditional Random Field)和情感语义的进球事件检测方法。构建了用于实时镜头语义标注的HCRF模型,能够实现多种语义镜头的同时标注,得到了视频的语义镜头序列;利用镜头的语义观测权重特征构建了基于特征值加权的情感激励模型,旨在从情感语义角度描述进球事件的内含情感语义,得到了视频的情感激励值序列;在小规模训练样本情况下,有效建立了简单的进球事件检测HCRF模型,基于视频语义镜头序列和情感语义激励值序列与进球事件之间的映射关系,从视频结构语义和情感语义两方面挖掘进球事件的内在规律,准确实现了进球事件检测。实验结果表明本方法对进球事件的检测性能较好。最后对本文研究内容进行了总结,展望了未来的研究方向。