论文部分内容阅读
体育视频分析是近年来多媒体领域内的一个研究热点,它有着巨大的应用前景和广大的受众群体。体育节目分析的主要研究包括:精彩片断检测、节目的自动摘要、浏览、语义事件检测、检索、节目定制、内容编辑等。本文的主要工作集中于体育视频中级特征的提取,包含以下几个方面:
(1)提出了一种基于决策树的足球视频语义镜头分类方法。首先定义了几个重要的镜头类型,然后在图像帧上联合颜色、纹理、形状等特征利用决策树对画面进行分类。镜头的类别由其中包含的画面帧的分类结果投票决定。镜头分类是视频语义分析的基础,特定的镜头上下文蕴涵着特定的语义事件。
(2)提出了足球节目中基于重放标志图和镜头上下文的自动重放场景检测。首先自动提取了重放标志图用于获取重放段落边缘,然后使用段内运动信息和镜头信息识别重放场景。该方法一方面能够准确定位重放段落边界,另一方面可以鲁棒的识别重放场景。本文利用镜头分类和重放场景等中级描述实现了足球节目中射门和红黄牌事件的检测。
(3)建立了场地球类运动中统一的镜头描述框架。首先分析了镜头生成与使用的场景特点,给出了镜头表达的三元素模型,然后提出了场地球类运动中语义镜头描述框架,并将它应用于语义镜头检索、视频时域分割和语义分析。
(4)提出了一个快速的足球检测与跟踪算法。首先分割并提取比赛场地,然后采用由粗及精的策略联合颜色与形状信息检测球的位置,并使用基于Monte Carlo采样的Condensation算法进行足球的跟踪。
(5)从局部运动的角度分析了游泳节目中运动员运动并应用于游泳姿态分类。首先利用颜色和运动信息提取出局部运动,结合运动能量估计了游泳运动的周期,然后在每个周期中提取一个运动特征显著帧,最后联合运动周期和显著帧运动特征对四种游泳姿态进行了分类。