论文部分内容阅读
新闻视频是对国内外发生的重大事件及时全面的报道且承载大量信息的视频之一。其包含着大量重要的语义信息,而新闻主播作为新闻视频的重要标志,对其进行有效检测,可进行新闻故事单元的分割,为更高层次的基于内容的视频分析奠定基础;此外,网络大量舆情信息主要通过新闻视频传播,通过对新闻视频主播帧的检测,为新闻视频中的舆情发现和分析提供可靠保证。 本文围绕着新闻视频主播检测展开了研究,研究的目的是从速度和准确度上提高新闻视频主播帧的检测性能,主要取得了如下研究成果: 1.基于多特征融合的级联检测方法。针对新闻视频质量参差不齐,背景复杂多变,以及目前多帧帧差的方法带来检测时间长等问题,提出了一种融合形状,纹理等多特征的单帧新闻主播检测方法。首先,利用人脸检测算法排除大量非主播帧,并选取合适的扩充比例对人脸区域进行扩充来提供候选区域,使用基于形状特征进行快速判定,然后通过基于纹理特征的判定得到最终检测结果。其中利用机器学习的思想,训练了级联分类器,即线性支持向量机和直方图交叉核的支持向量机。实验表明,该设计思想在保证检测速度的同时,大大提高了检测准确率。 2.特征的快速计算和改进。针对使用融合多个特征判定,以及高维特征带来的计算复杂度高等问题,为此,提出针对CENTRIST的快速积分方法,该方法利用一个积分图能达到快速判定的目的;同时利用交叉坐标下降训练算法训练直方图交叉核的支持向量机,使得判定时间复杂度从O(n2)降到O(n)。同时,针对COHOG特征存在的表达信息不足和缺失等问题,提出改进的COHOG,主要利用了梯度大小的信息,并对其进行了有效的插值,避免了混叠现象。实验表明,改进计算的CENTRIST在检测速度上有了很大提升,改进后的COHOG可提升检测准确度。 3.新闻视频主播帧检测系统。该系统包括基于人脸检测的候选主播区域定位,以及新闻主播帧快速检测算法两大模块。具体来说,利用人脸检测得到候选主播帧序列;接着利用新闻主播帧快速检测算法对候选主播帧进行快速检测,得到最终新闻主播帧。实验表明,该系统在检测性能上取得了较好的效果。