论文部分内容阅读
支持向量机是在统计学习理论研究的基础之上建立起来的一种机器学习的新方法,并且克服了以往的学习算法的固有缺陷,在解决有限样本问题、提高训练结果的泛化性能、避免陷入局部极小的情况以及样本在低维空间的非线性问题等方面提出了较好的解决方案。本文从支持向量机的理论研究出发,基于其强大的理论优势,实现了两个应用:视频字幕检测分类器设计和图像主体显著程度的打分器。一、视频字幕是表达视频内容的重要信息,可以为视频检索和存储提供语义标签,因此实现视频字幕的自动化提取有现实的应用价值。本文提出的算法综合使用了角点密度特征、边缘强度特征、纹理特征和基于灰度共生矩阵的统计特征来区分字幕与非字幕区域。论文采用支持向量机实现了字幕区域与非字幕区域的判别,这种方法在二分类且样本数量相对较小的的情况下分类效果更好,并且避免了传统投影方法设置过多的阈值,有更好的推广性。二、随着信息技术的发展,人们的需求从简单的文本信息发展到了图像信息,一幅图像的主体区域最能表现图像内容,含有的信息量也最大。论文提出的算法在同一张图片的中心区域和周围区域分别提取图像颜色、边缘、纹理和视觉显著图等特征,采用支持向量机训练一个判断图像主体视觉显著程度的模型,通过该模型对输入图像进行预分析,为其主体显著程度打分并判断是否有进一步分析的必要。实验表明,此模型有较高的分类正确率,并为后续高效的图像分析奠定了基础。