论文部分内容阅读
随着直播平台的兴起和互联网的发展,视频已经成为了人们产生和获取信息的主要途径,由此引发的海量视频数据的智能分析也逐渐受到人们的关注,视频语义检测作为视频智能分析的基础,具有非常重要的研究意义和价值。而由于视频自身庞大的数据量,目前对视频语义的检测都是在对视频提取关键帧的基础上进行的,因此,对关键帧提取技术进行研究也是非常必要和关键的。本文针对视频关键帧提取和视频对象语义检测两部分展开研究,主要从以下三个方面进行了阐述:首先研究了基于镜头边界检测的关键帧提取算法,在对常用的镜头边界检测算法分析比较后,提出了改进的双阈值法检测镜头边界,给颜色直方图加入权值模板,并用局部自适应阈值代替固定阈值,避免了人工设置固定阈值对检测的影响;对镜头内部帧进行分类得到子镜头,最后利用帧的差异值判断并提取子镜头内的关键帧。接着针对现有的关键帧提取算法或多或少存在原视频信息损失的问题,把视频浓缩技术引入到关键帧提取中,深入研究了视频浓缩算法的原理,在一定约束条件下建立原始视频到浓缩视频的映射模型,据此定义了适应度函数并求解得到浓缩视频,不仅去除了原视频中的大量冗余,得到了密度更高的帧,而且与传统的关键帧提取算法相比,保留了更多的原视频信息,特别是时间信息和动态信息。最后研究了条件随机场基本理论,在此基础上对视频低层图像特征的条件概率模型以及像素点与对象之间映射的条件概率模型做了详细的理论研究和推导,根据图像特征模型,图像特征的条件概率模型和像素点与对象之间的映射模型,推导出对象语义的条件概率模型。最后在该模型上对关键帧提取算法进行了实验和比较。实验结果表明,改进的镜头边界检测关键帧提取算法和视频浓缩关键帧提取算法的检测结果与传统的双阈值镜头分割关键帧提取算法的检测结果相比有所提高。