论文部分内容阅读
随着多媒体技术和互联网技术的快速发展,数字视频信息出现飞速膨胀。在海量的视频数据中,快速、准确地查找到人们所需的视频已成为近年来研究的热点。传统基于内容的视频分析方法大多利用视频关键帧的底层特征之间的相似性进行研究判断,但这种分析方式往往不能被人们惯用的高级语义所理解,严重影响视频分析的准确率。如何跨越底层特征和高层语义之间的“语义鸿沟”,实现基于语义的视频分析已成为当前亟待解决的难点之一。 基于稀疏表示的视频语义分析是一种将压缩感知理论用于视频分析的新方法。本文对稀疏表示进行了研究并将其应用到视频语义分析上,在此基础上对稀疏字典学习和KNN算法进行深入研究和改进,其主要工作如下: (1)提出了基于自适应局部敏感的稀疏字典学习算法,该算法利用字典原子间的线性表达和重构关系构建自适应局部适配器,使用适配器指导稀疏字典学习过程。通过不断迭代自适应局部适配器的构建、稀疏编码和字典更新三个阶段以求得最后的优化字典。实验表明该方法获得的优化字典能更贴近地表达原始视频样本特征,更利于对待测视频样本的表达,从而提高视频语义分析的鉴别能力。 (2)为了进一步结合视频样本稀疏表示的鉴别性,提高稀疏表示的语义检测准确率,本文提出了基于自适应局部敏感稀疏表示的加权KNN视频语义分类算法。该算法利用上述字典学习算法获取视频特征的稀疏表示后,使用核函数将低维的稀疏系数映射到高维空间中,建立起综合样本特征核稀疏系数的Fisher准则和样本与类别样本的重构误差的鉴别损失函数来衡量样本稀疏系数间的相似度关系,采用阈值的方式进行投票,考虑训练样本的重构误差和平均核距离的情况来建立投票权重对投票结果修正,形成加权KNN算法实现视频稀疏表示的语义分类。实验表明该算法能有效提高视频语义检测的准确率。 (3)设计实现了基于本文所提出的两种算法的视频语义检测原型系统。该原型系统展示了友好的用户界面,实现了视频的预处理、模型训练以及视频检索三个模块。通过对系统运行测试来对本文所研究的视频语义分析方法进行评测与验证。实验结果表明了本文所提算法是有效的且原型系统具有一定的可用性。