论文部分内容阅读
随着科学技术的发展,计算机网络成为人们生活中的重要组成因素,互联网上以图像、动画、视频等多媒体信息为主的信息表现方式成为主流。字幕作为视频中重要的组成部分,通常用来帮助视频观看者理解视频内容。字幕中包含大量视频深层次信息,是进行视频内容检索、视频分析的重要依据。从视频字幕中提取关键词,可以对视频字幕重点信息做出标引,进而基于标引实现对视频内容的检索。在视频字幕提取部分,本文提出一种基于FAST角点检测算法的快速字幕定位方法,对视频字幕进行定位提取。该方法首先采用改进的FAST角点检测算法进行角点检测。然后在角点图上采用水平积分投影法定位字幕行信息,采用局部形态学处理与垂直积分投影结合的方法定位字幕列信息,两者结合得到字幕候选位置。最后使用启发性规则进行验证,得到最终字幕位置。在字幕关键词提取部分,本文提出一种改进的TF-IDF算法——BC-TF-IDF算法对字幕关键词进行提取。该算法在TF-IDF算法的基础上,提出使用词性系数、标题系数与TF-IDF权值相结合的方式计算关键词特征值,提高了字幕关键词提取的准确率。在自定义检索部分,本文提出一种改进的Sunday算法——WSunday算法实现关键词字符串的匹配检索。在WSunday算法中当前字符串字符如果不匹配模式串字符,但并非坏字符时,向前查找该字符在模式串中出现的位置,并比较其左侧或右侧字符,以此为依据移动模式窗口,加大模式窗口移动距离,减少匹配的次数,提高匹配效率。本文应用以上方法开发了网络视频字幕关键词提取与检索系统。该系统包括字幕提取模块,字幕关键词提取模块,字幕关键词存储模块,字幕关键词检索模块。实验结果表明,网络视频字幕中关键词的提取效果良好,以字幕关键词对视频进行检索效率很高。