论文部分内容阅读
随着网络和多媒体技术的发展,数字视频信息呈现出爆炸式增长趋势,每天产生海量的视频多媒体数据,如何从中检索出用户感兴趣的视频数据,是当前计算机检索技术的热门方向之一。除传统的文本检索外,基于视觉信息的检索已成为计算机科学的重要研究课题。本文以新闻联播视频为研究对象,根据新闻联播视频本身特有的组织、结构和检索方法,通过视频图像的视觉特征(如颜色、纹理、局部特征点、NDK等)进行检索,并结合传统的文本检索,构建了基于视觉和文本的新闻联播视频检索系统。对新闻视频检索来说,故事的分割是整个过程中的重点和难点。本文在前人工作的基础上,将关键帧中主持人帧和字幕帧进行识别区分,再辅以音频信息检测作为故事分割的依据,大大提高了新闻故事分割的完整性和准确性,进而提高了新闻视频检索的可靠性和有效性。本文研究工作如下:(1)实现了新闻视频数据的网络获取。多媒体信息检索系统首先要有检索的数据,在对中国网络电视台(CNTV)后台数据进行分析后,通过IP地址解析,获取CNTV新闻视频数据的URL链接及该视频的id、日期等信息。(2)分析了关键帧提取方法。综合分析了当前已有的关键帧提取技术,选用适合新闻联播视频的关键帧提取方法。(3)提出了播音员帧、字幕帧结合静音点检测的新闻视频分割方法。对主持人帧、字幕帧进行了识别、提取,对静音点进行检测,并综合进行新闻视频的故事分割。(4)构建了新闻联播视频检索系统的检索平台。建立了新闻联播视频的检索平台,用户可以通过颜色、NDK、故事内容、文本、时间等对新闻视频进行检索。