基于字幕的新闻事件检索应用研究

来源 :北方工业大学 | 被引量 : 2次 | 上传用户:ludongyan900209
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新闻视频是人们获取信息的主要媒体,但如何快速、准确地从海量的新闻视频数据中找到所需的内容成为一个迫切需要解决的问题。新闻视频中的字幕高度概述了相关的新闻事件,为新闻视频的检索提供了非常重要的语义信息,本文主要是利用新闻视频中的字幕对新闻视频的检索技术进行了研究,并实现了一个基于字幕的新闻事件检索原型系统,此系统主要具有两个功能模块:①新闻视频结构分析功能;②新闻事件检索功能。在新闻视频结构分析模块中,通过定位新闻视频中的特殊事件(如字幕事件、主持人镜头)将整段新闻视频分割成若干个独立的新闻事件,本文研究和分析了现有的字幕事件和主持人镜头检测方法,并提出了一种改进的字幕事件检测算法,同时实现了一种主持人镜头检测方法,实现结果表明了字幕事件检测算法的准确性和主持人镜头检测算法的有效性。在新闻事件检索模块中,提取和识别新闻事件中的字幕,然后将识别后的文本信息作为索引存入数据库便于用户检索。本文采用边缘检测和连通区域标定方法定位字幕区域,然后利用阈值分割方法提取字幕信息,最后利用汉王OCR软件对字幕进行识别。实验结果表明了算法具有较高的定位准确率,但识别率有待提高。如何改进字幕的分割算法是今后进一步研究的课题。
其他文献
在企业的经营管理中,牛产成本的控制和管理是非常重要的。物料清单(BOM)是成本篱理的基础,研究基于BOM的成本管理算法对于企业信息化有着重要意义。 在制造业中,分布最广泛的
随着社会的发展,交通问题日益突出,人们对智能交通系统投入了越来越多的关注,其中道路网模型作为智能交通系统的基础成为研究热点。目前,在大多数的研究中,道路网作为空间网
随着互联网的发展,WWW上信息的快速增长,WWW为人们提供了大量的信息,但也使得我们陷入一个矛盾,那就是一方面人们迫切地需要从Web上快速、有效地获取知识,另一方面是Web上信
构件化软件开发采用组装化的方式,大大提高了企业级应用软件的生产效率。本文以科研管理系统的研究开发为背景,采用面向构件的开发方法,将统一建模语言UML和体系结构描述语言
在嵌入式系统的研究早期,其关注重点主要集中在性能、可靠性和实时性等方面,近年来随着嵌入式系统的飞快发展,嵌入式系统的主频和集成度的提高,嵌入式设备尤其是移动嵌入式设
当今,随着互联网技术的飞速发展,电子形式的文档资源正以指数级的速度快速增长。面对如此庞大的电子信息,如何从海量的信息中抽取人们所需要的关键信息以及非结构化数据的结构化
随着计算机网络技术的迅速发展,Web技术正以其广泛性、交互性、快捷性和易用性等特点迅速风靡全球,并且已经渗入到社会的各个应用领域。在市场需求的推动下,应用软件的规模不
民航应急救援工作的主要依据是《国家处置民用航空器飞行事故应急预案》,应急预案是应急决策指挥平台和应急演练的核心,为应急救援的组织、协调、指挥做出快速反应和适当处置提
随着我国经济的快速发展,煤炭的需求越来越大,因此有效地对煤炭资源进行勘探就越来越具有重要的意义。测井是一种精确的物探手段,数据采集阶段是整个测井的基础,采集数据的精确度
市场竞争的日益加剧,使得企业使用各种手段来提高自己的知名度,同时降低经营成本。建立门户网站是企业扩大客户群体、为客户提供各种信息服务、树立产品知名度的一个有效手段