网络视频字幕提取识别系统的设计与实现

被引量 : 3次 | 上传用户:l309553042
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网服务和网络基础设施的飞速发展,网络视频服务越来越便利,网络上的视频内容越来越丰富,对这些视频进行监控和检索变的更加必要。在传统的基于标题和标签的方法并不能准确的反映视频内容的情况下,理解视频内容成为了更好的选择。其中视频字幕与视频语义有着较强的相关性,获取视频字幕能够对视频内容进行更加深入的检索与监控。视频字幕指视频中出现的人工添加的文字信息,这些文字通常包含了视频中的人物对话,内容总结等重要内容,能够准确的反映视频的含义。但是,网络视频中的分辨率通常较低,字幕文本都嵌入在杂乱的背景中,无法直接进行OCR识别。为解决这一问题,作者独立设计并实现了网络视频的字幕提取与识别系统,利用计算机图像处理的知识,将嵌入视频的字幕提取并转化成文本格式。系统主要包含字幕的定位与追踪、字幕的增强与二值化、文字识别三个模块。字幕的提取模块将提取过程分解为定位与追踪两个步骤。其中定位步骤用以确定字幕在视频中首次出现,系统利用文本独特的几何特征,采用了基于笔画宽度变换的文本检测方法确定字幕在图像帧中的位置。追踪过程则通过对比两帧字幕区域图像的相似度,跟踪字幕在视频中的停留与消失,追踪的过程有效的减少了字幕定位的次数,并提高了字幕提取的精确度。字幕的增强与二值化模块充分利用了字幕在时间上的冗余性,将追踪后得到的字幕图像进行多帧融合,以达到增强文本,弱化背景的目的。然后系统利用Otsu算法对融合后得到图像进行二值化,将文字从背景中提取出来,得到可以通过OCR技术识别的二值化图像。文字识别模块设计并实现了汉字的识别功能,系统提取了汉字的多种特征,并将这些特征综合利用,融合各个特征的特点,设计并实现了一个多级的分类系统用以汉字识别。经过验证,文字识别模块取得了较好的效果。最终经过实验验证,系统能够较为准确的将视频中的字幕提取并转化为文本文件,并达到了令人满意的识别率。
其他文献
能源短缺和近几年愈发严重的环境污染,使得新能源汽车成为国内外研究的热点,其中燃料电池汽车用氢作燃料,与空气中的氧气发生电化学反应,产生电能来驱动汽车,反应物为水,被认为是当
<正> 很多国家在环境保护法规中规定了对某一违反环境保护法规的行为,除直接处罚违法犯罪的行为人外,还对并非是传统意义上的"共犯"的企业或其他人员加以处罚.这与过去法律理
项目成本的施工阶段的控制工作不仅仅需要加强对工程的质量控制,还需要依据一定的控制标准进行综合性的控制,因此,应认证的对施工过程汇总存在的成本及西宁分析,把握工程正给
根据大学生适应性量表(College Adjustment Scales)和人际信任量表(ITS)设计出的大学生的大学生活问卷,对沈北大学城中124名大一至大四年级的在校本科生进行了调查。统计分析
在国家农业部指定的20种恶性入侵植物中,海南分布记载有11种,本文全面核实了11种恶性入侵植物飞机草(Chromolaena odorata)、假臭草(Praxelis clematidea)、含羞草Mimosa p
高校生活污水排放的规律性较强,污水量及水中污染物浓度的波动均较小,为了研究出一种适合校园生活污水处理的工艺,总结了近年来校园生活污水的处理方法,以及各种技术的优缺点
<正>英语课堂教学评价是指在英语课堂教学过程中教师对学生在学习英语语言、参与语言活动时的表现加以评点,并给予必要的纠错或引导。在新课程改革中,课堂教学评价有了翻天覆
蒸压加气混凝土可利用工业粉煤灰进行生产,是一种替代粘土实心砖、粘土空心砖的新型墙体材料。本文基于建设资源节约型社会、发展循环经济的要求,通过对宝鸡市新型建材行业的
在能源和环境问题日益突出的今天,混合动力汽车凭借其排放低、燃油经济性好等优点,得到了越来越多的重视。电驱动及其控制系统是混合动力汽车的关键技术之一,本文通过分析几种典
<正>经济学家考什克·巴苏曾说过:"一个经济体的成败取决于多种变数,其中往往被忽视的是那些方便企业和营商的细节。"营造公平高效、诚实守信、民主法治、稳定有序并且可预期