基于深度学习的视频文字检测技术

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:asfdasdfasd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的飞速发展,计算机视觉内各个分支领域获得突破性进展,特别在图像检测,目标跟踪方向,结合卷积神经网络的图像特征提取能力,已经获得了优异的成绩,在文字识别提取方向,深度学习与传统图像分析的结合使用使得图像语义分析方向也有很大进展。本论文中设计了一套完整的视频文字识别的架构,结合图像文字检测技术,视频关键帧提取技术以及多语言文字识别技术,实现了视频内部自然场景及人工添加文本的提取与识别。其中,文字检测技术采用了YOLO与PixelLink相结合的方法,两者原理可以互补,对检测性能略有提升,另外,视频关键帧处理技术中使用了文字区域作为关注重点,结合聚类算法与像素点等逻辑对帧画面的重复信息进行压缩筛选。最终,利用卷积循环神经网络实现对中文,英文,数字等字符的识别功能。在分别验证完各个模块的功能以后,结合了三个模块,实现了视频内文字的识别功能。
其他文献
近年来银行理财产品业发展越来越快,产品层出不穷,受到广大投资者的关注。本文对商业银行理财产品信息披露问题进行了探讨,主要分为三部分,第一部分介绍了理财产品及其信息披
本文论述了DGPS改正数据的下述三种方法:一是DGPS数据链;二是无线电信标台;三是静止地球轨道(GEO)卫星。
采用2,6-二氯酚靛酚滴定法对北方地区常见的27种水果、蔬菜中所含维生素C的量进行测定。结果表明,所测水果中枣的维生素C含量最高,其次为猕猴桃、山楂、草莓、橙子、葡萄、芒
目的探讨循证护理在神经外科重型颅脑损伤患者中的应用效果。方法选择2008年6月-2010年6月230例重型颅脑损伤患者,随机分为实验组121例和对照组109例。对照组采用传统护理方
作为关中文化开头的两大篇章,“周”与“秦”已经转化为关中隐型文化中的互补结构,其“抑商”本色在“汉唐文化”中也表现得十分鲜明。以“抑商”为底色和以“周秦互补结构”为
在研究黄铜矿和磁黄铁矿性质的基础上,着重研究了采用混合—分离浮选和优先浮选分离铜硫时亚硫酸钠的作用。研究认为在一定的条件下,亚硫酸钠既可活化被抑制的黄铜矿,又可抑
对井下加油车进行了详细地介绍,对装油和加油作业提出了正确操作方法及注意事项,提出了对井下加油车的油罐和过滤器清洗及油泵维护的正确方法。
通过对高垄+覆膜、高垄+不覆膜、高垄+覆盖秸秆、常规垄+覆膜等4种烟草栽培方式的大区比较试验,结果表明:通过株高、茎围、最大叶面积大小等各农艺性状比较,团棵期前高垄比常
环境规制与国际贸易的关系是近年较有争议的话题,本文利用江苏省1990—2011年的时间序列数据,以人均收入作为江苏省环境规制强度的替代变量,以经营单位的出口总额作为出口贸