基于深度学习法的视频文本区域定位与识别

来源 :哈尔滨理工大学学报 | 被引量 : 0次 | 上传用户:ltycongc2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过对视频图像进行快速、准确的文本定位与识别,有利于提高视频信息处理的效率与准确率.采用Gabor滤波器实现在横、竖、撇、捺四个方向上的视频图像的纹理特征的提取,再通过RBM逐层增量深度学习算法构建深度置信网络,实现对提取的纹理特征图像中文本区域的定位.论文同时研究了利用形态学处理方法和OCR字符库实现对视频图像文本识别的可行性,并分析了识别效果.测试结果表明,本文提出的深度学习算法与形态学字符识别方法相结合,不但能够实现对视频图像文本区域的准确定位,还有利于提高字符识别的效率和准确率.
其他文献
靖州杨梅产业在当地实施乡村振兴战略和精准脱贫攻坚中,发挥着重要作用。由于杨梅极不耐贮藏,采后保鲜问题成为制约产业发展的"瓶颈"。采用高效、安全的天然防腐保鲜剂,对延
本文旨在研究高中英语教师语用身份的话语构建,采用个案研究的方式,选择高中英语教师Lucy作为研究对象,通过课堂录音,课堂观察,半结构式访谈收集语料。采用陈新仁(2013)提出
水土保持生态建设工程项目的管理现已纳入国家基本建设管理程序,对水土保持项目进行经济评价以前主要根据<水土保持综合治理效益计算方法>(GB/T15774-1995)中的规定计算经济
词汇在二语习得过程中占有举足轻重的地位。英国语言学家Wilkins(1972)曾指出没有语法,表达甚微;没有词汇,表达为零。如今词汇教学越来越受教师们的重视,然而词汇教学效果不
目的放血疗法结合藏药二十五味余甘子丸治疗高血压病的临床分析。方法从2017年1月至2017年12月取材并开展本次研究,所选取高血压病患者116例,抽取58例患者使用传统方法治疗,
本文介绍了工业邻甲苯胺的反相高效液相色谱分析新方法,试验得出最佳色谱条件,该方法具有较好精密度和准确度,通过对样品测试,结果满意。
政治经济学批判是深入理解和阐释马克思辩证法总体性特质的重要视角。政治经济学批判与总体性辩证法的互释关系表明,马克思对于资本主义生产方式及其社会结构的批判是一种总
<正>你的骑行方式属于哪一种?周末兜风、巡游,或者郊区探险,在家的附近兜兜转转,品味"探险"、"旅行"的感觉?走得更远点儿,利用假期来探索新的旅途,在假期结束时再赶回上班?又
摘 要:钢琴即兴伴奏在实际教学中和生活应用方面有着独具特色的音乐魅力,这样便于演奏的技能,在现实中被广泛应用着。无论是音乐爱好者或是音乐工作者,都有着较强的实用性。在音乐教学中利用即兴伴奏的便捷性及实用性,无论针对何种人群的音乐教学,尤其针对目前一对一的音乐教学模式,都能大幅度的提高教学效率及质量,这是即兴伴奏比较独具音乐教学魅力。这充分说明了即兴伴奏的最常用性,所以音乐学习及教学中,即兴伴奏是不
在建筑工程地基概念的基础上,为保证建筑物的正常使用寿命和安全性,并为施工提供可靠的沉降参数,对建筑工程桩基测量与分析进行论述,探讨了高层建筑沉降测量技术的应用,指出沉降技术对于确保建筑物在施工期间和投入运营后的安全以指导实际测量工作,保证建筑工程质量目标的顺利实现。