基于机器学习的视频中的数字时钟识读的研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:betterfo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
识读视频中的数字时钟是一个重要的应用问题,在智能监控、娱乐等领域有着重要的应用价值。文献中已有算法可以很好地识读视频中的数字时钟,但是这样的算法还存在两方面的问题。其一是这些算法以启发式方法为主,没有利用强有力的机器学习方法。其二是这些算法有一批参数需要手动调整。针对这两方面的问题,本文提出全面使用机器学习方法完成时钟的定位和时钟数字识别。本文是首次研究无识别的机器学习定位方法。其思想如下:与传统方法不同的是,在定位阶段,先根据秒像素点灰度值变化的周期性快速定位到秒像素的数字位置,且首次引入了机器学习的思想解决此问题,更具有智能性。其次,考虑了数字时钟通常有稳定的背景,及时钟不同数字的前景、背景的颜色不同,快速定位到时钟的时、分区域,先利用机器学习区分颜色,进而采用机器学习进行图像分割,但因为利用了颜色信息,效率更高。时钟识读阶段,本研究主要采用了卷积神经网络,在单个数字识别上,取得了比CRF更高的效率,且降低了对字体等因素的依赖。因秒数字具有周期性的系列特点,本研究也系列识别上作了一定探讨,用来矫正单个数字识别的错误。最后,本研究也在如何借鉴先前的启发式函数的成果经验,如何用机器学习的方法针对具体问题设计适合的网络结构,及模拟启发式函数上,做了一定探讨。
其他文献
人脸识别是一项挑战性的研究课题,以致得到了诸多不同学科领域研究人员的青睐。人脸识别技术广泛运用到国家公共安全、社会安全及商业等领域,如公安刑侦破案、监控、信息安全
蚂蚁个体智能十分低下,但整个蚁群却拥有惊人的智能,能够完成远远超出蚂蚁个体能力的复杂任务。通过对蚂蚁社会性行为的观察发现,蚁群通过一种媒介质机制来协调蚂蚁个体的行为,使
双语语料库的构建在自然语言处理、机器翻译、数据挖掘、词典编纂、多语言信息检索等领域具有重要的应用价值。当今互联网上存在大量双语互译文本,通过对互译文本的处理,建立实
基于数字高程模型DEM的数字地形分析已成为地理信息系统GIS的重要组成部分,广泛应用于测绘、遥感、城市规划、军事作战等各个方面,其中的特征地形要素分析研究尤为活跃。  
随着Web信息技术的不断发展,网络信息采集技术也日趋完善,作为许多Web信息服务的基础及重要组成部分,它被广泛的应用于搜索引擎、机器翻译等自然语言处理的各个方面。面对互联网
随着计算机与网络技术、移动通信技术及移动嵌入式技术的发展,移动计算技术已逐渐将人们从具有时空局限性的、传统的桌面计算中解放出来,使得人们能够以更为自然、本能的方式
随着NAND闪存智能移动终端的广泛应用,NAND(?)闪存上的数据恢复技术也日益彰显其重要性。与传统的磁存储器相比,NAND闪存一方面在硬件上具有耐擦写次数低且不支持原地擦写的
随着科技的不断发展,领域文献和术语词典不断累积,将非结构化的领域文献转变为结构化的知识库日益成为知识工程的研究重点。然而,现阶段特定领域知识库构建往往缺乏相应的信
在过去的几十年,神经网络的动力学分析因其重要的理论和实际意义,受到了各领域学者和专家的广泛关注。神经网络有着广泛的应用背景,与计算机、数字网络、嵌入式系统、以及人工智
近年来,随着信息技术的快速发展并逐渐运用于军事领域,计算机信息化管理对征兵工作起到了极大的推动作用。现行的以单纯的计算机管理和传统的手工管理相结合的工作模式,已经很难