基于屏幕显示的非文本文字的文本化技术研究

来源 :山东理工大学 | 被引量 : 0次 | 上传用户:kevin_dai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着教育信息化工程在全国范围内的迅速推进,迈进信息化大门的教育系统对信息的需求是惊人的,特别是一线教师有了更广阔的学习资源和交流空间,而这些信息主要以网页、电子书、数码相机拍摄下来的图片资料、视频等形式存在。  在详细研究字符识别和获取屏幕图像的基础上,开发并设计了这套基于屏幕的文字识别系统。主要研究如下:  其一,本文利用图像识别技术对采集到的文字图像进行识别,它不仅可以处理磁盘中已经存在的图像,还可以实时的抓取看到的有用的文字图像,然后再根据字符识别的需要,系统在对获取的图像经过二值化、字符切分、归一化等处理后,主要使用网格特征和交叉点特征相结合进行特征提取,并建立相应的字符标准特征库。  其二,对于干扰较多、字号不同以及中英文混排的情况下引起的不能准确分割字符等问题,提出了一种改进方法:基于字符周期及识别反馈文字分割方法。在此方法中,对于行与行之间出现污点等干扰情况,采用了基于连通区域合并的行切分算法,从而更为准确的完成了文本图像的行分割;对于长标点、宽标点等干扰,采用了基于字符间距周期的字符分割算法,成功实现了对连通区域类型的判定,对于左右结构的文字则采用基于识别的字符部件合并算法。实验证实,该方法的字符分割准确率优于传统的基于投影的分割算法。  最后,设计开发了一个通用性较强的字符识别软件框架,还增加了抓图功能,让使用者可以随时把喜欢的内容捕抓下来进行识别。
其他文献
在开放、动态的网络环境中,分布式软件呈现出规模庞大、松散聚合、行为复杂等特点,分布式软件自身的特点、复杂多变的网络环境以及用户需求的不断更变,需要对其进行动态的适
二元关系框架被证明可以应用在许多日常生活偏好关系处理中。本文提出使用二元关系框架来表示偏好的方法。这里的偏好指的是严格偏序的二元关系。偏好框架可以表示有限偏好关