图像中多语种文本提取的高斯混合建模方法

来源 :计算机研究与发展 | 被引量 : 8次 | 上传用户:xeabor1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
建立了相邻字符区域的高斯混合模型,用于区分字符与非字符.在此基础上,提出了一种从图像中提取多语种文本的方法.首先对输入图像进行二值化,并执行形态学闭运算,使二值图像中每个字符成为一个单独的连通成分.然后根据各连通成分重心的Voronoi区域,形成连通成分之间的邻接关系;最后在贝叶斯框架下,基于相邻字符区域的高斯混合模型计算相应的伪概率,以此为判据将每个连通成分标注为字符或非字符.利用所提出的文本提取方法,进行了复杂中英文文本的提取实验,获得大于97%的准确率和大于80%的召回率,证实了方法的有效性.
其他文献
数据库管理技术已深入人心,但在数据库应用过程中,一些应用技术任常常被人忽略,或不能熟练的应用于系统之中。正确使用触发器可以使系统数据保持一致,也可以实现更高级的数据库应
简要介绍了在模具制造中应用较多的三种表面处理技术,重点介绍了几种表面处理新技术,并就表面处理新技术在模具制造中的应用前景进行了展望。
计算进入了多核时代,处理器的发展不再由更快的主频带动,而是依靠增加片上的多个核心.但是,对于高性能应用来说,多核平台的并行处理由于缺少适合的并行程序开发工具还处于初
串空间是安全协议的一种形式化描述,串空间图是它的图示化表示.定义开丛为串空间图的构造单元,并在开丛集上定义前缀算子和组合算子.通过开丛之间的前缀和组合运算,给出了无穷并发
为了使收录各种会议期刊论文的孤立的数据源能够更好地实现资源共享,设计并实现了面向学术领域的Web引文资源整合系统.用户通过系统提供的统一接口,获得各数据源的集成查询结
The development of economic globalization has granted people more opportunities for crosscultural exchanges,and therefore,the demand for English language talent
With the continuous development of national‘reforms and opening-up’policy and development of economic globalization,learning and application of foreign langua
本文首先从公允价值的定义入手,分析比较了我国财政部与其他国外组织、国家对公允价值的理解,回顾了公允价值在我国企业会计准则中的运用历程。本文重点对如何完善公允价值在
以传输触发体系结构(TTA)为基础,为支持大数运算扩展寄存器堆,并增加模乘单元以加速模乘操作,提出一种ECC整体算法处理器.该处理器具有如下特点: ①利用TTA工具链可快速开发