文本线局部极值区域两阶段场景文本序列识别

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:mingge911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提高场景文本识别算法的计算效率和精度,提出基于文本线局部极值区域两阶段场景文本序列识别方法。首先,利用特征计算对每个构建的极值区域字符进行概率计算,并选取局部最大概率特征作为第一阶段的输出和第二阶段的输入。其次,利用高效的聚类算法将极值区域字符进行文本线处理,利用字符区域的标签以及OCR分类器进行字体合成,在上下文中的每个字符的文本线已知的情况下,可实现最有可能字符序列的快速选取。最后,通过在USTB-SVIK数据库对多方向文本的仿真测试,验证了算法在计算效率和计算精度上的优势。
其他文献
从海量数据中进行近似数据的检索是数据挖掘领域许多应用的关键。尤其近年来,数据的规模出现爆炸式增长,数据检索需面对海量数据和“维度灾难”的叠加考验,这使得传统最近邻
69例鼻咽癌初治患者,36例采用常规外照射放疗,33例采用三维适形调强放疗(IMRT)。结果常规放疗组3a生存率、3a局部控制率为81.9%、77.8%,IMRT组分别为88.6%、82.4%,P均〈0.05。常规放疗组近期
为提高项目调度优化过程的合理性,引入一种新的项目调度优化应对冲突的方法,一旦冲突发生在调度方案中,不是重新定义项目的开始时间,而是对冲突的时间调度表进行状态的迁移,
当似乎梦想照进现实之时,许多问题却是我们不得不警醒的。    央行终于松口了。  8月15日,央行首次表态:建议给民间借贷合法定位,并适时推出《放贷人条例》。这给民间借贷的参与者们打了一针强心剂。一旦《借贷人条例》推出,那民间借贷就不再是“不鼓励、不提倡”的地下行为,可以光明正大地纳入商业领域。而在此之前,新金融体系下的中国民间借贷已经为此奋斗了许多年。    目的双赢    “应加快我国有关非吸
传统制造业,该通过什么途径实现产业升级,一直是个备受争论的话题。  而唯美的实践告诉我们:以文化创新提升传统产业的价值大有可为。    危机下的珠三角制造业    在金融危机发生前的十余年,珠三角众多的民营制造业企业,都在以平均20%以上的增长率快速发展,可以说日子过得非常滋润。以至于几年前,广东省提出推进产业升级转型新政时,招致了许多企业的非议。因为这改变了中小制造业习惯的发展模式,并影响到了一