论文部分内容阅读
本文主要针对图像检索中文字信息内容获取及内容理解进行研究,分为两方面:版面分析和文字检测。重点讨论版面分析、文字检测的算法及其实现。
本文的版面分析主要针对以文字为主体的简单文档图像,采用自底向上的方法。即由像素点开始,根据各个游程形成BAG(BlockAdjacencyGraph)结点、BAG结点形成CNC(ConnectedComponents)结点、CNC结点形成TXT区域以及Image区域。在形成CNC结点时,根据汉字的结构特征,采用纵横向间距、重叠、偏移的方法,利用CNC结点合成汉字。实验结果表明该方法效果理想。