论文部分内容阅读
在文档图像分析处理过程中,文本定位技术十分必要。本文介绍了一般图像的文本定位技术,并针对基于版面特征的文档图像提出了一种文本定位方法。该方法首先利用拉普拉斯算子粗略检测出文字边缘区域,利用形态学膨胀方法扩展区域,接着通过聚类分析来提取文本层,最后根据中文字符的自身矩形区域比例、宽高比等特征有效定位出图像中的文本区域。对超过100幅图文混合文档图像进行实验,均获得较满意结果。实验发现定位的准确率与边缘检测、切分、聚类分析等处理工作效果关系很大。文本区域的准确定位将有利于提高图文混合文档图像的检索效率。