基于版面特征的文档图像的文本定位方法

来源 :2008年中国信息技术与应用学术论坛 | 被引量 : 0次 | 上传用户:toerrisme
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文档图像分析处理过程中,文本定位技术十分必要。本文介绍了一般图像的文本定位技术,并针对基于版面特征的文档图像提出了一种文本定位方法。该方法首先利用拉普拉斯算子粗略检测出文字边缘区域,利用形态学膨胀方法扩展区域,接着通过聚类分析来提取文本层,最后根据中文字符的自身矩形区域比例、宽高比等特征有效定位出图像中的文本区域。对超过100幅图文混合文档图像进行实验,均获得较满意结果。实验发现定位的准确率与边缘检测、切分、聚类分析等处理工作效果关系很大。文本区域的准确定位将有利于提高图文混合文档图像的检索效率。
其他文献
本文针对钢筋混凝土框架结构体系的梁柱节点箍筋施工、钢筋混凝土强度等级、保护层厚度等方面的常见质量问题,通过在工程中的实际应用,探讨钢筋混凝土框架结构施工技术中应注意
随着互联网信息及电子资源的急剧膨胀,文本分类技术成为信息组织与管理的有效手段。本文提出了一种多分类器融合的文本分类技术,通过引入可信度函数,选择出主分类器较难判决的文
本文提出一种基于混合的IGA和PSO的聚类方法,在IGA算法中利用基因重组技术,使其比一般的GA算法更好。本文关键是为充分利用IGA和PSO两者对于不同问题的优势,一种相互交换使用IGA
信息沟通是企业组织内的成员通过正式或非正式的方式实现的信息传递和交流.信息沟通在企业管理中有着举足轻重的作用,可以说没有沟通就没有管理,企业管理部门的管理活动必须
期刊
本着开发低成本、高效率检测系统的目标,本文利用机器视觉和数字图像处理技术的结合来对玻璃生产线上的缺陷进行检测,并且进行了开发检测系统的前期试验工作,取得了初步成果,为检
用户的查询翻译是跨语言信息检索的一个非常重要的任务,翻译结果的准确性直接影响检索结果的查准率和查全率。本文提出了三种方法以解决跨语言信息检索中查询翻译的歧义问题。
会议
本文介绍了Agent技术以及它所具有的特点,比较了远程教育与传统教育,介绍了各自的优势与不足,并从教学媒体、学习模式以及学习内容三个维度对混合学习进行了分析,探讨了将Agent技
工程项目成本管理,是项目实现目标利润的途径.加强项目成本管理,要增强项目成本管理意识,完善相关措施;资源配置的优化和施工技术方案的优化:加强物资、机械设备的管理;加强质
门户为内部和外部用户访问Web站点的信息和应用提供了一个单一的访问入口,一个Portlet是门户中提供特殊服务或信息的窗口。本文讨论了Portlet和开源门户框架软件Gridsphere的
自1946年美国正式成立第一家私募股权投资公司--“美国研究与发展公司”(ARD)开始,私募股权(PE,Private Equity)市场的发展经历了60余年.发达国家的经验充分表明,作为金融创