基于最小生成树聚类的中文版面分割法

来源 :计算机工程 | 被引量 : 8次 | 上传用户:qzyss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对中文版面多横竖混排的特点,提出一种基于最小生成树聚类的版面分割方法。对原图像进行水平和垂直游程平滑,并对平滑后所得的连通域进行预分类处理,将文本进行横排、竖排分类。对预分类后的各类文本采用最小生成树聚类算法进行聚类处理。经实验,准确率达97%。实验表明,该方法对中文文档有良好的分割效果。
其他文献
针对石油钻井工程事故原因,例如钻井坍塌、井涌和井喷、钻具异常等,进行全方位的分析,并简要介绍了石油钻井工程特点,例如风险高、不确定因素多等,提出具体的应对策略,旨在为
Geotechnical tests conducted on clayey materials of Missole II, Douala sub-basin of Cameroon showed that these materials present: fines particles (55 to 78 wt.%
Hybrid-electric school buses became available in the US through a national consortium designed to bring hybrid-electric school buses to market by creating enoug
This paper describes a cooperative decentralized architecture for reactive real-time route guidance. The architecture is cooperative in the sense that it allows
目的分析真菌性外耳道炎的病原学特征,探讨氟康唑联合硝酸咪康唑的治疗效果。方法收集福建医科大学省立临床医学院115例(124耳)真菌性外耳道炎患者,统计其病原菌分布情况。按
以FCBR和AHP混合机制为基础构建一个面向产品概念设计的系统架构,该架构将模糊集原理应用于CBR,解决了概念设计时用户需求描述的不确定与不规范性问题,得到符合设计要求的评价模块集,应用AHP方法对评价案例集进行功能指标和经济指标上的评价,从而获得最合适的候选设计方案,通过调用功能改写案例库中的改写规则来修改候选案例得到最终优化方案。应用实例表明,在概念设计中使用该混合机制可以为用户提供有效的设计
Video based vehicle detection technology is an integral part of Intelligent Transportation System (ITS), due to its non-intrusiveness and comprehensive vehicle
霓虹是一种大气光学现象。中国古代对霓虹的观察和认识由来已久,秦汉以前的文献中就有很多记载。本文分析古代对霓虹的观察、描述、解释以及与之相关的民俗信仰、宗教仪式、
针对工作流管理系统的实现复杂性及模型可靠性的验证问题,提出了一种结合工作流网和ECA规则来创建工作流管理系统的方法。这种基于ECA规则的工作流描述和执行机制较好地实现
快递行业作为国家的基础性行业,随着电商的发展,近十多年来,呈现出爆发性增长的态势。2019年全国快递服务企业业务量同比增长25.3%;业务收入累计完成同比增长24.2%。选取一个