论文部分内容阅读
随着信息化的发展,用于信息存储的表格在人们的日常生活和工作中扮演着越来越重要的角色,它的形式多样,用途广泛。仅仅依靠现有技术识别表格内容无法有效体现表格本身半结构化的特点,可能丢失表格各部分信息之间的关联。同时表格结构及形式多种多样,如果方法不当,包括表格边框在内的其它信息反而会成为表格内容识别的干扰因素。本文通过强化反映表格结构的拓扑模型的作用,综合应用现有图像识别技术构建了高效的表格识别机制,能高效自适应识别海量异构表格。基于这一识别机制,本文设计并实现了相应的移动应用,在实际应用中验证了表格识