论文部分内容阅读
普通文档图像中表格版面结构的定位与分析是文档图像分析系统的重要部分.由于表格结构本身的复杂性等原因,表格结构的定位与分析一直是一个难点.要使表格版面结构的定位与分析能在实际的文档图像分析系统中得到应用,性能评测是其必要的保障.评测系统通过比较实际系统的分析结果与理想的评测标准来评价系统的性能.这里的评测标准不仅是表格结构定位与分析的正确结果,而且是自动比较的基准,所以确定评测标准非常重要.评测系统可以采用不同的方法来进行结果的比较.该文将讨论一种新的方法,通过表格结构中线条交点的比较来得到系统评测的结果.评测的内容包括确定评测参数,定量地评价系统的性能,并为系统的改进提供有效的数据.最后,以南开大学机器智能所OCR软件中的识别工具包RTK6.0作为实际的表格结构定位与分析系统,并选取152页样张作为测试集,进行系统性能的评测实验,结果表明评测方法是有效的.