文档理解相关论文
随着数字图书馆和跨媒体出版的高速发展,使得出版领域的数字资产具有新的生存价值和周期。为了方便地管理、存储、检索、利用、交易......
电子病历正在全国普及和发展,电子病历的信息量也在以惊人的速度迅猛增长,对其半结构化病历文档进行信息抽取具有十分重要意义。本文......
文档理解的研究内容十分广泛,其研究领域主要涉及图象处理、图象分析、计算机视觉、模式识别等诸多领域.随着信息系统的广泛应用?......
借鉴向量空间模型(VSM),将文档的单元结构映射到特征向量,并对其进行归一化和加权处理,再计算标准文档结构分类特征向量和待查文档单......
针对基于VSM的文档排版格式检查算法中,段落无法同时与多个逻辑标签对比,段落逻辑标签判断正确率召回率较低的问题。在原VSM算法的基......
结合文档内容理解、文档的分类、文档格式的检查与纠错、文档的互操作以及文档的智能处理等多种关键应用领域,讨论了文档格式信息......
文档图像理解中最重要的部分是逻辑结构的提取。目前的研究主要集中在页面的布局分析上,少数对文档逻辑结构的研究只是针对单页文......
本文介绍了英文标书文档处理系统VHTender的设计和实现过程,该系统能够从纸质标书的扫描图象中抽取文档信息将其转换成电子标书。......
在数字图书馆建设中,一个急需解决的问题是如何自动化地将海量的纸张图书数字化为电子文档,对于生成图书电子文档而言。除了文档内容......
在数字图书馆建设中,一个急需解决的问题是如何自动化地将海量的纸张图书数字化为电子文档。对于生成图书电子文档而言,除了文档内......