半结构化文档中非标记化表格的抽取

来源 :计算机工程 | 被引量 : 0次 | 上传用户:wanshanshan1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对非标记化表格进行数据建模,利用非标记化表格在文档中的结构分布特征,给出了非标记化表格的抽取算法.对非标记化表格进行行列划分,然后进行标题归纳和单元格合并.实验结果表明,论文提出的算法的正确性令人满意.
其他文献
结合音频水印的特点,提出了一种基于SCS的盲水印检测算法,该算法可以根据对水印性能的要求计算嵌入的参数,具有很高的实用价值.对时域和小波域上嵌入的水印在加噪声、MP3压缩
介绍了如何基于SUIF实现具有OpenMP编译指示的自动并行化工作,即利用SUIF系统所提供的遍(pass)、注释(annotation)和C抽象语法树等技术,通过对类Ctree的修改,把并行注释转化