切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
半结构化文档中非标记化表格的抽取
半结构化文档中非标记化表格的抽取
来源 :计算机工程 | 被引量 : 0次 | 上传用户:wanshanshan1989
【摘 要】
:
对非标记化表格进行数据建模,利用非标记化表格在文档中的结构分布特征,给出了非标记化表格的抽取算法.对非标记化表格进行行列划分,然后进行标题归纳和单元格合并.实验结果
【作 者】
:
宋强
徐鹏
李涓子
【机 构】
:
清华大学计算机系
【出 处】
:
计算机工程
【发表日期】
:
2005年18期
【关键词】
:
非标记化表格
信息抽取
分层聚类
Untagged table
Information extraction
Hierarchical clustering
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对非标记化表格进行数据建模,利用非标记化表格在文档中的结构分布特征,给出了非标记化表格的抽取算法.对非标记化表格进行行列划分,然后进行标题归纳和单元格合并.实验结果表明,论文提出的算法的正确性令人满意.
其他文献
基于SCS的盲音频水印算法研究
结合音频水印的特点,提出了一种基于SCS的盲水印检测算法,该算法可以根据对水印性能的要求计算嵌入的参数,具有很高的实用价值.对时域和小波域上嵌入的水印在加噪声、MP3压缩
期刊
SCS
数字水印
盲水印检测
鲁棒性
SCS
Digital watermarking
Blind watermarking detection
Robu
基于SUIF自动产生具有OpenMP编译指示的并行程序
介绍了如何基于SUIF实现具有OpenMP编译指示的自动并行化工作,即利用SUIF系统所提供的遍(pass)、注释(annotation)和C抽象语法树等技术,通过对类Ctree的修改,把并行注释转化
期刊
SUIF
OPENMP
注释
抽象语法树
C抽象语法树
SUIF
OpenMP
Annotation
Abstract syntax tree
C abst
其他学术论文