基于本体的HTML表格识别技术的研究

来源 :长春工程学院学报:自然科学版 | 被引量 : 0次 | 上传用户:jsrlzxd111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于HTML只描述数据怎样显示而不描述数据的内容,因此识别HTML表格并抽取其数据是Web信息抽取领域中重要的研究课题之一,针对现在包装器技术的不足提出了一种新的基于领域本体的HTML表格结构识别技术,为构造HTML表格信息抽取系统打下基础。
其他文献
幽门螺杆菌(Helicobacterpylori,HP)感染是世界范围广泛存在且最常见的细菌感染,儿童也未能幸免。随着幽门螺杆菌的深入研究,儿童HP感染越来越受到广泛的关注。我院2006年1月~2009
中国共产党第十八次全国代表大会提出反腐倡廉的目标和要求以来,廉政建设已成为中国社会的热点。实行廉政需要法制建设的支撑。互联网作为当代信息媒体的重要载体,已成为信息
新源监狱管辖有3333公顷土地.但50%以上是盐碱地,除了适宜种植水稻外,就是甜菜的适应性要强一点,经济效益也较为客观.通过科学合理管理,也可获得较高产量。特别是通过水稻、油葵、小
随着外科手术的不断发展,术中电外科产品如:高频电刀、氩气刀、双极电凝等的使用越来越广泛,若这些电外科产品使用保护不当,均可造成病人、工作人员烧伤。为了安全使用电外科
形而上者谓之道,形而下者谓之器。中国传统文化中的观点在审视当今社会发展的过程中具有显著的理论价值和实践价值,“道与器”的观点是矛盾对立统一的关系,是理论和实践的关
利用扩增片段长度多态性(Amplified fragment length polymorphism,AFLP)标记技术对桃[Prunus persica (L.) Batsch]红肉材料及其F1代共41份种质材料进行了DNA多态性分析,从64对(E