Web表格信息抽取模型的设计与实现

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:xichblueagle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web表格作为一种简洁有效的数据信息表达方式,已广泛应用于Web页面中。现提出一种基于表格结构的Web表格信息抽取模型,该模型主要有表格定位模块、表格结构预处理模块和表格信息抽取与重构模块三个模块组成,根据Web表格的结构标记和自定义的启发式规则来抽取表格信息。实验结果表明该模型能够很好地应用于Web表格信息的抽取。
其他文献
语言是文化的一部分,是文化的载体,没有语言,就没有文化;语言又受文化的影响,反映文化。语言与文化的这种密切关系就要求在外语教学中实施文化教学。实施文化教学要以社会建
目的:了解鼠类群落结构变化及其原因,便于调整防制对策。方法:定期按房屋类型各类生收集鼠体、分类鉴定、结果:无论居民区还是特殊行业,鼠类群落结构10年来逐渐演变为褐家鼠占优势,尤
介绍了膜浓缩(Membrane Brine Concentrator-MBC)零排放技术在长兴电厂脱硫废水深度处理项目中的应用情况.系统可将22m3/h含盐水浓缩至1.5-2m3/h,盐分浓缩至200g/L左右后,进
网络谣言是网络信息传播影响的一类特殊的集群行为,网络谣言的传播过程实则是一个群体事件的演变过程。文章以社会学的价值累加理论为基础,分析网络谣言传播的动力机制:结构
习近平总书记在全国高校思想政治工作会议上的重要讲话是党中央治国理政新理念新思想新战略的重要组成部分。习近平总书记充分阐述了高校思想政治工作的新理念新思想新战略,
胡桃楸是东北地区重要的用材树种和经济树种之一,为了更好地保护和利用已经比较匮乏的胡桃楸资源,对胡桃楸占比较高的天然林进行科学的改造和经营,把胡桃楸天然次生林培育成
本研究结合实践教学,基于PCK探讨学前教育专业学生实践能力培养问题。在实践教学中,通过引导学生重点研究相关问题,指导学生有意识地运用相关的领域教学知识PCK,以便较好地激
根据近五年来福州市刑事犯罪活动的特点和规律,可以合理地预测今后刑事犯罪发展的趋势.应从经济社会全面协调发展的角度加以分析,并按照科学发展观的要求树立正确的政绩观,逐
利用GC-MS联用法对龙须草Eulaliopsis binata化学成分进行了研究。在最佳分析条件下,共分离鉴定出了38种化学成分,主要成分为:有机酸及其酯、萜烯类及甾族等化合物,并进行了
微信自2011年诞生后,迄今已发展成最为成功的自媒体。关于微信发展为何如此迅速、为何如此成功、有何危机、未来发展趋势如何等问题,也成为社会各界最关注的命题。本文从经济