基于.NET的Web信息抽取系统关键技术研究

来源 :软件导刊 | 被引量 : 0次 | 上传用户:huangxiaojuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web信息抽取的研究和发展,抽取技术已经逐渐成熟,通过软件来实现从Web页中抽取所需要的信息已成为可能。对基于.NET技术实现的Web信息抽取系统进行了研究,分析并提出了HTML文档下载和清理、HTML到XML格式转换、数据定位及抽取、抽取数据的保存等需要研究解决的关键技术问题,并探讨了相应的解决方案。
其他文献
以模糊ISODATA方法为基点,结合语音识别技术的优点,设计了基于语音识别的学生信息系统。提高了学生信息录入的效率与精确率,为语音识别技术的应用及其它领域信息系统的构建提供
伴随社会经济的迅速发展,人民生活水平得到快速提升。人民生活水平提升的同时,周围各种城市基础设施建设也得到快速发展。其中最显著的便是城市桥梁,近年来,许多桥梁拔地而起
把刚和好的面团制成各种形状,如鲜面条、饺子皮、馄饨皮等叫做鲜切面,随着人们食用需求,适于做鲜切面的面粉需求量越来越大。有的面粉生产厂家和经销商干脆把这类面粉贴切地称为
谷朊粉是面粉深加工的一种高蛋白产品,有较高的附加值。谷朊粉干燥技术在国内还有很大的发展空间。在工艺布置、设备选型方面还需进行合理的完善,谷朊粉烘干的产量、能耗、安全
期刊
将青霉素菌渣在400~700℃进行热解,研究了产物中热解炭、热解油及气体的产率,以及热解油的组成变化。实验结果表明:600℃时热解油产率最高,随着温度升高,热解炭的产率降低,气
将Web2.0理论引入专题学习网站构建领域,依据专题学习网站的教育特性,找出应用Web2.0理念在构建专题学习网站方面的契合点。Web2.0理念和技术运用于专题学习网站的构建可以有
企业核心竞争力是一个企业保持持续竞争优势的源泉,是企业生存和发展的关键,山东省洪丰面粉有限公司着力于培育、维护和提升企业的核心竞争力,为保持在市场竞争中持续的优势,不断
环境监测报告制度计算机支持系统的主要功能是环境监测原始数据纳入计算机管理,对各种原始信息进行统计、评价、分析,制作各种环境质量报告书及声像报告书,为环境科学管理提
测试元模型在模型驱动的测试中居于核心地位,在测试过程中保证测试元模型能够被正确地存储与读取是非常重要的。借助于JUnit这一通用测试框架,对测试元模型的存储与读取功能进