基于.NET的Web信息抽取系统关键技术研究

来源 :软件导刊 | 被引量 : 0次 | 上传用户：huangxiaojuan

【摘要】

：

随着Web信息抽取的研究和发展,抽取技术已经逐渐成熟,通过软件来实现从Web页中抽取所需要的信息已成为可能。对基于.NET技术实现的Web信息抽取系统进行了研究,分析并提出了HT

【作者】

：

谭锋李天真崔亮亮

【机构】

：

湖州职业技术学院机电工程分院,浙江久立集团股份有限公司

【出处】

：

软件导刊

【发表日期】

：

2010年12期

【关键词】

：

.NET WEB信息抽取应用软件 HTML XML .NET Web Information Extraction Application Softwar

【基金项目】

：

浙江省教育厅科研项目（Y200803750）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着Web信息抽取的研究和发展,抽取技术已经逐渐成熟,通过软件来实现从Web页中抽取所需要的信息已成为可能。对基于.NET技术实现的Web信息抽取系统进行了研究,分析并提出了HTML文档下载和清理、HTML到XML格式转换、数据定位及抽取、抽取数据的保存等需要研究解决的关键技术问题,并探讨了相应的解决方案。

其他文献

基于模糊ISODATA的方言识别系统在学生信息系统中的应用

以模糊ISODATA方法为基点，结合语音识别技术的优点，设计了基于语音识别的学生信息系统。提高了学生信息录入的效率与精确率，为语音识别技术的应用及其它领域信息系统的构建提供

期刊

ISODATA语音识别方言模糊分类学生信息系统

计算机在桥梁检测中的应用探析

伴随社会经济的迅速发展,人民生活水平得到快速提升。人民生活水平提升的同时,周围各种城市基础设施建设也得到快速发展。其中最显著的便是城市桥梁,近年来,许多桥梁拔地而起

期刊

计算机桥梁检测应用分析

皮子粉与馒头粉联产需要注意的几个环节

把刚和好的面团制成各种形状，如鲜面条、饺子皮、馄饨皮等叫做鲜切面，随着人们食用需求，适于做鲜切面的面粉需求量越来越大。有的面粉生产厂家和经销商干脆把这类面粉贴切地称为

期刊

馒头粉联产生产厂家鲜切面面粉鲜面条饺子皮需求量

谷朊粉烘干探讨

谷朊粉是面粉深加工的一种高蛋白产品，有较高的附加值。谷朊粉干燥技术在国内还有很大的发展空间。在工艺布置、设备选型方面还需进行合理的完善，谷朊粉烘干的产量、能耗、安全

期刊

脱水绞龙鱼尾喂料器刀片混合器惯性分离器导料板温度

《胜利油田党校学报》2020年总目录

期刊

热解温度对青霉素菌渣热解产物的影响

将青霉素菌渣在400~700℃进行热解,研究了产物中热解炭、热解油及气体的产率,以及热解油的组成变化。实验结果表明:600℃时热解油产率最高,随着温度升高,热解炭的产率降低,气

期刊

青霉素菌渣热解含氧化合物含氮有机化合物 penicillin waste myceliumpyrolysisoxygenated compou

基于Web2.0的专题学习网站构建的契合性探析

将Web2.0理论引入专题学习网站构建领域,依据专题学习网站的教育特性,找出应用Web2.0理念在构建专题学习网站方面的契合点。Web2.0理念和技术运用于专题学习网站的构建可以有

期刊

WEB2.0专题学习网站网络教育资源建设契合性Web2.0 Project-based Learning Website Network Educa

论面粉企业核心竞争力的培育

企业核心竞争力是一个企业保持持续竞争优势的源泉，是企业生存和发展的关键，山东省洪丰面粉有限公司着力于培育、维护和提升企业的核心竞争力，为保持在市场竞争中持续的优势，不断

期刊

核心竞争力人力资本技术能力管理模式企业文化

浅述环境监测报告制度计算机支持系统的开发与应用

环境监测报告制度计算机支持系统的主要功能是环境监测原始数据纳入计算机管理,对各种原始信息进行统计、评价、分析,制作各种环境质量报告书及声像报告书,为环境科学管理提

期刊

环境监测质量报告计算机管理软件

元模型存储测试的设计与实现

测试元模型在模型驱动的测试中居于核心地位，在测试过程中保证测试元模型能够被正确地存储与读取是非常重要的。借助于JUnit这一通用测试框架，对测试元模型的存储与读取功能进

期刊

JUNIT元模型测试设计JUnit MetaModel Testing Design

基于.NET的Web信息抽取系统关键技术研究

与本文相关的学术论文