基于DOM的规范化WEB信息提取

来源 :科学技术创新 | 被引量 : 0次 | 上传用户:jinz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以一个新闻列表提取器的实现为目标,针对不同的数据结构和应用需求列举了四种提取模式,并分别为每种模式给出了设计思路和算法逻辑,是基于DOM思想提取HTML信息的典型应用,对于同样有WEB信息聚合与数据采集应用需求的研究实现具有很好的借鉴参考意义。
其他文献
本文以南京市为例,在全面分析南京城市竞争力现状的基础上,提出了通过培育创新网络来提升南京城市竞争力的几点建议.
随着现代微电子技术的飞跃发展和对行波传播规律以及对暂态信号获取方法的进一步掌握,行波故障测距装置已广泛应用于超、特高压输电线路上,但行波测距方法有其固有的缺陷。文章
摘要:在十几年前,我国开始建立统帐结合的社会保险模式,至此之后企业职工养老保险的制度开始向积累制的转变,与原来的现收现付的模式不同,新的模式具有很多有点,这种制度的变化将是需要一定的时间的,而且在其中会带来许多的问题,文章针对我国现行的企业职工养老保险制度当中出现的问题进行了探讨,并且阐述了解决问题的办法,对于我国企业职工的养老保险制度的建立和完善有着很重大的积极意义。  关键词:养老保险;企业职
文章阐述了百色水电站GIS设备运抵现场后的安装调试项目和内容,以及现场调试过程中出现的问题及解决办法,并对GIS现场安装调试的关键控制环节进行了探讨。
科学精神与人文精神同根、同源,却在城市发展的过程中疏离.文章通过对概念的辨析,以及其对城市发展的影响,探求科学精神和人文精神的融通、互动在树立城市正确发展观中的重要