论文部分内容阅读
在本文中,将讨论使用标准Web技术--HTML、XML和Java--开发的一种基于Web的数据采集方法.万维网是到目前为止世界上最丰富和最密集的信息来源,但其结构使它很难用系统的方法来利用信息.本文描述的方法主要是通过设定目标锚并利用XALAN技术在源信息里获取目标数据,最后生成XML文档.这种方法可使那些熟悉Web最常用技术的开发人员能快速而便捷地获取他们所需的以Web方式发布的信息.