论文部分内容阅读
Web信息数据是网络上最庞大,也是最丰富的信息资源。工具通过C#编程实现,采用正则表达式手段,针对HTML的信息进行分析、过滤、整理、采集,实现了对Internet网络上WEB文档数据的自动化、无人值守的操作。软件模拟baidu“图片”频道,通过读取HTML信息内容,搜索出页面中的图片信息,并进行分类保存等操作。