论文部分内容阅读
面对日益复杂的网络环境,为做好网络安全防护,网络漏洞扫描检测必不可少。通过及时检测和发现网络设备和网站存在的安全隐患,及时实现漏洞的修复和网络设备的加固是保障网络安全的重要手段。面对漏洞检测设备存在性能和数据处理的局限性,本文结合分布式架构和爬虫技术设计实现基于Hadoop架构的网络漏洞扫描系统实现对互联网存在的网络设备和产品的批量扫描和漏洞探测。系统借助J2EE平台和Web服务技术,在对分布式网络爬虫架构研究的基础上,实现了系统的各个主要功能模块。在系统的开发过程中,基于Hadoop分布式架构引入了分布式网络爬虫,根据主机探测和网络安全漏洞检测功能的需求以及MapReduce框架的特点,设计实现了分布式网络爬虫的MapReduce算法实现,将网络爬虫抓取的URL的任务相对合理地分配给各个节点服务器是运行,显著提升了网络爬虫在单个设备的爬取效率和数据的处理效率,提升了系统的性能,同时,基于分布式架构开发的网络漏洞扫描系统具有良好的可扩展性和容错性。本系统包括主机探测模块、任务管理模块、系统设置模块和报表管理模块。利用主机探测模块能够实现互联网主机系统类型、开放端口、应用软件等基本信息的采集及网络漏洞的检测;利用任务管理模块实现了漏扫系统中任务的新建、删除、修改等操作;利用报表管理模块可查看系统检测报表,还可按照需求导出相应格式的报表;利用系统设置模块实现用户管理、日志管理及系统升级等。基于Hadoop架构的网络漏洞扫描系统的设计与开发,是分布式网络爬虫技术在漏洞扫描系统中的研究和应用,对于进一步拓展网络爬虫的应用具有一定的借鉴意义。