论文部分内容阅读
人类进入二十一世纪,网络正全面地改变着人们的思维方式和生活方式,对政治、军事、经济、文化以及宗教产生深刻的影响。随着网络在我国的迅速发展,各种网络犯罪行为滋生蔓延,愈演愈烈。网络犯罪直接危害国家的政治、经济、文化等各个方面的正常秩序,信息安全已成为关系国家安全和主权、社会稳定的重要问题。利用网络广泛传播淫秽、反动、邪教、暴力等有害信息以及在线联络进行违法犯罪活动是网络犯罪两大主要手段。如何有效监控、发现、清理这类有害信息,为人们提供一个干净清洁的网络环境,成为公安部门的一项重要工作。 以Google、百度为代表的搜索引擎以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务。本文深入研究分析了搜索引擎架构以及中文分词、索引、主题搜索策略及Web挖掘等相关技术,并在此研究基础上,结合公安工作实际,运用搜索引擎技术,以Java作为开发平台,设计并实现了警情信息搜集系统。本文的主要成果有以下几点: 1、研究分析了Web信息检索技术与搜索引擎、Web挖掘等技术的联系和区别,探讨了Web信息检索的框架和相关评测标准。 2、在此研究基础上,综合运用Web信息检索、搜索引擎、Web挖掘、中文分词索引等有关技术理论,设计并实现了不同于面向普通用户的Google、百度等普通搜索引擎的用于公安警情信息搜集的专用Web信息搜集系统,为改变大多数公安机关对Web信息监控只能采取人工浏览的现状提供了一种有效的选择。 3、设计并实现了根据页面链接文字、页面文字信息与主题相关度进行综合研判的主题搜索策略,能根据用户意愿有选择的采集信息、快速定位信息,解决了普通搜索引擎信息采集的盲目性,大幅度提高信息搜集的效率和准确度。 警情信息搜集系统主要完成对上述互联网有害信息的发现、监控及警情信息的搜集,为公安情报信息工作提供有力的武器,增强了公安机关的信息获取能力和对社会面的掌控能力,使公安机关做到耳聪目明,各项工作有的放矢,从而更快、更准地预防和打击各类违法犯罪活动,为国民经济的高速健康发展保驾护航。