论文部分内容阅读
本文主要介绍了在Windows环境下,针对EXCHANGE邮件服务器和OUTLOOK的垃圾邮件检测系统的设计模型和实现方法。该检测系统不仅能够对已发现的典型垃圾邮件进行识别判断,而且也同时能够根据用户手动分类结果自动智能学习垃圾邮件各项特征。目前大部分的电子邮件收发软件,都提供简单的过滤功能,不过需要用户对有限的检测项目制定繁琐的规则。最近几年有许多邮件过滤的相关研究,但大部分的研究针对英文来进行,鉴于中英文邮件在语义表达上的巨大差别,无法直接使用在中文垃圾邮件检测上;而且目前常见的垃圾邮件检测技术大多只是在用户端进行,无法使邮件服务器和客户端协同进行检测,所以本文介绍的垃圾邮件检测系统,不仅对中英文邮件均有效,而且使服务器和客户端进行良好的协作,具有很高的研究价值。 开发该系统的主要目的是在了解当前垃圾邮件检测技术的发展现状,学习邮件系统的基本概念的基础上,结合分柿式技术和人工智能方法,设计并实现一个服务器和客户端协同检测垃圾邮件的系统。在学习和实践过程中,不断发现问题,并结合自己的研究工作提出见解和解决方案。 本文首先介绍了关于垃圾邮件检测的基本概念及其发展过程。然后,具体阐述了系统设计和实现中采用的关键技术和解决方案。接着,重点介绍了该垃圾邮件检测系统的体系结构和实现方法。最后,总结了当前垃圾邮件检测系统所面临的主要问题,探讨了解决其中部分问题的方法和思路。 本文设计和实现的垃圾邮件检测系统主要包括四种分布在不同位置的Agent:服务器Agent、工作站Agent、控制台Agent、子网Agent,以及中心数据库。其中,服务器Agent的主要功能是:根据新到达服务器的邮件的头部信息做出快速准确的判断。本文主要介绍在EXCHANGE平台上利用COM接口实现该功能的方法和过程。工作站Agent的目的是根据邮件内容进一步检测。本文采用支持向量机作为内容过滤的方法。中心数据库主要是将系统中各Agent使用的参数和用户的个性化规则保存在SQL Sever数据库中,以便将来进行查询分析和参数设置。控制台Agent是通