论文部分内容阅读
电子邮件作为一种全新的通信工具是互联网应用的一个成功典范,它诞生时间不长却给人们的工作、生活等诸多方面带来了深刻变化。然而,电子邮件却成为许多垃圾信息传播的方便途径。如今,大量的商业、社会和政治等垃圾邮件日益成为电子邮件使用者所面临的头痛问题。如何有效地过滤掉各种垃圾邮件已经成为众多研究者所关注的课题。目前,国内外对垃圾邮件过滤技术的研究主要集中于对邮件文本信息的关键词过滤。通过设置过滤器、黑名单等方式过滤垃圾邮件,这些方法对于垃圾邮件的过滤发挥了一定作用,但缺乏智能性和自适应性。本文针对电子邮件的特点,通过分析传统邮件过滤技术的不足之处,在对大量垃圾邮件信息进行统计分析的基础上,提出了模块化的基于SMTP邮件防火墙系统方案,并对该方案进行了详细分析设计和实验测试。该邮件防火墙系统包括邮件过滤、SMTP代理服务、协调系统等六个功能模块,每个模块之间相互协调,形成了一个完整的邮件防火墙系统。邮件过滤模块是该防火墙系统方案的重要组成部分。作者通过分析研究垃圾邮件关键词的统计概率分布,提出了基于贝叶斯概率模型的邮件过滤算法,并对该算法的合理性和复杂度进行了分析。将此算法应用到邮件防火墙系统中,使整个系统可根据用户的需求建立起不同类型的过滤器,从而根据邮件关键词概率分布推断出收到的邮件是垃圾邮件的概率,由此判断是否为垃圾邮件。垃圾邮件关键词贝叶斯统计分布的概率在邮件防火墙系统的运行之中可以进行动态调整,提高了系统对垃圾邮件过滤的自适应性。最后,作者对邮件防火墙系统进行了实验测试,证明该系统方案设计是合理、可行的,基于贝叶斯概率统计分布的邮件过滤算法能有效提高垃圾邮件过滤的效率,具备一定的智能性和自适应性。通过对邮件防火墙系统的理论分析和实验测试,认为本论文所提出的系统方案具有一定的理论意义和实用价值,具有较广阔的应用前景。