智能型电子邮件过滤系统的研究与实现

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:ilovegigi2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的发展逐渐改变了人们的生活方式,电子邮件因其方便、快捷的特点已受到人们的青睐,许多重要信函也会通过电子邮件的方式传送。但是,许多垃圾邮件同时也在网络中蔓延,占据了邮件服务器的大量存储空间,用户往往需要花费大量的时间去删除这些垃圾邮件。因此,研究邮件的自动过滤具有重要意义。 旨在解决互联网垃圾邮件泛滥的现状,规范网络邮件的使用方式,论文作者所属课题组依托国家高技术研究发展计划(863计划)—“多特征智能反垃圾邮件系统和标准研究与实现”课题,设计并研发了实时、高效的智能型电子邮件过滤系统。作为过滤系统的研发人员,作者参与了系统的模块规划和功能设计。虽然过滤系统初步投放市场试用时获得相当不错的使用情况反馈,但是系统在自身网络安全方面缺乏足够的保证,而且纯粹的基于特征字串匹配的邮件过滤模块对于垃圾信件的查准率已经不能满足日益提高的过滤系统用户的产品需求。 围绕现有电子邮件过滤系统的性能增强与功能丰富这一中心,作者在以下几方面深入展开了论文的研究工作。 第一,通过深入分析主要电子邮件协议的安全性,论文总结了当前互联网垃圾邮件盛行的本质原因。 第二,面向呈现内容各异的垃圾邮件,论文全面综述了垃圾邮件的类型特征和现有的电子邮件过滤技术。 第三,详细介绍了邮件过滤系统的体系结构,并分别描述了系统各个组成模块的结构与工作原理。 在此基础上,作者分析了原有系统的不足之处,并针对性的提出了系统的安全增强与功能模块改进方案。 第四,首先介绍了邮件头部信息的特征表达方法和特征选取算法,接着对支持向量机技术进行了详细的介绍,最后说明了基于支持向量机的邮件过滤方法。 第五,论文把邻近类别分类的过滤思想引入前置式电子邮件过滤系统,详细阐述了该模块的文本预处理技术,文本特征表达,文本特征选择等算法,给出了邻近类别分类器的构造与整个模块的工作流程。 最后,作者进行了若干实验,给出了实验结果。实验结果表明,对应方案能够相当显著地提高过滤系统对于垃圾邮件的查准率,同时邻近类别分类器的加载对于过滤系统运作效率的影响并不明显。
其他文献
辐射源无源定位具有作用距离远,抗干扰能力强,隐蔽性好等优点,对于寂静目标和隐身目标具有较强的定位能力。由于其具有上述特点,在现代战场中和军事系统的电子侦察应用中受到
本论文采用经济学的博弈和定价理论对网络资源分配和拥塞控制进行了研究,其内容如下:  首先,对近年来研究的较多的网络经济模型和定价策略进行了系统地总结,并且对其进行了比较
为探讨糖尿病肾病(DN)患者血清内脂素水平变化及其在发病中的可能作用,笔者测定了糖尿病患者血清内脂素水平,现报道如下.1资料与方法1.1一般资料按WHO诊断标准选择2008-06-20
本文对说话人确认中背景模型进行了研究。主要内容如下: 1.在电话信道的语音库上,建立了与一个与文本无关的说话人确认系统,即GMM-UBM系统。通过实验确定了在本文采用的数据
随着通信技术的快速发展和互联网的迅速普及,为适应人们的需要,网络业务逐步呈现出宽带化、综合化、多样化和个性化的趋势。市场和技术驱动固定电话网、移动电话网和互联网等多
本课题的目标是设计并实现一套基于SUSC880卡的具有较高精度的加氢反应器超声自动扫查系统软件。本文论述了该系统的总体设计思路、各个软件模块的设计方案和具体实现技术,讨
目的 观察氯胺酮复合局麻在急诊剖腹产中的临床效果.方法 选择急诊初产妇120例,按数字随机法分为治疗组和对照组,治疗组(A组)60例,采用氯胺酮复合局麻;对照组(B组)60例,采用
本院采用芳碘稀释液阴道冲洗治疗细菌性阴道病,临床效果满意,现总结报道如下.rn1 资料与方法rn1.1 一般资料选取我院2008-01-2009-12妇科门诊检查及实验室检测诊断为细菌性阴
现代通信系统中,由于信道的非理想特性而引起的码间干扰(ISI)是影响通信质量的一个主要因素。盲均衡技术是一种不借助于训练序列,仅利用接收序列本身的先验信息来均衡信道特
论文首先讨论了以太网以及以太网交换机的国内外发展概况,以太网交换机的分类。在此基础上,分析了常见的分布式以太网交换机的硬件基本架构与主控板、接口板、背板的硬件组成