基于AAPE分类模型的垃圾邮件过滤技术的研究与实现

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:jpflxy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
1978年,从DEC公司的一名市场销售代表向所有美国西海岸的ARPANET用户发送了一封关于DEC-20新型计算机广告邮件的这一刻起,人类史上第一封垃圾邮件诞生了,从此垃圾邮件伴随着信息时代的发展而发展,不曾消失。垃圾邮件的出现给网民的生活带来了巨大的影响,根据《2013年第一季度中国反垃圾邮件状况调查报告》显示:2013年第一季度,中国电子邮箱用户平均每周收到垃圾邮件数量为14.6封,占所有邮件的比例为37.37%,造成了大量的不良影响,包括浪费时间、浪费电脑及网络资源、传播病毒、影响用户情绪和造成经济损失等。针对日益严重的垃圾邮件问题,研究人员提出了大量的垃圾邮件过滤技术用于改善被垃圾邮件充斥的互联网环境。目前的垃圾邮件过滤技术在判断的准确性上已达到较好的效果,但在计算时间上往往很固定,不能达到用户即需即得的效果。针对这一问题,研究人员提出了AAPE分类模型。AAPE(Anytime Averaged Probabilistic Estimators)分类模型是一种基于贝叶斯估计的anytime分类模型,由杨影博士提出,应用于反垃圾邮件领域。本文首先对垃圾邮件的背景和危害进行了介绍,简单了解了电子邮件的工作原理,由此明白了垃圾邮件可能利用的漏洞。然后,深入解剖AAPE分类模型的优点与不足,针对部分地方进行了改进,设计出一款基于改进AAPE分类模型的垃圾邮件过滤系统。最后,通过测试结果,对改进的AAPE分类模型进行分析,证明其相比较原模型有更高的效率。本文的主要研究成果如下:对传统AAPE分类模型进行改进,根据特征项的相关性强弱程度,采用期望交叉熵、统计量和互信息三种方法计算强相关特征项,并应用于垃圾邮件过滤技术。根据实验测试结果对改进后的AAPE分类模型进行分析,证明该模型较原始AAPE分类模型在时间性和准确性上有较大提升。设计了一款以改进后AAPE分类模型为基础的垃圾邮件过滤系统,该系统采取双层过滤架构,第一层使用黑白名单技术对所有邮件进行简单的、快速的邮件过滤,第二层使用以AAPE分类模型为基础的智能过滤,进行深入过滤,确保系统的即时性和准确性。
其他文献
磷酸化模式代表了位于磷酸化位点周围具有位置特殊性的氨基酸序列。鉴于磷酸化模式可以用于研究磷酸化相关的基本调解机制以及磷酸化位点预测等相关问题,因而有很重要的研究
现有的关于数据发布的工作集中于如何在数据发布时隐藏个体信息,已提出的方法大部分都是“正发布”方法,即直接对原始数据进行处理后发布,但其实这些方法发布的依然是“正”
与现在的无线传感网不同,物联网被认为是未来互联网的一个组成部分。这就意味着物联网将不得不与互联网中的其他部分分享网络资源,甚至在网络资源紧张时物联网还需要与它们竞争
随着汽车工业的发展,车载设备正朝着网络化和智能化的方向快速推进,汽车电子软硬件系统变得越来越复杂,它的实时性、正确性、安全性和扩展性越来越难以得到保证。为解决这些
目前,生物医学文献正呈指数级别增长,其中存储着丰富的知识,对生物医学的科研、教学和实践,疾病的诊断、预防和治疗,新药的研制都起着至关重要的作用。因此,从这些海量的文献
在网络技术不断发展的过程中,异构网络融合的发展尤其迅速,网络越来越趋向于一体化。Ad Hoc网络具有很多优点,包括使用费用低、网络架设方便,组网方式灵活等。通过将现有Ad H
随着增强现实在生活中的逐步应用以及空间数据的爆炸性增长,对空间数据的存储也提出了更严格的要求,尤其是存储系统的可用性,可扩展性和高效性等。传统的分布式数据存储方案
在我们的日常生活中,智能手机的使用越来越普及,至今已成为人们接收和传递信息的主要途径。随着时代的发展,智能手机软件的生产数量日益增多。从许多智能手机操作系统Android
对增加道路安全和减少交通事故的迫切需求促使高级驾驶辅助系统(ADAS)技术的快速发展。如强制安全带的使用率,降低限速,安全气囊和侧振动带等一系列更严格的车辆安全要有,则有助
智能视频监控系统能够自动地监控场景,当发现场景中有违规行为时立即引发警报,从而大大减小了工作人员的工作量,提高了检测的准确率,所以智能视频监控系统与传统的视频监控系