基于信息熵的反垃圾邮件技术研究

来源 :天津理工大学 | 被引量 : 1次 | 上传用户:wanggang34320
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前国内的网络安全事件频频发生,垃圾邮件的泛滥成为其中显著的特点之一。传统的反垃圾邮件方法以基于内容的过滤为主,按照基于统计和基于规则划分为多种算法。但这些方法都有一定的局限性,难以在过滤邮件的效果上做到有效性和速度兼顾。本文在贝叶斯分类的基础上,引入了信息熵的概念,在邮件服务器前端建立一个多层过滤反馈系统,从邮件自身的行为参数和内容识别上来辨别垃圾邮件与合法邮件,在原有贝叶斯分类的基础上降低了误检率,提高了正确率。本文的研究工作主要包括以下三个方面:首先对朴素贝叶斯进行了改进,采用了多级属性关联的依赖机制,提高了其在现实问题中的可行性和适用性。另外对polytree传播条件下的复杂贝叶斯网络进行分析,使用并行处理计算对输入信度进行了有效的处理和计算,得到了较好的性能结果。论文将信息熵的理论应用到邮件过滤上,利用垃圾邮件的群发特性和其随机性小的特点,对邮件的行为参数进行一系列计算,根据判断结果对邮件进行过滤。最后实现部分对前面几个过滤方法进行了整合,建立一个邮件过滤系统。在进行邮件分词、主成分分析的特征约简的基础上,依次进行熵计算模块和贝叶斯模块的过滤,最终得到较好的邮件分类结果。从实验结果来看,取得了预期的效果,在处理效率上得到了提升,具有一定的实用价值。
其他文献
网络附属存储系统是一种特殊的专用数据存储系统,在使用、管理、维护上都具有简单、方便、可扩容、大吞吐量等优良的特性,可提供跨平台文件共享功能,是存储机载数据的理想环
目前,信息技术、网络技术发展迅速,但企业和政府部门在以往开发信息系统时缺乏统一的部署,异构问题的因此日益严重,数据交换困难,形成了信息孤岛问题。在信息化的趋势下,迫切
大规模开放在线课程(massive open online courses, MOOC)作为一种新兴的教育模式,自2012年以来,随着美国Coursera、Udacity、edX三大课程提供商的兴起,迅速在全球掀起一股在
近年来云计算和大数据应用的发展如火如荼,作为其基础设施的大规模数据中心等网络设备的能量消耗问题越发凸显。当今网络中普遍存在着大量的路径冗余,链路利用率不均衡和非常
全文信息检索技术是当前时代迅速获得准确信息的重要手段之一。在全文信息检索技术中最重要的部分是索引的管理。大数据时代,集中式的索引管理方式面临巨大挑战,最佳的解决方
面对越来越丰富的IT (Information Technology,信息技术)资源,越来越复杂的IT环境,无论企业还是政府的IT部门都开始广泛采用ITIL (Information Technology Infrastructure Li
随着无线通信技术的迅速发展,越来越多的人们希望提供无处不在的、高质量的无线通信,无线接入技术也得到了迅速的发展。无线MESH网络就是一种新型的宽带无线接入系统,是一种
长期以来,织物CAD技术一直是计算机在纺织领域中的一个重要应用与研究方向,织物CAD作为高新技术的手段为纺织品的设计和生产提供了很大的方便。织物的外观模拟在设计阶段就能
本文研究相关分析方法在异常检测中的应用,并将其应用于特征选择及地震特征数据的异常检测中。主要研究内容如下:提出了一种基于离散粒子群算法(Binary Particle Swarm Optim
计算机科学与技术的不断发展和计算机的广泛应用,促进了社会的进步和繁荣,给人类创造了巨大的财富。尤其是计算机网络的发展,日新月异,使信息共享广泛用于金融、贸易、商业、企业