【摘 要】
:
随着互联网上邮件的广泛使用,垃圾邮件的问题变得日益严重,它不仅消耗网络带宽和计算机时空开销,而且会对企业的正常运行和用户的正常工作造成严重的干扰。要解决垃圾邮件问
论文部分内容阅读
随着互联网上邮件的广泛使用,垃圾邮件的问题变得日益严重,它不仅消耗网络带宽和计算机时空开销,而且会对企业的正常运行和用户的正常工作造成严重的干扰。要解决垃圾邮件问题,必须综合法律、技术等手段。目前,国内外垃圾邮件过滤的技术有黑白名单技术、基于关键词匹配技术,以及基于内容的垃圾邮件过滤技术等等。本文对基于内容的垃圾邮件过滤技术研究现状进行了详细的介绍。它是当前解决垃圾邮件问题的主流技术,主要包括基于规则的内容分析方法和基于概率统计的内容分析方法两个研究方向。由于Rough集理论具备不需要任何先验信息,能在保持分类能力不变的前提下,通过属性约简,导出问题的决策规则的特点,因此在基于内容的垃圾邮件过滤技术上,引入Rough集理论。将该理论用于垃圾邮件过滤是一个新的研究方向。首先,文中重点研究分析基于Rough集的经典属性约简算法。进一步提出了一种改进的Rough集属性约简算法。实验证明该算法是可行的,高效的,尤其适用于大数据集的属性约简。然后详细介绍了基于Rough集的垃圾邮件过滤系统模型和工作流程;在垃圾邮件过滤的特征选择问题上,采用了改进的Rough集属性约简算法过滤掉冗余特征和不相关特征;将邮件正文内容特征集和邮件头的7个相关特征综合实现对邮件的识别,从而提高了系统过滤的正确率,降低垃圾邮件的错判率。最后通过三组对比实验表明:将Rough集理论应用于垃圾邮件过滤领域是可行的、高效的。
其他文献
入侵检测技术是一种多层次多深度的网络防护手段,是目前安全技术研究的热点。本文应用模式识别技术设计并实现了一种新的基于AdaBoost的入侵检测方法。并对选择的弱分类算法
广义Petersen图和循环图在图论中有着比较重要的位置,特别是广义Petersen图,目前这些图在支配数的研究方面主要集中在求上下界和对k取特定值时精确值的研究,而罗马支配方面,则集
近年来,随着医学成像技术的迅猛发展和应用,医学图像在临床诊断、治疗以及研究方面起着越来越重要的作用。基于内容的医学图像检索技术是从海量的医学图像中检索出具有相似病
本文主要对机会网络分布式路由和软件定义网络集中式路由进行了综合研究。 无线网络经常不稳定,网络容易断开,导致信息无法送达。现有的各种无线网络协议,如AdHoc,WSN,Mesh网络
在嵌入式仪器领域,基于成本的考虑仍然存在着大量的PC/104体系结构。随着PC/104+和PCI/104-E新技术的产生,PC/104体系结构对新技术的兼容问题逐渐引起行业的关注。如果直接采用
随着设备复杂程度和自动化水平的提高,设备故障诊断的重要性日益显著。人工神经网络模仿人脑的物理结构,具有强大的并行运算和联想能力,使其非常适合于设备故障诊断,并且采用
近年来,随着科技发展,人们对版权与多媒体(如图像、图形、音频、视频等)的安全性要求越来越高,数字图像水印技术作为信息隐藏的主流方向之一,也得到了快速发展。但随着图像水印技
随着XML应用范围的不断扩展,越来越多的数据采用XML技术来管理,数据库本身的安全性也日益重要。XML数据库安全是一个正在展开的研究方向。如何实施面向XML文档的访问控制策略
近年来,几乎在各种领域都需要处理时间序列数据,对时间序列数据的研究也涉及很广。时间序列数据中包含着很多有用的信息,蕴含着许多潜在的事物发展的规律。粗糙集理论是波兰
Linux系统是一种分时的、具有强大网络功能并开源的通用目的操作系统,它诞生于上世纪90年代初,以网络为基础广泛传播到世界各地并成为当今主要操作系统之一。因为Linux操作系