【摘 要】
:
随着互联网技术的发展,电子邮件在人们生活中扮演着越来越重要的角色。但电子邮件给人们带来极大便利的同时,也日益显示出其负面影响,那就是随之而来的各种或推销广告或包含不良
论文部分内容阅读
随着互联网技术的发展,电子邮件在人们生活中扮演着越来越重要的角色。但电子邮件给人们带来极大便利的同时,也日益显示出其负面影响,那就是随之而来的各种或推销广告或包含不良信息的垃圾邮件。它们占用网络资源,干扰邮件系统的正常运行,浪费用户的宝贵时间和上网费用。如何对邮件进行高效的分类和过滤就成了人们迫切需要解决的问题。一般说来有两类方法,一类是根据某种规则或某些内容关键词进行分类。这种方法比较死板,精确率很低,误报率却很高。另一类是现在比较流行的神经网络、支持向量机、K近邻、决策树、粗糙集、贝叶斯分类等智能的分类方法。应用这些方法,用户可以指定各类邮件训练集合,然后自动从中学习得到分类模型。
但以上这些方法不是只针对邮件头就是只针对邮件内容进行分类和过滤,没有很好的将二者结合。实际上邮件头和邮件内容都含有有用的分类信息,如果能把它们结合起来,就能得到更好的分类效果。为了达到这样的目的,本文设计了一个垃圾邮件智能过滤系统,将邮件头和邮件内容结合起来对邮件进行分类。我们的想法是首先采用RoughSet方法对邮件头进行第一次分类。这次分类能够将那些刻意隐藏发信人地址或是中转了很多次的广告邮件区分出来,但是对于那些具有正常中转路径的一般的广告邮件就区分不出来了,因此我们利用朴素贝叶斯算法对邮件内容进行第二次分类。这样就能比较完美的将邮件进行正确分类。最终得出结论认为:采用邮件头和邮件内容一起进行过滤的办法,能得到比只使用对邮件头进行过滤的方法更好的效果。
其他文献
随着网络宽带化的发展,流媒体作为新兴的媒体形式应用日益广阔,但是其版权问题也日趋突出。流媒体的数字版权管理在这种情况下越来越受到人们的重视,越来越多的公司、组织投入其
民用航空运输在交通运输行业的比重不断增长,使得民用航空的安全水平也越来越受到关注。我们需要采取积极主动的安全检测监控措施,提高现有民用航空领域的安全性。飞行品质监
数十年来,数据挖掘一直是一个热门话题。作为数据挖掘的一个主要技术领域,聚类分析产生了很多算法,并且演化成一个庞大家族。现有的聚类算法可以分为5类:分割算法,分层算法,基于密
随着当代企业内部结构逐渐分散,网络应用服务模式面临新的问题,即在不影响最终用户使用的前提下,实现在任何地方灵活地访问应用服务。虚拟专用网在此基础上逐渐发展起来,其中
随着网络技术和通信技术的不断发展,用户对网络的需求日益多样化,基于IP 交换网络的多点视频会议系统的实现由于其成本的低廉,交互性强大,多点共同参与的特点和优点取代了传
随着Internet的迅猛发展,使得World Wide Web已经深入到社会生活的方方面面。Web已经发展成为拥有数十亿页面,蕴涵着具有巨大潜在价值的分布式信息空间。人们迫切需要从这些
随着语义Web领域的发展,各个领域按照语义Web的数据格式发布的数据逐年呈几何级爆炸性增长。Linked Open Data上的RDF数据条数已经达到百亿级规模。针对RDF数据主要有查询和
随着公交系统的快速发展,对车载视频监控系统提出了更高的要求。而Linux系统的发展壮大,Web技术和分布式技术等的日渐成熟为车载视频监控系统的进一步发展提供了技术支撑。本
身份认证技术是计算机网络安全中的一个重要环节,是网络安全和信息系统安全的第一道关卡,也是实施访问控制的基础,对系统信息只能被合法授权用户访问和获取起着重要作用。实
MPLS(多协议标签交换)作为ATM与IP结合的产物继承了IP技术的灵活性,可扩展性,同时利用现有的二层硬件交换技术(如ATM,FR等)提供了对流量管理和VPN(虚拟专用网)的支持,具有QoS