DHTnil垃圾邮件过滤系统的改进方法研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:laire723
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的高速发展,电子邮件对人们的日常生活越来越重要,但是与此同时垃圾邮件的危害也越来越严重。在多种垃圾邮件过滤技术中,分布式垃圾邮件过滤技术有着很好的可扩展性,具有很高的垃圾邮件识别能力,是垃圾邮件过滤技术新的发展方向。   DHTnil系统是一种基于Nilsimsa摘要算法的分布式垃圾邮件过滤技术,它有着很好的可扩展性,负载均衡性以及健壮性,但是DHTnil系统中仍有很多可以改进的空间。本文结合了DHTnil系统中节点相对稳定的特性,提出了一种基于cache的DHTnil-Chord路由算法,在很大程度上改善了系统的整体路由效率。在节点数目为3000时,系统的整体路由效率提升了9.66%。在垃圾邮件泛滥这一特殊时刻,DHTnil系统的路由效率同样有很好的表现。   同时,本文提出在DHTnil系统中引入Vivaldi网络预测技术。在Vivaldi坐标系统中,每一个节点都有一个网络坐标,可以通过坐标比较精确的预测节点之间的距离,而且需要传递的坐标信息都附着在正常的通信中,不会有过多的额外消耗。在此基础之上,本文提出了Vivaldi摘要发布和查询策略:节点在发布和查询摘要的时候,在摘要距离相等的前提下优先选择物理距离更近的节点,这样可以提高摘要的发布和查询效率。模拟实验中显示,Vivaldi摘要发布策略在节点发布1000个摘要时效率提升了5.32%,Vivaldi查询策略将查询效率提升了大约5.17%左右。另外,本文又提出了改进的Vivaldi数据备份和恢复策略,将节点中的有效数据备份到离自身物理距离最近的两个节点上,减少了数据备份传输消耗和节省了系统带宽。在备份和恢复的数据大小为80KB的时候,效率提升了约8.31%。   本文中通过进行模拟实验,充分地证明了DHTnil-Chord路由算法,以及改进的摘要发布查询策略和数据备份恢复策略的有效性。
其他文献
航迹规划是实现飞行器自动导航的一项关键技术,它是随着信息技术和航空技术的不断发展而发展起来的一门跨学科的课题研究。由于飞行器的飞行环境异常复杂,约束条件众多,航迹规划
大自然中的植物种类多样,千姿百态,它们是组成和谐大自然不可缺少的一部分。虚拟植物建模融合了计算机图形学、应用数学、随机化过程、物理学、植物学、农学及可视化计算等多
量子计算是一门交叉于数学、物理与计算机科学的前沿学科,具有令人期待的发展前景.量子计算的研究主要分为对量子计算模型、量子计算复杂性和量子算法的研究.目前,广泛引起学
伴随着互联网技术飞快的发展,一种新型的技术——云计算技术已经被广泛应用于各个领域。云计算是相继分布式计算、网格计算及并行计算之后又一大新领域的突破。云计算实质意
基因芯片技术是目前研究人类基因组和其他各种模式生物基因组复杂性的最强有力的工具,这一技术已经广泛地应用于生物学和医学的各个领域。但是随着基因芯片技术的不断发展,产生
近年来,在全球信息化大潮的推动下,社会网络得到快速发展,各种不同的社会网络都表现出一种强的社团效应。一个网路中的成员趋于形成密切联系的社团。在不同的应用下,这些社团
MPLS技术提供了类似于虚电路的标签交换业务,可以实现底层标签自动的分配,在业务的提供上比传统的VPN技术更廉价,更快速和安全的数据传输。同时MPLS VPN可以充分利用MPLS技术的
随着网络媒体和互联网技术的高速发展,Internet上充斥着各种海量的信息,且在不断变化更新,来源也更为广泛。怎样从海量的且不断变化的大数据中得到符合用户所需信息已经成为
计算机及无线互联网络的开放性在给人们带来了诸多便利,同时也让重要秘密信息如个人隐私、商务机密、军事情报等更容易暴露于通信双方以外的潜在恶意攻击者,使其传播的隐蔽性和
随着XML成为信息表示与交换的实质标准,互联网上涌现出大量XML文档。XML文档数量与规模的与日俱增为数据库领域提出了新的课题,如何有效的管理XML数据并在此基础上支持高效的