基于SVM的垃圾邮件过滤的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:fairytalezoey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要介绍了在Windows环境下垃圾邮件过滤系统的设计模型和实现方法。该过滤系统能够对一些典型垃圾邮件进行识别判断过滤,而且也同时能够对其它邮件进行分类。经统计,从2001年开始,垃圾邮件增长的速度非常快,网民每周收到的垃圾邮件数量是非垃圾邮件数量的两倍,针对近几年来垃圾邮件的愈演愈烈,急需一种能有效防范垃圾邮件的方法。基于内容过滤就是其中一种方法。所以本文介绍的Windows下的垃圾邮件过滤系统,专门针对邮件的内容过滤进行了研究,具有较高的研究价值。 开发该系统的主要目的是了解当前垃圾邮件过滤的发展现状,学习有关过滤的技术,能有效的阻止垃圾邮件的泛滥。通过学习和实践,发现垃圾邮件过滤发展中遇到的问题,并结合自己的研究工作提出一些看法和见解。 本文首先介绍了垃圾邮件的现状和现在的反垃圾邮件技术的发展现状,以及邮件过滤的基本概念和原理。介绍了当前有关信息过滤和文本分类的相关研究。然后重点介绍了支持向量机的原理、各个参数对支持向量机的影响以及应用到本系统的方法;嵌入到OUTLOOK的方法;该系统的结构、具体的分词设计和SVM设计与实现。最后,总结了当前反垃圾邮件工作面临的许多问题,探讨了解决这些问题的方法和思路以及反垃圾邮件工作的未来,为以后的研究工作做出了一定的方向性指导。 本文目的是希望能设计一个嵌入到OUTLOOK2000中使用SVM作为分类器的垃圾邮件过滤系统。搜集能建立词库的样本集,以便SVM能够为垃圾邮件或者正常邮件建立一个分类器。该系统分为服务器端和客户端,基于邮件内容过滤主要在客户端,该系统是应用在OUTLOOK上。通过使用支持向量机SVM作为分类算法,对邮件进行过滤。实验证明,该系统对垃圾邮件的过滤有较好的查全率和查准率。
其他文献
企业应用集成(EAI)是近年来逐渐兴起的一项技术,目的是将企业原有的多个应用系统相互连接,实现多应用软件系统的交互协作,充分利用企业的信息资源实现信息共享,消除企业IT系
J2EE是由Sun公司推出的一个支持企业级计算的Java平台,其EJB、RMI、JMS等技术及Java的跨平台性、开放性等特性使其非常适合于作为企业信息系统集成的平台,XML是一种标记语言,具
随着市场竞争的日益激烈,企业的业务过程不再是一成不变,它需要根据市场的需求不断地做出动态的调整和修改。工作流技术的出现使得业务过程更加自动、高效的执行,然而它不能
随着国内医疗体制的逐步完善和医疗市场的进一步开放,数字化医院越来越成为社会关注的热点,成为影响医疗水平,服务质量和医院竞争力的重要因素。目前,医院的HIS(医院信息系统)、L
机器人足球比赛是近年来在国际上迅速开展起来的高技术对抗活动。它是人工智能领域与机器人领域的基础研究课题,是一个极富挑战性的高技术密集型项目。本文以足球机器人系统
随着互联网的迅猛发展和普及,人们通过计算机与互联网联接,可以从世界各地实时的接收和发送大量、最新的信息,但在信息交换过程中存在着一个突出的问题,就是多种多样的数据格
自从分布式仿真系统诞生起,互联和重用就成为一个重要的研究课题。当今的分布仿真应用系统开发向大型化和复杂化方向发展,尤其是HLA标准的公布,为仿真系统的复用和互操作提供了
学位
首先本文在EAM专家意见和现场调研的基础上,通过分析大量EAM技术资料,整理并分析总结了EAM系统的特点以及其工作流程。对现行的设备管理模式进行了分析。其次根据领域工程的
本文作为国家自然科学基金资助课题“基于医学图像数据挖掘技术的研究”的一部分,对医学影像数据挖掘中的一些关键技术和主要算法做了深入的研究。针对乳腺影像数据库,提出了适
随着电信运营商通信和网络等技术设备的发展,窄带拨号和宽带ADSL 上网业务的开展和普及,国内计算机上网用户的迅速增加,网上业务已经成为电信持续发展的重要组成部分。如何在