【摘 要】
:
随着Internet的迅猛发展,电子邮件以使用方便、快捷、廉价、可靠的特点很快被广大网民所接受,已成为当前最流行的信息交流方式。电子邮件给我们带来便利的同时,垃圾邮件应运
论文部分内容阅读
随着Internet的迅猛发展,电子邮件以使用方便、快捷、廉价、可靠的特点很快被广大网民所接受,已成为当前最流行的信息交流方式。电子邮件给我们带来便利的同时,垃圾邮件应运而生,带来了巨大的危害,因此研究和设计高效率的垃圾邮件过滤系统有着重大的现实意义。 贝叶斯算法广泛应用于文本分类等领域,垃圾邮件过滤本质上是文本分类问题,因此贝叶斯算法在垃圾邮件过滤领域有着很好的应用。基于贝叶斯算法的英文垃圾邮件的过滤达到了比较理想的效果,但对中文的支持还有一定的难度。本文在对贝叶斯算法进行了比较深入的研究的基础上,设计了基于贝叶斯算法的垃圾邮件过滤系统,对中文垃圾邮件的过滤达到了比较好的效果。 本文首先对垃圾邮件进行了的概述,并对当前垃圾邮件过滤技术进行了综合介绍。其次,对贝叶斯算法及国内外关于贝叶斯算法在垃圾邮件过滤中的应用情况进行了深入的分析与研究,设计了基于贝叶斯算法的垃圾邮件过滤模型。基于贝叶斯算法的垃圾邮件过滤得的实质是基于邮件内容的过滤,在分析了电子邮件的格式标准的基础上,提出了解析电子邮件内容的算法。 最后,我们用Java语言和MySQL数据库设计了一个基于贝叶斯算法的垃圾邮件过滤系统,为了提高贝叶斯算法对中文邮件的处理精度,引入了中文分词机制。中文分词采用的中国科学院计算技术研究所汉语词法分析系统ICTCLAS的开源代码。经过测试,系统的正确率为95%,比Foxmail、DreamMail和Outlook的垃圾邮件过滤功能的效果好。
其他文献
随着互联网络的快速发展,网络安全问题日益突出。由于网络入侵手段的多样化,传统的防火墙技术不足以巩固整个网络安全体系,入侵检测技术由此引起了人们越来越多的重视,已经成
Ad Hoc网络是由一组带有无线通信收发装置的移动终端节点组成的一个多跳、临时、无中心网络,可以在任何时候、任何地点快速构建起来的移动通信网络,并且不需要现有基础网络设
并仃程序设计滞后问题已成为多核处理器发展的瓶颈。为了解决该问题,充分利用多核处理器的性能优势,突破传统并行程序设计模式的局限性,一种新型的并行程序设计模式-事务存储
现代社会复杂多变,地震、山体房屋建筑坍塌、火灾、劫持绑架、恐怖主义时有发生,严重威胁着国家和人民的财产安全,更主要的是人民的生命安全。在这些城市灾害发生的时候,公安执法
为了了解学生的学习情况,分析教学的效果,都需要对学生进行考核、评价,而一份高质量的试卷是准确评价学生的基础。在日常教学中,为了组好一份试卷,教师往往要花费很多时间,是要利用
在嵌入式系统的工业、军事及个人应用中,许多场合需要使用存储器来存储大量的数据,而且要求断电时能够保存数据。存储卡的特点刚好满足了嵌入式存储的要求:体积小、功耗低、
在搜索过程中,如果用户不了解目标领域,或者用户的搜索任务相对比较复杂,或者系统对信息的索引不充分,这种情况下用户的搜索行为通常称为探索式搜索。在探索式搜索中,由于基
随着网络技术的迅速发展,人们对于多媒体通信的需求已经从单一的语音、视频业务提升为综合语音、视频、图片、文字于一体,并集成即时通信、文件传输、电子邮件等多种应用的统一
Web服务是基于网络、分布式、自包含、自描述、模块化的应用程序。越来越多的企业将自己的应用程序作为Web服务发布。相应的,服务的用户对服务的反应速度,服务的功能,服务的
解决背包问题是解决优化组合所面临的问题之一,也属于NP难问题,在现实中有着广泛的应用背景,例如在解决大量的复杂组合优化问题进行算法设计时,它往往会作为一个子问题出现。由于