【摘 要】
:
电子邮件是互联网的最重要应用之一。它在给人们日常工作和生活带来很大便利的同时,也带来了一种令人讨厌的副产品——垃圾邮件。随着垃圾邮件越来越泛滥,人们在技术和法律方
论文部分内容阅读
电子邮件是互联网的最重要应用之一。它在给人们日常工作和生活带来很大便利的同时,也带来了一种令人讨厌的副产品——垃圾邮件。随着垃圾邮件越来越泛滥,人们在技术和法律方面都进行了不断的努力,垃圾邮件已经得到了一定的控制。 垃圾邮件过滤的主要技术包括白名单与黑名单技术、规则过滤、基于关键词匹配的内容扫描,以及基于内容的文本分类方法等。目前的垃圾邮件过滤系统如贝叶斯过滤系统等,从过滤效果来看,并不是十分理想,存在的主要问题是将非垃圾邮件判定为垃圾邮件的几率较高,使用户宁愿接收到垃圾邮件也不愿意使用邮件过滤系统。基于粗糙集的垃圾邮件过滤是一种基于规则的内容过滤方法,将粗糙集理论用于垃圾邮件过滤是一个新的研究方向,可以降低垃圾邮件错判率。 本文的选题正是基于上述背景,本文的工作主要包括以下几个方面: 1.给出了垃圾邮件的定义,探讨了垃圾邮件的危害; 2.分析并总结了当前主要的垃圾邮件过滤技术,对常用邮件分类方法的基本原理及分类准确率进行了介绍; 3.介绍了基于粗糙集的垃圾邮件过滤系统模型和工作流程,并在此基础上,对该模型进行了改进; 4.对基于粗糙集的垃圾邮件过滤系统中的特征选择问题进行了研究,提出了用Mitra’s+SFS算法来进行邮件特征选择,将过滤冗余特征和不相关特征相结合,提高了系统分类准确率; 5.利用基于Java的机器学习软件Weka,对所选出的特征子集进行分类实验,并对实验结果进行评估,验证了所提出特征选择方法的有效性。
其他文献
综合决策支持系统(synthetic decision support system, SDSS)是决策支持系统的一个重要的分支。它发挥了传统决策支持系统和新决策支持系统的辅助决策优势,实现更有效的辅助
长期以来,机器翻译系统都是以词为语言翻译的基本单位。人类自然语言中词的使用非常灵活,在机器翻译处理中有很大的歧义性,这是导致机器翻译译文难以提高的关键因素之一。这就需
光正交频分复用(Optical orthogonal frequency division multiplexing,OOFDM)技术以其多径对抗能力、高频谱效率、抗载波间干扰(Inter-carrier interference,ICI)和符号间干扰
自上世纪90年代以来,互联网已经迅速发展成为我们生活、工作和学习中一个不可或缺的重要组成部分。如何从这个巨大信息海洋中寻找所需的信息资源或定制自己的服务成为人们迫
嵌入式系统是一种具有特定功能的计算机系统,它与通信技术和网络技术的结合,极大的增强了设备的网络和通信的灵活性和智能性。随着信息技术的不断发展和用户需求的不断增长,
Web服务作为目前最新颖的分布式计算模型,有力的整合了Internet上的各种资源。复杂的Web服务可以由Web服务组件和基本服务构成。现有的Web服务组合技术研究重点在于服务的自动
蓬勃发展的零售电子市场正在吸引越来越多的商家和消费者在线进行商品交易。智能Agent技术在电子商务系统中的应用使得商务活动许多环节的自动化成为可能。而在实际商务活动
集成剪枝所解决的问题是从原始集成系统中,找到一个合适的成员模型子集来替代原始集成系统,这是一个组合优化问题。剪枝不仅可以减小集成系统的规模,更能够提高系统的推广性能。
无线传感器网络技术的兴起,给信息感知、获取和处理技术带来了革命性的变化。无线传感器网络中的节点具有体积较小,一般通过自身电池进行能量供应的特点,使得无线传感器网络在硬
针对目前IMA存在的使用相同硬件资源的不同功能之间的故障扩散问题和动态资源管理,分布式综合模块化航空电子(DIMA)已成为航空电子系统结构发展的方向。DIMA综合了联合式航电和I