基于支持向量机理论的垃圾邮件过滤模型

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:suibianyidianyaoshi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及,电子邮件以其快捷,方便的优点逐渐发展成为人们工作和生活的重要通信工具之一。然而,随之而来的垃圾邮件问题也日益严峻,它不仅传播有害信息,而且耗费大量的公共资源,侵害电子邮件用户和企业的合法权益。当前已经存在许多的垃圾邮件过滤方法,但是目前垃圾邮件不降反升的局面表明,虽然当前垃圾邮件过滤方法众多,但是还有许多垃圾邮件相关问题没有找到好的解决办法,垃圾邮件过滤效果不是很理想。所以,研究一种更加新型高效的,快速的邮件过滤系统仍具有特别的现实意义。支持向量机(SVM)是在统计学习理论的基础上发展而来的一种新的模式识别方法,在解决有限样本、非线性及高维模式识别问题中表现出许多特有的优势。它不仅考虑了对推广能力的要求,而且追求在有限信息的条件下得到最优结果。其中,SMO方法是相对众多已有研究的SVM算法较为简单的算法,它将工作样本集中的样本数减少为2,避开了复杂的数值求解优化问题的过程,但是相应的代价就是迭代次数的增加。本文提出一种基于支持向量机理论的垃圾邮件过滤模型,模型使用的过滤算法是一种改进型的SMO算法-SMO主动学习算法。该算法能很好的继承SMO的优势,同时又解决SMO算法的不足,减少二次寻优的迭代次数。本模型主要以探索为目的,观察其可行性和有效性。初步实验证明,该模型具有过滤效果好,训练时间短的特点。本文首先介绍了垃圾邮件的基本常识,包括垃圾邮件的定义和危害,然后介绍了现有的垃圾邮件过滤方法。由于基于SVM的垃圾邮件过滤方法是以内容过滤为主,所以还着重阐述了与内容过滤相关的文本分类以及机器学习的知识。其次,介绍了统计学理论中SVM理论的定义和邮件样本预处理工作的内容,并由SVM理论引申出SVM垃圾邮件过滤算法,推导出SVM垃圾邮件过滤模型,在模型实现部分还给出了重点代码框架。最后是对SVM垃圾邮件过滤模型性能评估和对其性能优化的讨论。此外,论文中还讨论了反馈学习技术在SVM垃圾邮件过滤模型中的研究,希望能够在以后的工作中能够将我们的SVM垃圾邮件过滤算法与反馈技术相结合,确保实现过滤效果更优的垃圾邮件过滤模型。总之,本文提出的SVM垃圾邮件过滤模型的优点在于通过一种改进的SMO主动学习算法来改善传统SVM算法中由于样本数目较大时,占用大量内存以及在二次型寻优过程中要进行大量的矩阵运算的问题,并且通过主动学习的方法,
其他文献
计算机硬件的发展正根据摩尔定律前进,宽带网络的应用条件日益成熟,计算机互联网上各类服务不断完善。流媒体技术作为计算机应用在宽带网络上的一项新兴技术,正得到越来越多的关
随着科学技术进入一个多学科相互交叉、相互渗透、相互影响的时代,源于模拟某一自然现象或过程并且具有自组织、自学习、自适应等特征的神经网络、细胞自动机和进化计算等研
21世纪,计算机迈入了充满机遇的阶段一后PC时代,嵌入式系统已广泛地应用于信息家电、移动通信、手持信息设备以及工业控制等领域。由于嵌入式软件的特殊性,使得它的开发比传统应
互联网业务的种类和数量近几年来迅速增长,与此同时人们对网络服务质量的要求也越来越高,如何在现有设施的基础上使网络性能达到最优是网络管理者和网络服务提供者都非常关心
随着信息时代的来临,数字信息已经成为人类最重要的资源。而表单是最常见的一种信息载体,如何将表单文档中的信息电子化、数字化,已经成为研究的热点之一。表单图像版面分析
本文在分析了国内、外各种单点登录系统的实现模型及其优缺点的基础上,提出了一套适用于目前多种企业应用的单点登录系统模型。并对此系统的系统框架和具体流程进行了介绍,同
为探索公共突发事件期间民众在网络空间争相转发分享信息时表现出的群体性特征,以2012年发生的雅安地震、2013年发生的彝良地震、2009年爆发的甲型H1N1流感疫情、2013年爆发
随着机器人等复杂控制系统的发展,对于驱动机构精密度和稳定性能的要求日益提高。传统上由多个单自由度驱动元件和复杂机械传动机构组成的控制系统虽然满足了对于复杂系统多维运动控制的要求,但其复杂的控制策略和机械机构的配合误差成为系统性能的一个重要瓶颈。作为多自由度驱动元件的球形电机简化了系统机构,提高了系统动稳态性能,成为当前机电驱动元件的研究前沿之一。 本文研究的稀土永磁球形步进电动机是一种新型的
无线传感器网络(Wireless Sensor Networks, WSN)在军事、医疗和环境健康监测等领域具有重要的应用价值,而可靠性评估是其走向实际应用的关键步骤。受节点状态的组合复杂性制
随着互联网技术与通信技术的发展,信息技术已然成为21世纪时代的主流,智能终端设备的单一化已经满足不了人们的需求,这时具有“数字家庭”概念的智能家居应运而生,且在国内迅