基于内容的反垃圾邮件方法研究与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:SANTACRUZ1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
日益泛滥的垃圾邮件,既浪费用户时间、消耗了网络传输资源以及邮件服务器存储空间,也是病毒、僵尸网络等恶意代码的策源地。目前,应对垃圾邮件的主要方法和技术手段有很多,其中,基于内容分析的文本分类技术已经成为当前的研究热点,最为典型的是基于贝叶斯模型的过滤方法。  结合文本分类技术以及贝叶斯(Bayes)理论,构造基于贝叶斯分类的垃圾邮件过滤模型,该模型采用代理的原理,工作在邮件服务器和客户端之间,可以有效的过滤和分离用户的垃圾邮件。模型主要包括邮件代理、邮件解析、邮件过滤等模块,邮件过滤模块采用改进的贝叶斯算法来识别垃圾邮件,着重对贝叶斯算法中需要的中文分词、特征提取、邮件训练过程进行设计和实现。邮件代理模块采用Socket通信方式,利用代理服务器的工作原理,实现对邮件的接收和过滤,采用包过滤和NAT技术很好的做到了对用户的完全透明。这两部分也是该过滤系统的关键。  对贝叶斯过滤算法进行研究并给出该算法的一个C/C++的实现,在此基础上,为减少垃圾邮件误判造成的影响,对传统的贝叶斯算法提出了相应的改进措施:引入损失因子来评估将正常邮件误判为垃圾邮件时带来的风险,通过理论推导、假设和实验验证,得出损失因子的最佳值,改善正常邮件的误判问题。通过实验测试和分析,结果表明基于改进的贝叶斯算法用于实现垃圾邮件过滤是有效的方法之一。
其他文献
信息安全是近几年来迅速发展的学科,它融合了网络,系统结构,数据库等多个领域的理论和技术。因其涉及的领域广泛,并且现实意义重大,信息安全已经成为研究人员和商业组织比较
随着高校招生人数的扩大,出现了“实验课人多器材少,实验时间有限、效果不好;实验室平时少开放、资源浪费,而学生有疑问和兴趣又没地方实践”的不合理现象。目前国内一些高校针对
随着互联网、计算机等信息技术和应用的发展,越来越多的交易活动由现实物理环境转向存在与网络的虚拟社区中,用户在购物或获得服务后通常会在网上发布评价信息。产品评价反映
三角网格模型是计算机中表示三维物体的常用表达方式。三角网格模型在医学、工业设计制造、艺术等领域有广泛应用。随着数据采集方式的发展,三维模型对现实物体的仿真度越来
随着计算机的迅速深入和普及、信息技术的迅猛发展,经济、社会等各方面的重要信息在计算机中存储和在网络中传输。信息安全的研究成为最热门的研究方向之一。终端系统的安全
计算机与数据通信的快速发展和广泛应用使得网络之间的信息传输量急剧增长,整个社会对网络的依赖越来越大,网络安全也变得越来越重要。入侵检测系统作为一种主动的信息安全防
目的 观察维吾尔医治疗小儿(5~13岁)白癜风的疗效.方法 治疗儿童白癜风-调节致病异常体液质的同时,给予有助于消化和改善肝功能、活血、补充黑色素、改善皮肤代谢功能、滋补全
随着三维扫描与建模技术的发展以及计算机硬件环境的改善,三维模型已经逐渐结合到诸多应用领域中,如:地质研究、文物与遗迹保护、游戏娱乐等。而三维模型的建模与绘制是这些
随着烟草行业体制改革的推进,烟草公司将逐步实现生产管理、市场营销、技术研发、物资供应“四统一”,这就对卷烟物资管理提出了更高的要求。建设烟草行业物资管理信息平台,
计算机网络性能是衡量计算机网络运行状态的各项指标的综合。计算机网络因其发展的高速度和各自为政的研究体制,以及兼容性等诸多问题,出现了一些和总体发展趋势及未来需求不