垃圾邮件的防范与过滤

来源 :学习导刊 | 被引量 : 0次 | 上传用户：yaojing45

【摘要】

：

【作者】

：

李冠宏

【出处】

：

学习导刊

【发表日期】

：

2014年7期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　关键词：垃圾邮件；防范方法；过滤技术；过滤软件；
　　随着Internet的迅速普及，电子邮件以其快捷、方便、低成本的特点逐渐成为人们进行信息交流的主要媒介之一，但垃圾邮件也越来越泛滥。企业资源和个人信息正在不断被其攻击和侵犯。用户如何防范垃圾邮件，减少垃圾邮件的干扰，已经成为社会和邮件使用者关心的焦点问题。本文由垃圾邮件的历史、定义、现状及其危害出发，提出了切实可行的防范措施，讨论了电子邮件的过滤方法以及一些常用的技术，对目市场上前沿的反垃圾邮件技术介绍和分析。
　　1 垃圾邮件
　　1.1垃圾邮件的历史
　　垃圾邮件并不是在电子邮件技术出现后就马上出现的。从其产生的历史过程中，可以看到互联网是如何从一个学术和交流的平台逐步变为商业工具的。
　　1978年，DEC公司的一位营销人员突发奇想，认为直接通过ARPANET邮件的方式来推销他们的计算机是一种很好的方法。于是他和公司里的其他人收集了ARPANET用户的地址，并将广告信向所有这些用户发送，这就是历史上第一封真正意义上的垃圾邮件。
　　Internet取代ARPANET后，在20世纪80年代和90年代早期，网络上一些人则开始收集和贩卖邮箱地址。1995年8月，第一次有人公开贩卖20万个邮箱地址；……到 2001年8月，已经有内含2.1亿个邮箱地址的列表在出售了。各种垃圾邮件网站和组织也开始出现。
　　1.2垃圾邮件的种类
　　中国反垃圾邮件中心2005年公布，用户收到的垃圾邮件中，“网上购物”、“IT产品推销”、“情趣用品”、“政治种族”四种邮件，占到用户收到垃圾邮件的前四位。
　　垃圾邮件的语言种类统计，中英文垃圾邮件比例占到97.45%，其他语言所占比例可以忽略不计。
　　垃圾邮件的文件格式排名中，用户收到最多的是“HTML网页”格式的垃圾邮件，其次是“纯文本”邮件和“图片”邮件，占到用户收到垃圾邮件比例的83.4%。
　　1.3垃圾邮件的危害
　　垃圾邮件是因特网带给人类最具争议性的副产品，它的危害主要表现：
　　1）占用网络带宽，降低网络运行效率。
　　2）侵占信箱空间，侵犯收件人的隐私权，损害了他人的信誉。
　　3）劳动生产率下降。每年浪费在处理垃圾邮件上的时间高达15亿小时。
　　4）传播病毒，被黑客利用。
　　5）严重影响ISP的服务形象。
　　6）宣传邪教，蛊惑人心，传播谣言及色情等内容，。
　　7）窃取密码，骗人钱财，对和谐社会造成了危害。
　　2垃圾邮件的防范
　　防范垃圾邮件的传播，主要从以下6各方面，其效果是立竿见影。
　　1）设定好记但难以猜测的电子邮件账号
　　2）不要随便公开你的电子邮件地址
　　3）尽量采用转发的方式，转发到你的ISP的本地信箱
　　4）尽量使用免费邮箱且分类使用
　　5）不要回复垃圾邮件
　　6）不要订阅非正式及不健康的电子杂志
　　3过滤技术
　　对抗垃圾邮件最重要的技术是过滤技术，过滤技术在过滤垃圾邮件主要基于以下三种方法：
　　3.1基于IP层的垃圾邮件过滤方法
　　基于IP层的垃圾邮件过滤方法，其中有黑名单、白名单、实时黑名单和实时白名单等。
　　黑白名单过滤：黑白名单是一个简单有效而最为常用的过滤方法，黑名单原理是把已知垃圾邮件制造者的域名或IP地址整理成列表，以此为依据，拒绝任何来自列表的邮件；白名单是黑名单的反义词，规定邮件接收者只接受自己信赖的邮件发送者所发送的邮件。其优点是对垃圾邮件处理能力的要求较低，它能够节省大量的带宽、存储容量和处理时间。缺点黑名单是基于用户的投诉和采样的积累而建立的，当垃圾邮件制造者快速改变邮件地址时，处理效果将大幅下降，忽略垃圾邮件和过滤掉正常邮件的错误将相对增加。而对白名单来说，如果以前获得批准的用户改变了邮件地址，用户必须再次将新地址列入白名单，否则将收不到该用户的电子邮件。
　　3.2基于规则的垃圾邮件过滤方法
　　就是在邮件标题和内容中寻找特定的模式，设置一些过滤规则。这些规则通常有信头分析、群发过滤、关键词精确匹配以及邮件内容中的其它特征。通过查找已有的垃圾邮件的匹配模式来过滤垃圾邮件，这需要依赖开发商不断的更新邮件规则。优点是规则较易理解和修改、易推广和共享。其缺点由于规则是静态，是由人来编写的，更新速度慢和时效性差便是它的软肋，，所以在规律性不明显的应用领域效果较差。
　　其中最著名的规则过滤方法之一是决策树方法，该方法通过按照某种属性的顺序自顶向下地生成一棵树，树的每个节点是属性名，而每条边是属性值，从树根到树叶的一条路径便对应一条规则，使用决策树来过滤垃圾邮件，得到垃圾邮件过滤的正确率和召回率在88%左右.
　　3.3基于统计过滤方法
　　是对邮件内容统计分类的过滤方法，正确率高，速度快，是垃圾邮件处理技术中很受欢迎的一种方法，有广泛的应用前景。如贝叶斯，SVM，KNN等。
　　3.3.1贝叶斯分类
　　贝叶斯分类基于贝叶斯定理，理论基础是：在已知的垃圾邮件中，一些关键词出现的频率较高，而在非垃圾邮件中另一些关键词的出现频率较高，通过特定算法，建立垃圾邮件和非垃圾邮件关键词的贝叶斯概率模型，然后利用该模型判断邮件是否为垃圾邮件。贝叶斯过滤方法优势表现为：效率较高，对训练样本进行一次扫描，再进行统计分析；占用存储空间少。基于其优越性，许多学者对基于贝叶斯分类算法进行研究改进，以提高贝叶斯过滤方法的性能。自学习的贝叶斯算法，就是基于多级属性集规则的贝叶斯分类新算法，通过实验验证有效地提高贝叶斯算法的性能。但它也具有一定的局限性：对训练样本依赖性大，对中文邮件处理效果不显著。　　3.3.2 自学习K邻近算法（KNN）
　　KNN基于类比学习，针对现有垃圾邮件过滤算法所存在的训练样本与测试样本分布不一致而导致实际应用效果比较差的现象，提出了一种基于自学习K近邻方法的垃圾邮件过滤算法。
　　3.3.3支持向量机（SVM）
　　针对中英文混合垃圾邮件过滤问题，提出一种基于支持向量机（SVM）的过滤方法.通过改进SVM中线性核的表示方式，解决存储空间和计算最问题.通过领域术语自动抽取技术，增强垃圾邮件过滤的语义单元识别能力，提高垃圾邮件分类性能.
　　4 前沿技术
　　由于垃圾邮件的不断翻新，这就要求反垃圾邮件技术要不断发展和创新，下面就目前反垃圾邮前沿技术简要的阐述。
　　4.1SPF技术
　　SPF的全称是Sender Policy Framework，是一种可以保障域名所有人免受垃圾邮件发送者冒充发信的机制。其做法是在域名的DNS中加入SPF记录，指出该域名只通过某些主机发送邮件。
　　4.2行为判别技术
　　行为判别技术是当前反垃圾邮件一个新的领域和方向。清华大学联合研究发现，垃圾邮件在发送阶段处于活跃的状态，恶意的行为特征远比内容特征要明显，经过对几千万封垃圾邮件的收集和分类，对各种垃圾邮件的行为、方式、邮件特征进行统计学研究，首创垃圾邮件“行为识别模型”。
　　行为识别模型包含邮件发送过程中的各类行为要素，如时间、频度、发送IP、协议声明特征、发送指纹等。在统计分析中发现，在行为特征上，垃圾邮件和正常邮件具有极高的区分度，特别是对大量采用动态IP发送的邮件更是如此。采用垃圾邮件行为模式识别模型不仅大大提高了垃圾邮件辨别的准确率，而且不需要对邮件的全部内容进行扫描，所以大大提高计算处理能力。
　　4.3 空中拦截技术
　　空中拦截的技术，原理是网关通过监测接受邮件流量大小来识别和屏蔽垃圾邮件。例如：一封“法轮功”的信，通过监测，差不多每一封在160K到180K左右，如果把这些信都收下来的话，流量就产生了。网关只是接收4K到8K就要缓冲，只要达到8K的数据，就认为是“法轮功”邮件或垃圾邮件。因为很多垃圾邮件跟正常邮件不一样，很多流量屏蔽在网关之外。
　　结论
　　垃圾邮件与反垃圾邮件的斗争是一个长期的过程，人们不断地改进和完善反垃圾邮件技术来抵抗其危害。从而减少互联网中流通的垃圾邮件的数量，让网络更好的为企业和个人服务，帮助人们远离垃圾邮件的骚扰，营造一个健康、和谐、有序的互联网社会环境。
　　参考文献
　　[1] .CNNIC 中国互联网发展状况统计报告.http//www.baidu.cn
　　[2] 王斌.潘文峰.基于内容的垃圾邮件过滤技术综述.中文信息学报，2005.05
　　[3] 陈宇豪.阚丽娟.张鹏.垃圾邮件的防范技术. 东北水利水电，2009.12
　　[4] 徐激.龚俭。垃圾邮件的综合过滤方法 .计算机科学，2005 32（2）
　　[5] 姚青.垃圾邮件面面谈.中国科技信息，2009.02
　　[6] 熊志勇.数据挖掘在反垃圾邮件领域中的应用和研究：[硕士学位论文].南昌：南昌大学，2006.6

其他文献

“AIS系统与应用”课程实验教学平台设计

摘要：船舶自动识别系统AIS设备价格昂贵，在进行AIS通信实验之前还要架设VHF天线和GPS天线，对实验室的场地有要求。本教学改革课题研究开发AIS实验教学平台，学生可以更好地掌握AIS理论课程的原理与方法，节省实验室成本。　　关键词：AIS（自动识别系统）；教学改革；实验平台　　1.课题研究背景　　在我校《AIS系统与应用》课程教学实验中使用船舶自动识别系统AIS设备，价格昂贵，目前实验室只有两

期刊

敲准教育的鼓点儿走进官兵的心坎儿

摘要：思想政治工作是影响人、教育人、塑造人的重要手段，军队的大熔炉只有加入思想政治工作这味真火，才能真正实现战士由铁到钢的转变。作战有实打实的目标，思想教育工作似乎虚无缥缈，然而只要敲准教育的鼓点、找准思想的穴位，依然能够做到“纵横议论析时事，如医疗疾进药方”，也就能够做到药到病除，妙手回春。　　关键词：思想教育关键点症结点　　敲准思想上的关键点，夯实理想信念这个“压舱石”。思想是行为的先导，

期刊

浅谈中学历史教学学生历史观的培养

摘要：历史教学要以唯物史观为指导，坚持科学的思想导向，引导学生正确的考察人类历史的发展进程，逐步学会全面、客观地认识人类社会历史的问题。本文结合笔者自身教学实践，在阐述历史观的含义的基础之上然后分析历史教学之中学生历史观培养的必要性，然后有针对性的对如何在历史教学之中培养学生历史观提出了几点建议。　　关键字：历史教学；历史观；培养　　历史观的含义是什么？所谓历史观就是人们对社会历史的根本观点的总看

期刊

任务引领式教学方法在《城市轨道交通运营组织》课程中的应用

摘要：针对目前高职城市轨道交通运营管理专业教学中普遍存在的问题，进行“任务引领式”教学改革与实践，使学生积极、主动地参与到获取知识的课堂学习中，从而获得比较好的教学效果。　　关键词：任务引领式教学；城市轨道交通运营组织；主动学习　　一、问题　　目前，高等职业院校学生普遍存在学习热情不高、不愿思考、学习怕苦畏难的现实问题，而高职院校又是我国大力培养高素质技能型人才的重要基地，因此，仅注重知识传授的传

期刊

文化信息资源共享建设在职业技术学院图书馆的应用

摘要：随着计算机网络的普遍的应用，文化信息资源共享建设工程也在各个领域中开始应用，本文详细的讲解了文化信息资源共享建设在职业技术学院图书馆当中的应用，以及应用过程中存在的问题和解决对策，最后探讨了文化信息资源共享建设对职业技术学院图书馆的影响。　　关键词：文化信息；资源共享；图书馆；　　信息技术带动了网络文化信息资源共享建设工程逐步地走进了人们的生活。掌握文化信息资源共享概念与对职业技术学院图

期刊

坚定信念践行宗旨

纪念是为了更好地传承，传承是为了把党的事业继续推向前进。今年是我们党成立93周年，也是实施“十二五”规划承上启下关键之年。困难与优势同在，机遇与挑战并存，各级党组织和广大共产党员应紧紧抓住和充分用好当前的重要战略机遇期，以崭新的精神风貌和过硬的工作作风，推动企业科学发展，努力形成千帆竞发、百舸争流的良好局面。下面，是我在建党93周年之际的几点认识。　　一、解放思想，勇于担当，永葆和谐发展精神活力　

期刊

关于《思想道德修养与法律基础》课程实践教学模式的探讨

【摘要】《思想道德修养与法律基础》课程是全国高校都开始的一门大一年级基础课程，按照国家相关文件要求各高校开展扎实有效地实践教学环节，开展几年以来，各高校教学效果大相径庭。针对目前现实情况，转变传统大班授课模式，加入实践课堂，切实提高课程对学生的教育作用。　　【关键词】思想道德；法律基础；实践教学　　根据《中共中央宣传部、教育部关于进一步加强高等学校思想政治理论课的意见》及其《实施方案》的规定，《思

期刊

高职职业指导课程教学现状及改进策略分析

摘要：高职院校的职业指导课程有着不可或缺的重要作用，是缓解高职毕业生就业难问题的有效途径之一。然而从目前来看，该门课程在高职院校中还处于初步发展阶段，存在一系列亟待解决的问题。本文先分析高职职业指导课程教学的现状，接着提出一套有针对性的改进策略，希望能起到抛砖引玉的作用。　　关键词：高职院校职业指导课程教学现状改进策略　　随着国家扩招政策的持续深入，我国高等教育踏上了大众化之路，高校大学生的

期刊

以数学教学为例谈谈课堂提问的设计原则

摘要：课堂提问是教学过程中不可缺少的一部分，也是老师与学生在课堂上最为直接的对话与交流。它能够让学生于老师彼此更加的熟知与了解，能让学生更清晰的把握所学知识的重点与脉络，可见课堂提问的重要性。通过长时间的调差、研究发现，现阶段高中数学教学过程中，在课堂提问方面还存在很大的问题，尤其是不能清晰把握课堂提问的设计原则，因此也就不能完全发挥出其在教学中的重要作用，文章以此问题作为主要研究对象，对课堂提

期刊

大理学院辅导员学校归属感的研究

摘要：辅导员作为大学生日常思想政治教育的组织者、管理者和指导者，在人才培养上担负着重要职责，加强辅导员的学校归属感，将会使辅导员延续工作激情、提升工作主动性和增强责任意识，为大学生发展提供长期保证。本文对大理学院辅导员学校归属感现状进行了研究，分析当前辅导员职业归属感缺乏的原因，并提出加强辅导员归属感的对策。　　关键词：高校辅导员；学校归属感；对策　　一、归属感的定义　　归属感（Sense of

期刊

垃圾邮件的防范与过滤

其他学术论文