基于改进型树突状细胞算法的垃圾邮件过滤研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:slyde
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子邮件用户面临的一个令人头疼的常见安全问题就是每天会接收到大量垃圾邮件。目前,大多数电子邮件系统中的传统对策是简单的过滤机制,即根据用户定义的一些关键字来阻止或隔离不需要的电子邮件。针对传统的垃圾邮件过滤技术的精确率和召回率比较低以及过滤不稳定等问题,改进了树突状细胞算法(Dendritic cell algorithm,DCA)并应用于垃圾邮件过滤,改进后的算法在召回率、精确率和误报率等性能方面比较优异。树突状细胞算法多用于检测网络入侵和网络异常,在这方面已经取得了不错的效果。由于入侵检测、垃圾邮件过滤和免疫系统之间的相似性,研究人员设计了经典树突状细胞算法,并应用于垃圾邮件过滤,取得了初步的研究成果。但经典树突状细胞算法存在一定的缺陷,例如树突细胞算法中有着过多的参数且信号处理公式中权值是经验数值或随机值,其信号定义也有不足,而这些问题导致了邮件过滤的精确率和召回率不稳定。为了提高树突状细胞算法过滤垃圾邮件的精确率和召回率,对树突状细胞算法进行了以下几点改进:(1)因为传统树突状细胞算法的大部分信号和参数需要人为定义,且实验表明过多的参数和信号定义是对算法性能没有提升作用的,所以将传统树突状细胞算法的4类输入信号精简为2类输入信号,通过定义新的参数将传统树突状细胞算法所产生的3类输出信号精简为2类输出信号。(2)对于信号处理公式中权值是经验数值或者是随机生成这一问题,引入动态优化算法对权值参数进行了优化,并加以实验测试。实验结果表明,改进后的算法提高了垃圾邮件过滤的精确率和召回率,降低了误报率,且该算法相对于其他算法更稳定。(3)以改进的树突状细胞算法为核心提出了一种多策略过滤模型,该模型是将贝叶斯算法、逻辑回归算法和改进的树突状细胞算法集成在一起经过某种策略所形成的过滤模型。该模型优化了实验结果,提高了稳定性,但是该模型降低了算法的运行速度。(4)将提出的多策略过滤模型用于设计企业的垃圾邮件过滤系统并进行测试,测试结果表明设计的邮件过滤系统能够有效过滤垃圾邮件。以UCI Spam Base数据集为实验数据集,对改进的树突状细胞算法(Improved Dendritic Cell Algorithm,IDCA)和提出的多策略过滤模型进行了测试。实验表明改进后的算法在精确率、召回率和误报率等方面优于经典的树突状细胞算法,改进的树突状细胞算法在提高垃圾邮件检测率、降低误报率和提高稳定性等方面都有显著改善,其中召回率和精确率分别达到了0.95和0.90以上,且误报率也比较稳定。
其他文献
作为全球范围内影响较为严重的生态环境问题之一,土壤侵蚀不仅对人类的生存构成威胁,而且也阻碍了社会的发展。土壤侵蚀的防治,必须建立在土壤侵蚀定量评价制图、掌握土壤侵
随着机器人技术的快速发展以及机器学习等技术的逐渐成熟,移动跟踪机器人广泛应用于各个领域,在越来越多的岗位上代替人类完成了复杂工作,实现了生产生活的智能化。本文针对
目标检测是计算机视觉的重要组成部分,主要是定位一张图片或者视频中特定物体出现的区域并判断图像中出现的目标类型。随着深度学习的发展,基于深度学习的目标检测在众多领域
无线射频识别技术(Radio Frequency Identification,RFID),具有非接触、识别距离远、保密性高、抗干扰能力和环境适应性强等优点。RFID室内定位技术的研究不但具有广阔的市场
随着视觉大数据的和人工智能的发展,视频数据的分析是未来计算机视觉领域的关键,其中监控视频的行人识别、检索和分析是一项越来越重要的任务。多个摄像头之间的行人匹配任务
自动语音识别技术作为一项核心技术在呼叫中心、医疗服务和移动应用等领域得到了广泛的应用。随着国内外对语音识别技术研究的快速发展,汉语、英语等资源丰富语言的语音识别
腹部存在许多重要器官,而腹部医学图像是腹部器官疾病的重要诊断依据,在临床实践中,医生对腹部器官和肿瘤的自动分割算法提出了很高的要求。然而,基于医学图像的分割方法的研
针对网络文本情感分析,本文提出了一种基于复杂句式和复杂语义的情感分析模型,并将其应用于句子级多维情感分类。首先在特定领域文本语料基础上进行多维情感词扩充,建立多维
在当今大数据、移动互联网等信息技术的飞速发展下,信息技术已经渗透到社会经济和生活等方方面面,其在教育方面发挥的重要作用日益凸显。中央在《国家中长期教育改革和发展规
随着工业的快速发展,我们的生活环境中产生了大量的有毒有害气体。气敏传感器作为检测气体成分及浓度的重要工具被大量地应用在工业和生活的各个领域。金属氧化物气敏传感器