抗好词攻击的中文垃圾邮件过滤模型

来源 :电子测量与仪器学报 | 被引量 : 0次 | 上传用户:Rang3r
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对当前中文垃圾邮件过滤领域面临的好词攻击威胁,提出了一种鲁棒的中文垃圾邮件过滤模型。该模型基于多示例学习机制,并结合中文分词和特征选择方法,将一封邮件转化为若干示例的组合,然后应用多示例逻辑回归模型进行学习和分类。对多示例学习而言,当一封邮件中至少有一个示例为垃圾信息时,该邮件为垃圾邮件,否则为正常邮件。分别对训练数据集和测试数据集进行好词攻击,在多个大规模中文垃圾邮件过滤公开数据库上进行了测试。实验结果表明,在中文邮件过滤领域对抗好词攻击,分类器使用多示例反击策略较之于单示例反击策略有更强的鲁棒性。
其他文献
[目的]探讨护理干预对食管癌术后病人雾化吸入效果的影响。[方法]将80例食管癌病人随机分为对照组和干预组,对照组采取传统的护理方法,干预组采取积极的护理干预,包括雾化吸
[目的]总结子宫内膜癌病人手术治疗的护理。[方法]对34例子宫内膜癌病人行手术治疗,同时加强围术期护理及健康教育。[结果]34例病人均顺利完成手术治疗,未发生术后并发症。[结
以MUSIC、数字波束形成为代表的一类阵列信号处理方法,在存在阵列和通道幅相误差时,性能急剧下降。本文在介绍Friedlander经典自校正算法基础上,指出了该算法的不足,并提出了基于
[目的]总结膝关节周围损伤病人的围术期护理。[方法]对65例膝关节周围损伤病人进行手术,同时加强心理护理、生命体征监测、局部末梢循环观察。[结果]65例病人均安全度过围术
在临床护理工作中因病人骨牵引、被迫体位等原因使受压处皮肤受损,给护理带来困难和难度,而一次性海绵垫目的是减轻病人受压和皮肤长期受压导致的皮肤问题。为此,我科2011年1