邮件过滤中一种改进的特征选择方法研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:shashasimon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择是基于内容的垃圾邮件过滤的重要过程,它有效地改善过滤效率和精度。文中分析了IG和CHI应用到垃圾邮件过滤中存在的不足,设计了一种改进的评价函数。而由于这种评价函数的特征选择方法只度量了特征与类的关系,忽略了特征之间依赖的关系,因此进一步用基于互信息的聚类方法来消除特征间冗余。实验结果表明该特征选择方法有效地提高了邮件过滤的性能。
其他文献
提出了一种用于改善二维Hopfield神经网络性能的模块化方法。这种方法受到了生物视觉感知系统的启发。图像处理过程采用了Hebbian学习规则,并在训练过程中引入了衰减距离因子
移动IPv6网络为用户随时随地接入网络提供了可能性,也给用户的接入控制和管理提出新的挑战。为改善此情况,提出了一种适用于移动IPv6网络环境的层次化接入认证方法,利用层次化思
USB以其诸多优点已被广泛用于PC接口设计,由此开发了基于USB的光刻机对准系统。与传统对准系统相比,新系统的稳定性大幅提高,同时成本显著降低。但USB设备驱动程序的开发是系
新冠肺炎疫情期间交通管控和运输保障均发挥了重要作用,但二者政策机理不同,且相互影响。惑于长期以来主流交通运输政策体系中交通管控的缺失,关于中国交通抗疫的政策宣传仅
当前,推动制造业高质量发展已成为我国经济发展的主攻方向。作为全国重要制造业基地、粤港澳大湾区核心城市之一,广州近年来全面实施制造强市战略,制造业发展质量稳步提升,创
提出一种基于索引和局部存储的(Index and Local Storage—based,ILS)数据分发算法MREIB—DD。对于ILS类型的数据分发算法,一个事件的监测数据被存储在该数据的监测节点或监测节