基于信息增益的混合垃圾邮件特征选择方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:zhe0731
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择是邮件过滤重要的环节,特征的好坏不仅影响分类的准确率,还直接影响到分类器训练和分类的开销。比较了常用的CHI选择、互信息(MI)、信息增益(IG)和SVM特征选择算法在垃圾邮件过滤中的效果,针对这些方法只排序而未消除特征间冗余的缺点,提出了利用特征词间条件概率和分类区分度消除冗余的混合邮件特征选择方法。实验结果表明:方法效果良好,提高了邮件分类准确率。
其他文献
0.引言中国翻译史特别是文学翻译史著述近20年来取得了突出的进展,不仅涵盖了中国绵延几千年的翻译活动,其研究视角和类型也体现了多元化的特点,如译介学视角、文化思想史视角、
就常见抑郁性自杀所属之精神疾病及形成因素,以及不同证候自杀之特点做了浅述。并指出应倡导抑郁性自杀常见之躁狂抑郁性精神病系先天禀赋性体质所形成,非情志因素所致,这对
目的:探讨骨增痹症胶囊与透明质酸钠联合治疗膝关节炎的·临床效果。方法:选取2010年1月至2012年12月在本院就诊的86例膝关节性关节炎的患者为研究对象,将患者分为观察组及
在分析快速选择算法基本思想的基础上,给出了用于快速选择的非递归实现算法——循环迭代算法,并通过实验,与递归算法以及VC++标准库函数nth_element进行了比较,结果表明,该算法
本文将语料库与传统翻译词典、计算机辅助翻译(CAT)工具、翻译记忆系统(TM)作一比较,并探讨从网络挖掘语料语库,认为语料库在翻译实践中有无可替代的优势和潜能。
为了更好地解决NSCT域图像隐藏不可见性和鲁棒性之间的矛盾,提出了一种基于NSCT变换和小波包变换相结合的可见光图像隐藏方法,利用NSCT变换将载体图像分解为低频子带和一组高频子带,对低频子带进行二级小波包分解,通过奇异值变换将秘密图像重要位平面信息隐藏在小波包分解低频子带中,次要信息自适应隐藏在NSCT高频子带中。实验表明,在同等嵌入容量下,算法峰值信噪比大于50dB,对几何攻击和滤波等干扰处理
利用灰色关联度的特性和阿尔法均值滤波算法的优点,提出一种基于改进灰色关联度和阿尔法Alpha均值滤波的噪声图像的自适应滤波算法。该算法采用灰色关联度自适应地确定滤波窗口的加权系数值,改善算法的滤波性能。实验结果表明算法对受到高斯噪声和混合噪声干扰的图像进行去噪能取得较好的滤波效果,同时还保护了原始图像的细节信息。
针对工序级能耗难以用数学方法精确估算的问题,提出了一个基于神经网络的机械加工工序能耗预测方法。给出了输入变量及输出变量的选取及其归一化处理方法,进行了隐含层节点数
针对信息增益算法以信息量的大小确定首选属性和基于粗集算法以核属性为首选属性构建决策树的不准确问题,以粒理论为基础,将属性按其自然取值划分为若干基本粒,以条件粒的长
初步建立了具有某种分配律的扩展格序效应代数和格序QMV代数这两种unsharp量子结构上的自动机与文法理论的基本框架。引入了ε-值正则文法的概念,证明了任意ε-值自动机识别的