基于字符语言模型的垃圾邮件过滤

被引量 : 0次 | 上传用户:XSDCL
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的过滤是当前解决垃圾邮件问题的主流技术之一。该文先简单综述了当前基于内容的垃圾邮件过滤中采用的各种技术,在此基础上提出将基于字符的语言模型应用于垃圾邮件过滤任务中,并通过实验对比了该方法与Naive Bayes、SVM和基于词的语言模型方法的性能差异,以及不同n值、不同特征选择方式对过滤结果的影响。实验结果表明,基于字符的语言模型实现简单且具有很高的性能,能较好地满足大规模在线邮件系统的需要,具有很高的实用价值。
其他文献
航空发动机的控制规律作用巨大,它决定了发动机能否获得设定的稳态工作下性能指标,同时保证工作过程中的压气机和涡轮的气动稳定性。控制规律选取的目标是有效地挖掘发动机的
会议
木质素是由芳香化合物组成的天然生物高分子,其解聚产物在能源和化工领域具有广泛的应用潜力,但复杂的抗性结构限制了木质素的高效解聚。最近研究发现,木质素C_α-OH化学氧化可以增强其解聚效率。而木质素酶在木质素碳循环中发挥关键作用,如果能利用木质素酶选择性氧化C_α-OH,将有望提供绿色温和的木质素解聚新策略。本论文以来源于Physisporinus vitreus和Echinodontium tax
目的通过对冠心病介入治疗的术后护理,减少了并发症的发生,最大限度地提高了冠心病介入治疗的疗效。方法选择240例冠心病介入治疗术的患者进行术后观察及护理。结果全部病例
高强钢逐渐在建筑、交通、航海等方面取代普碳钢地位,研究高强钢热轧卷取过程中应力的分布和温度分布是判断钢卷卷后是否会出现板形缺陷的重要依据。本课题根据钢卷关于轴对称的特性,考虑钢卷的各向异性,基于弹性力学的基础理论建立力平衡方程、几何方程、物理方程,采用计算增量值代替计算全量值推导出计算钢卷卷取过程中径向位移增量方程组,进而计算出钢卷卷取过程中应力增量。结合板的凸度扩展到计算出三维状态下钢卷卷取过程
肺炎链球菌(Streptococcus pneumoniae,SP)是引起儿童呼吸道感染特别是社区获得性呼吸道感染的重要致病菌。近年来SP对抗生素的耐药情况已日趋严重,其中大环内酯类抗生素耐药较
当今,粮食安全、能源安全和环境安全等非传统安全问题在全球金融危机的形势下日益凸显,人类的安全观念和实践也处在史无前例的变革之中,综合安全、合作安全、认同安全等新的
外事翻译的政治性、时事性、文化信息量大等特点使它有别于其他翻译。汉语中的一些文化负载词,如古诗词、成语和具有中国特色的词语是外事翻译的难点。通过在外事笔译过程中
麦冬为百合科多年生草本植物。株高15~40厘米。须根坚韧而多,前端或中部常膨大成为白色肉质块根,呈纺锤形、圆筒形或椭圆形。地下茎匍匐平卧,节上有白色鳞片。叶丛生,长线形,先端尖
随着信息技术的发展,软件应用越来越广泛,软件规模越来越庞大,由于设计和编码的失误和错误导致的程序缺陷与日俱增。在这些可以导致程序崩溃的缺陷中,有一部分可以直接被黑客
<正>目的:以人脐血CD34造血干细胞为模型,研究转录因子SCL/TAL-1对造血分化的影响。方法:采用慢病毒(Lentivirus病毒)载体系统,将质粒pTRIPdU3-RNAiTALh-EF1a-GFP(靶向SCL/TA
会议