一种基于成词概率的贝叶斯垃圾邮件过滤方法

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:gavin812428144
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯分类方法在英文邮件过滤中效果良好,在中文环境下一直表现不佳,而特征选择是垃圾邮件过滤中的重要步骤,它能够有效地改善过滤效果。文中以成词概率作为特征选择的基础,用构造的方法形成候选特征集,然后进一步用信息增益的方法来度量特征与类的关系,选择信息增益较大的N个特征做为最后的特征向量空间。在此基础上利用贝叶斯方法对邮件进行分类,实验结果验证了该方法在分类时间和分类效果上都优于传统的基于机械分词的贝叶斯方法。
其他文献
生态课堂教学就是把课堂教学看作面向人的生活世界、在课堂教学中促进人的生命完善发展以及生命质量整体提高的生态模式。生态课堂注重学生的感悟和体验,为学生营造一个和谐的
小学语文教科书在编写过程中十分注重入选课文的可读性与人文性,很多篇入选课文都包含着丰厚的人文意蕴和浓厚的审美色彩。学生既能从中学到语文知识,又能陶冶情操,还能得到美的
在高中英语教学中,阅读教学占有重要的位置。我们以往对阅读教学的研究往往只从教学的可操作性这个角度出发,力图寻找出一种适合大多数学生的阅读策,略和技巧,却忽略了对学生主观
落实新课程标准是基础教育改革的一项艰巨任务。新课程标准一进入我们的视野,对我们学校的管理就提出了挑战。如何实施学校管理,这是管理者一个不可回避的问题。面对挑战,如何确
RFID技术应用于离散制造采集监控系统,单靠传统的软件中间件,很难实现众多底层设备与上层应用软件之间的可靠连接。针对该问题可将RFID系统中间件的功能按照单元划分,各功能单元分别由独立的硬件RFID接口控制器实现,接口控制器通过统一的现场总线接口与应用层软件连接。接口控制器的引入简化了RFID系统中间件架构设计,提高了RFID系统的可靠性和实时性。接口控制器样机已成功应用于服装生产线RFID采集监
针对目前液位控制系统所存在的问题,设计了一种基于AT89S52单片机的可监控的智能液位控制器系统。该系统采用光电式和极电式两种方式对数据进行采集,下位机直接通过LED和数码
目的:分析研究自拟中药熏洗方治疗混合痔术后肛缘水肿的临床效果。方法:将本院2017年2月-2019年3月入院接受治疗的混合痔术后肛缘水肿患者中的52例作为研究对象,使用数字表法
目的:研究分析门诊中药饮片调配中中药处方点评对用药差错的干预效果.方法:随机抽取2017年10月-2018年10月英德市中医院门诊开具的中药处方单1000张,其中前6个月476张处方单
在移动计算环境中,数据广播是数据发布和数据获取得的重要手段。为提高数据广播的性能,在服务器端采用了近似最优的多信道广播数据调度策略(TOSA),同时在移动客户端提出了高效的Hu
嵌入式系统日益普遍。8位的处理器仍然是低端市场的主流,UART具有操作简单、工作可靠、抗干扰能力强等优点,广泛应用于嵌入式设备接口中。但是标准的8位处理器满足不了大量的