基于Hadoop的贝叶斯过滤MapReduce模型

来源 :计算机工程 | 被引量 : 0次 | 上传用户:sdasda168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统分布式大型邮件系统对海量邮件的过滤存在编程难、效率低、前期训练耗用资源大等缺点,为此,对传统贝叶斯过滤算法进行并行化改进,利用云计算MapReduce模型在海量数据处理方面的优势,设计一种基于Hadoop开源云架构的贝叶斯邮件过滤MapReduce模型,优化邮件的训练和过滤过程。实验结果表明,与传统分布式计算模型相比,该模型在召回率、查准率和精确率方面性能较好,同时可降低邮件过滤成本,提高系统执行效率。
其他文献
采用单片机W77IE58和2个模数转换芯片MAX197组成的多通道数据采集系统,通过CTGC5301遥传短节、电缆通讯,实现了DTB三总线与EILog地面测井系统之间的数据交换。一次下井,快速
为了适应油田开发的需要,对套损严重、通径较小的套损井进行更为准确的监测,研制了小直径方位二十独立臂井径测井仪。该仪器由小直径高精度方位综合测井仪和二十独立臂井径测
文章介绍了通过流量图版及含水图版求解连续测井仪在气水两相条件下各分相流量的原理及实现方法。Matlab具有强大的数据分析、数值计算及图表绘制功能,通过对Matlab相关模块
针对低功耗自适应集簇分层型( LEACH)协议中节点采集的数据存在大量冗余和能量消耗不均衡问题,提出一种能量高效路由协议MDG-LEACH。该协议基于虚拟网格和多尺寸网格选取活跃节
由于胜利油田深层含气储层复杂的地质条件,需要解决识别与增产两道难题。文章探讨了胜利油田在深层试气工艺上,采取负压深穿透射孔技术,根据应力分析优化射孔井段,有效控制缝高,提
文章在简要介绍瞬变电磁基本原理的基础上分析了瞬变信号的特点,由于瞬变信号的动态范围比较大而且信号前、后期差异比较大,因此一般的采集系统难以满足高速、高精度的要求,所以
犯罪学研究的首要问题就是犯罪概念如何界定,文章从学科界限、犯罪动态研究与实证研究的角度,比较了我国犯罪学研究中的两种犯罪概念的各自特点,认为犯罪学中的犯罪概念应根
党的“十八大”报告强调要大力推进生态文明建设,把生态文明建设融入经济建设、政治建设、文化建设、社会建设各方面和全过程,因此,加强生态文明建设既是一个重大的发展问题,也是