MapReduce框架下的朴素贝叶斯算法并行化研究

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:xy6905
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究朴素贝叶斯算法MapReduce的并行实现方法,针对传统单点串行算法在面对大规模数据或者参与分类的属性较多时效率低甚至无力承载大规模运算,以及难以满足人们处理海量数据的需求等问题,本文在朴素贝叶斯基本理论和MapReduce框架的基础上,提出了一种基于MapReduce的高效、廉价的并行化方法.通过实验表明这种方法在面对大规模数据时能有效提高算法的效率,满足人们处理海量数据的需求.
其他文献
针对以最大完工时间为目标的批量流水线调度问题,提出一种改进的布谷鸟搜索算法.该算法采用排序规则的编码方式,将连续个体值的布谷鸟搜索算法直接应用于离散的调度问题.其次,在布
无线传感器网络中存在大量的数据冗余,数据融合技术通过对采样数据进行压缩,消除冗余,有效的减少了节点发送的数据量,延长传感器网络的寿命.提出了压缩感知与数据转发相结合的数据融合算法,在网络采样数据收集的过程中根据节点的子节点个数选择利用压缩感知对数据进行压缩还是直接对数据进行数据转发.仿真结果表明,和基于压缩感知的数据融合算法相比,数据转发与压缩感知相结合的数据融合算法,有效地在平衡节点间负载的同时
贝叶斯网络在很多领域应用广泛,作为分类器更是一种有效的常用分类方法,它有着很高复杂度,这使得贝叶斯网络分类器在应用中受到诸多限制。通过对贝叶斯网络分类器算法的近似处理
随着微博的迅速发展和大量普及,微博社区发现已经成为新兴的研究热点.发现网络社区有助于运营商理解网络结构和用户特征,为用户提供个性化服务.目前有关社区挖掘的研究大多只关注