论文部分内容阅读
如何从海量数据中挖掘出气象信息和潜在的大气规律,成为气象挖掘研究的重点。为了提高数据挖掘的准确性和效率,在分析了MapReduce和贝叶斯分类的基础上,提出了在Hadoop平台上利用MapReduce编程模型与朴素贝叶斯算法相结合的方法来选取预测属性,预测一天中的最高温度。在Hadoop平台上的实验结果表明,该并行数据挖掘方法能够有效的处理海量气象数据,提高了运算效率并具有良好的扩展性。