论文部分内容阅读
面对日益突出的产品质量问题,如何针对政府监督和企业委托的产品质量检测的海量数据进行处理,从大数据中挖掘出潜在有用信息为政府和监管部门提供预警和决策支持?文中基于MapReduce分布式计算框架对关联规则挖掘的Apriori算法进行了改进,并以质量检验数据为处理对象进行关联规则挖掘。该设计在对质检大数据集进行频繁项集挖掘时,充分利用MapReduce的分布式计算的优势,从海量数据中挖掘出隐含的关联规则,提高了海量质检数据分析的效率,为质量监管决策提供了支持。