论文部分内容阅读
食品安全直接关系到老百姓的身体健康与生命安全和社会的稳定。目前我国的食品监测工作存在一个误区,认为检测批次与监管效果成正比,从而只片面的强调检测批次任务,随着检测批次的不断增加,必然带来国家资源及政府人力、财力的巨大浪费。在食品监测中引入数据挖掘技术,利用以往检测记录中食品及食品经营者相关信息,对其中的关联规则进行挖掘,使检测部门能够合理制订监测计划。本文系统地阐述了数据挖掘的概貌,着重对其中的重要挖掘任务之一:关联规则的挖掘问题进行了详尽的分析。然后,突出介绍了关联规则数量属性的离散化及类别属性的概念分层技术。在这些工作的基础上,提出了多维量化关联规则挖掘算法—Multi-Apriori。它通过引进一种频繁维谓词集索引树(FDPI-tree)将数据方和Apriori算法有效的结合在一起。Multi-Apriori算法可以同时挖掘维间和混合维关联规则,并且具有较好的整体性能。之后采用网格聚类技术对所产生的关联规则进行相似聚类,聚类后的结果有助于用户进行决策分析。