模糊关联规则挖掘算法的应用研究与实现

来源 :南开大学 | 被引量 : 0次 | 上传用户:kcl770514
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,大气环境实时动态监测系统采集了大量的数据,这些海量数据背后隐藏着大量的有用知识,研究者们希望通过对所采集的大气环境监测值的深层次分析,挖掘出其中潜在的有价值的信息。关联规则作为数据挖掘最重要的任务之一,其目标是发现数据库中各语义项间的关联关系,为大气环境的质量分析和预测提供了一种有效的解决方法。  大气环境监测数据集通常都是些数量型数据集,传统解决方法是通过数量属性的离散化将数量型关联规则挖掘问题转化为布尔型关联规则,然而这类方法得到的用区间表示的关联规则难以被理解。所以文中采用了模糊关联规则挖掘方法,这种方法能够保证挖掘所得的各模糊语义项间的逻辑语义,但同时也产生了几个问题:如何实现数量型数据集到模糊型数据集的转换,如何挖掘出具有模糊逻辑语义的关联规则,如何解决大规模环境监测数据集中模糊关联规则挖掘问题。本文围绕这些问题,展开了论文的相关研究工作。  [1]采用基于CHC遗传模型的模糊划分方法实现了大气环境监测数据值到模糊型数据值的转换。  [2]采用了一种改进的FP-Growth算法对本文实验数据集中的模糊关联规则进行挖掘。改进的算法通过在ffp-tree树头表中添加一个tail域,使得新插入的ffp-tree树结点在进行插入操作时不在需要遍历整个side_link域,提高了挖掘效率。  [3]针对大气环境监测数据集“大”的特点,实现了基于MapReduce的FP-Growth模糊关联规则挖掘算法。  实验证明,通过上述方法挖掘所得到的模糊关联规则能准确表达规则前后件的确定性和渐进性逻辑语义,为大气环境质量分析和预测能够提供有效的参考价值。
其他文献
计算机技术发展至今,软件模拟是评估硬件设计、开发系统软件和研究计算机体系结构的有力工具。本论文对LX-1164微处理器体系结构特点、指令集、存储体系进行了详细分析,深入研
软件复用是软件业界为解决日益严重的“软件危机”和日趋复杂的软件需求而提出的一种对策。软件复用技术随着面向对象技术和分布式对象技术的应用而得到迅猛的发展,在当前的软
外部总线与外设接口作为嵌入式系统的重要组成部分,对整个系统的功能有着十分重要的影响。传统的外部总线与外设接口存在占用资源多、设备接入量少、不支持热插拔等缺点,在嵌入
进化算法是一种人工智能技术,该算法主要是通过模拟生物自然选择与进化过程来求解问题,它是建立在达尔文的进化论思想的基础上。因其具有很高的鲁棒性,使其在求解高度复杂的
仿真测试平台是支持嵌入式系统开发的一种有效工具,能够实现产品的软硬件并行开发、协同验证,达到加快产品上市时间、降低开发成本,减少开发风险等目的。 本文选题来源于8
随着信息网络技术的不断发展,人类在享受互联网技术的同时,也在日益受到来自互联网的安全威胁。特别是政府、企业、科研等单位和组织对信息网络系统的依赖程度逐渐增强,面临来自
现今存在着大量丰富的语音信息,需要对其进行有效地利用和开发。语音文档自动摘要就是能满足这种需要的一项很实用的技术,它能方便人们对于信息的检索、浏览以及记录等应用。
软件测试的自动化技术是目前和未来软件测试技术研究的一个重点问题,对于提高软件测试的客观性和效率有着非常重要的意义。单元测试阶段,结构覆盖测试要求语句覆盖率和分支覆盖
计算技术的健康发展需要与之相适应的计算模式。随着计算技术、通信技术和传感器技术的飞速发展,迫切需要一种全新的计算模式——普适计算。普适计算的目的是更完善和更方便
近年来,网上交易平台发展迅猛,密码被窃取后造成重大经济损失的案件却层出不穷,屡见不鲜。用户普遍具有密码保护意识,通常也都使用了安全软件,可是却在不知不觉中被盗走密码,主要原