【摘 要】
:
近年来,面对信息时代海量数据的出现,如何有效地利用海量的原始数据分析现状指导决策,已经成为人类面临的一大挑战。由此,数据挖掘技术应运而生并得以迅猛发展。其中,关联规则是数
论文部分内容阅读
近年来,面对信息时代海量数据的出现,如何有效地利用海量的原始数据分析现状指导决策,已经成为人类面临的一大挑战。由此,数据挖掘技术应运而生并得以迅猛发展。其中,关联规则是数据挖掘的重要模式之一,作为分析数据间隐含的相互关联关系的有力工具,有着极其重要的应用价值。本文根据关联规则挖掘的要求与特点,引入小生境遗传算法,提出了一种基于小生境遗传算法的关联规则挖掘框架,并通过系统实例分析,验证了此方法的可行性。
本文首先介绍了关联规则技术和遗传算法的研究现状以及传统算法的不足,简述了数据挖掘的基本概念,在深入分析关联规则挖掘技术和传统遗传算法的基础上,提出了一种基于小生境遗传算法的关联规则挖掘框架,并详细阐述了该框架中的各个组成部分的功能以及关联规则挖掘的过程。
本文重点研究了基于小生境遗传算法的关联规则挖掘框架所采用的两个关键挖掘算法。在深入分析传统Apriori算法不足的基础上,提出了一种Matrix_Apriori算法,该算法可以优先挖掘出频繁大项集,大大缩减了系统挖掘占用的空间和时间。为了保持算法后期挖掘效率的稳定性,提出了一种小生境遗传算法进一步对非频繁大项集进行挖掘,小生境遗传算法并行性高,可以挖掘到全局最优解。基于小生境遗传算法的关联规则挖掘框架,有效整合了以上两种算法的优点,大幅度提高了系统挖掘的效率。
本文的研究成果初步应用于某高校外聘教师管理系统信息的数据挖掘之中,通过对系统挖掘结果进行分析,表明本文提出的方法可以有效提高系统挖掘结果的查全率和查准率,应用效果良好。
其他文献
在过去的几十年间,人们见证了互联网的飞速发展,见证了一个全新的信息时代的到来。然而,互联网上的信息数量之多,增长和更新速度之快,也是前所未有的。在进入信息时代的同时,我们也
持续走热的通用搜索引擎带来了海量信息检索的极大便利,但对于具体某个领域而言,检索能力尚不足以令人满意。于是,各个领域的垂直搜索犹如百花齐放。具体到金融领域,投资用户
产品生命周期管理(PLM)是当今制造业领域中重要的管理理念、方法和技术。PLM不仅涉及产品的开发和设计,还涵盖产品的制造、销售、维护和回收等在内的各个阶段,不但涉及到产品
随着Internet的普及和发展,图像数据飞速膨胀,使得如何高效、快速地检索到所需要的图像数据成为当前图像应用领域的一个研究热点。传统的基于文本的图像检索技术已经不能满足
随着多媒体技术和网络技术的迅速发展与广泛应用,对多媒体数字产品的版权保护已成为迫切需要解决的问题。数字水印技术是解决版权保护的一种有效途径,其中小波变换不仅可以较
无线传感器网络是一种新型无线自组织网络,是计算、通信和传感器三项技术融合的产物,能够广泛的应用到军事、环境科学、医疗、家庭以及商业等领域中,能够为社会发展创造巨大
RFID归属于非接触自动识别技术范畴。当阅读器信号作用范围内存在两个以上的多个标签,在同一时隙内有两个或者以上的标签向阅读器传送信息时,信号发生干扰,标签产生冲突,这种
温度监控系统是现代工业应用中一个典型的、应用极其广泛的系统。而对于某些特定的场合由于监控中心与监控子站的通信距离较远、监控子站比较分散,利用有线通信需铺设专门的
嵌入式开发平台是缩短嵌入式产品开发周期、提高系统资源复用率、降低产品成本的一种有效解决方案,传统的嵌入式开发平台尤其是嵌入式教学实验开发平台的设计思想在一定程度上
高等院校教师业绩考评系统是高等院校管理信息化建设的重要内容,随着考核量化体系的不断变动及统计工作量的增加,仅靠人工统计或简单机辅统计耗时费力且易出错,难以适应新形势的