基于概念格的关联规则挖掘研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:wallen5202
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库知识发现是当前人工智能研究中较为重要的一个领域,关联规则挖掘是数据挖掘中应用最广的。传统的Apriori算法能产生所有的关联规则,但数量庞大,冗余度高。Wille等在1982年提出的概念格是进行数据挖掘和规则提取的一种有效工具。它的每个节点被称为是一个概念,概念的外延表示为属于这个概念的所有对象的集合,而内涵则表示为所有这些对象所共有的属性的集合。概念格在本质上描述了对象和属性之间的联系,表明了概念之间的泛化和例化关系,而它的Hasse图实现了对数据的可视化,作为数据分析和知识处理的形式化工具,概念格理论已被广泛地应用于信息检索、数据挖掘、软件工程等领域。 概念格的每个概念的内涵就是满足一定条件的属性集合,而概念格及其Hasse图又体现了概念的内涵及外延的泛化和例化关系,因此概念格可作为挖掘规则的自然平台。Godin等提出了由概念格提取蕴含规则的算法,但得到的规则的数目往往很大。Zaki等提出了用闭合集的最小生成器生成无冗余关联规则的算法,得到概念格上节点对之间的最简规则集,但存在部分信息丢失的可能。 在传统概念格上我们设计了一个提取关联规则的算法,我们的算法并不是提取所有的规则,而是提取规则集中的一个子集,称为规则产生集。与所有规则的集合相比,它的规模大大减少了,相应的挖掘效率提高了,但是从中仍可推出所有满足要求的规则。与传统的概念格上提取规则算法相比,该算法最终不生成每个规则的支持度、信任度,仅生成满足最小支持度、信任度的所有规则。但规则产生集的规模更小了,对于大型数据库中的低信任度挖掘情况(规则数量多)可产生较少的规则产生集。这样,提供给用户的是较少的而且是容易理解的规则的集合,用户可以根据自己的兴趣有选择地从产生集中推导出他需要的规则。存储规则所用的存储空间小,同时可提高推导规则时查找规则的速度。我们在产生的组约简规则产生集合的基础上,给出了一种存储规则的数据结构和用该约简规则产生集推导出一般规则产生集的算法。另外我们应用我们的方法设计了一个在学生成绩数据库中挖掘关联规则的系统,提出了一种对学生成绩类数据库进行挖掘的关于项集的确定方法,针对该系统的需要,我们设计了从规则产生集中获得单一后项关联规则的算法,方便为学校的分层次教学提供服务。
其他文献
随着移动通信的迅速发展及各种移动增值业务的广泛应用,移动通信中的安全问题变得日益严重。 在UMTS网络中,用户可以通过自己的移动终端获取许多新的服务,而网络接入安全是所
作为一项安全性较高的生物特征识别技术,人脸识别技术已经成为多个相关领域的研究热点,并在罪犯搜索、安全防范以及视频监控等许多领域有着广泛的应用,对人脸识别技术的研究
实时视频信息还原与图像提取实现技术是网络情报收集与网络安全管理的重要组成部分,关系到国家网络主权和信息控制权,是网络信息技术的重要研究内容之一。现有的某些即时通信
近年来,伴随着计算机网络的飞速发展,网络入侵事件也日益猖獗,而传统的网络安全技术如反病毒技术和防火墙技术要防范入侵比较困难,这就使得入侵检测成为网络安全研究体系中的
具有真实感的三维人脸动画是计算机图形学研究的一个重要分支,近30年来一直是研究的热点。真实感三维人脸合成技术的应用范围非常广泛,其成果可以应用于虚拟主持人、虚拟会议
软件测试是保证软件质量和可靠性的重要手段,是一个复杂的过程,需要耗费巨大的人力、物力和时间,在软件生存周期中占有非常突出的重要位置。因此,如何提高软件测试的自动化程度是
伴随着计算机软件系统的规模和复杂程度的提高,软件系统的结构变得日益复杂,软件设计重心从“算法+数据结构”设计转变成为体系结构设计。软件体系结构已经成为决定软件系统
随着Internet的迅速发展,在其基础上的各种应用也越来越多,如电子商务、电子政务、网上交易系统、网上教育等。与此同时,黑客入侵事件也日益猖獗,网络安全的重要性越发显现出
论文基于.NET开发平台、利用ASP.NET MVC框架,在Visual Studio2013环境下开发了一个网上电力设备交易平台,打破了电力设备的价格壁垒,同时也为广大电子商务系统的建立提供了
随着全球计算机与通讯技术的飞速发展、互联网的普及与应用,越来越多的商务、日常活动通过Internet进行,网络跟人们的生活越来越紧密。因特网上的信息呈指数级增长,信息增长