【摘 要】
:
随着信息技术的飞速发展,数据爆炸和知识贫乏之间的矛盾越来越大,使数据挖掘在许多领域所起的作用越来越重要。在数据挖掘的各分支中,关联规则挖掘的研究最为深入和广泛。目前对
论文部分内容阅读
随着信息技术的飞速发展,数据爆炸和知识贫乏之间的矛盾越来越大,使数据挖掘在许多领域所起的作用越来越重要。在数据挖掘的各分支中,关联规则挖掘的研究最为深入和广泛。目前对关联规则挖掘算法的研究主要基于支持度——可信度框架,由于这种框架自身的缺陷,用户与挖掘系统的交互度不高,使挖掘的关联规则中用户感兴趣的却不多,因此如何增加用户与系统的交互度使用户对挖掘的关联规则算法更感兴趣已成为了一项新的研究任务,不少学者放弃采用支持度——可信度框架,而尝试采用新方法来进行关联规则挖掘,以提高用户的满意度和兴趣度。本文正是在这种背景下,研究交互式关联规则挖掘技术,提出了一种交互式关联规则挖掘算法——IMAR算法。 本文首先介绍了数据挖掘和关联规则挖掘的相关理论;其次介绍了传统的基于支持度——可信度框架的关联规则挖掘算法Apriori算法;最后提出并详细论述了一种交互式关联规则挖掘算法——IMAR算法。 IMAR算法定义了规则约束。规则约束不仅包括了传统的支持度和可信度阈值而且还允许用户指定关联规则左部和右部必须出现的项和禁止出现的项。IMAR算法采用布尔表达式形式化的表示规则约束。IMAR算法在“概念格”的理论基础上生成频繁集集合。算法首先将规则约束布尔表达式转化成集合约束布尔表达式,然后采用最小频繁集扩充的方式在等价类上搜索频繁集,最后算法根据搜索出的频繁集集合和规则约束生成出符合用户约束的关联规则。本文最后通过中学生智能评估系统给出了算法在教育信息系统中的应用实例。
其他文献
基于IEEE1451标准的网络变送器的研究方兴未艾。但由于标准出现之前许多厂家已经有自己的相关产品,为了保持自己的兼容性无法完全遵守IEEE1451标准;或者由于标准规定的内容太多
近年来高速发展的路桥、土木水利、钢架悬梁、场馆建设、工业产品检测等领域对挠度检测设备提出了更高的要求,挠度检测向实时动态、宽信号范围、高精度、高速度、可预警报警
随着数据库技术的发展,数据交换次数和交换数量不断增多,视图发布过程中所存在的信息泄漏的问题日渐突出。因此,保证发布视图的安全成为数据库安全的一个新课题。本文对国内
神经网络控制是智能控制的一种典型的形式,近几年来得到了飞速的发展。尤其是对于不确知、不确定、非线性、多输入多输出等难于建立精确数学模型的复杂系统,应用神经网络控制
信息通过插入删除信道发生传输错误时,由于出错的位置是随机的,各个错误间相互独立,因此纠正该类错误十分困难。但在某些实际系统中,如比特格式媒体(bit-patterned media),会
最近二十年由于科学技术的飞速发展,人类获取网络数据越来越容易,获取的网络数据数量越来越多,相应的网络分析挖掘技术也取得了巨大进步。之前的网络挖掘技术通常将网络看做是纯
遗传算法(GA)作为一门新兴学科,从二十世纪八十年代开始迅速发展。遗传算法是一种用于解决优化问题的并行寻优算法,已被广泛用于解决各类NP问题。但标准遗传算法仍然存在一些
随着因特网的迅猛发展,网络对一个国家的信息化和经济发展起到越来越重要的作用,然而也正是因为这样,网络成为黑客攻击首当其冲的目标;另一方面,现有的安全产品多重视外部入
P2P网络是近年来计算机领域研究与关注的一个焦点,它在很多领域都得到了应用,未来发展空间很大。但是,P2P网络发展过程中,也产生了一系列急需研究和解决的问题,安全就是其中
近年来,通信网和计算机网络不断飞速发展,给全世界的人们带来了极大的方便。同时,网络自身也变得越来越庞大复杂,对网络的管理与控制已经成为网络研究建设的重要内容之一。In