【摘 要】
:
本文提出基于粗糙集的Apriori改进算法.分为两个部分:第一部分,根据粗糙集理论求出属性项集的依赖度,继而得到属性项集在一条记录中同时出现的概率;第二部分,首先扫描数据库,得到每个1项集的概率,利用第一部分求出的属性项集的依赖度估算出2,3,…,k项集的概率,从而根据2,3,…,k项集的概率经过最小概率剪枝得到候选频繁2,3,…,k项集;又扫描数据库,得到所有候选频繁项集的支持度;最后用最小支持
【机 构】
:
武汉大学空间信息与数字工程中心(武汉) 武汉大学测绘遥感信息工程国家重点实验室(武汉)
【出 处】
:
第三届中国Rough集与软计算机学术研讨会
论文部分内容阅读
本文提出基于粗糙集的Apriori改进算法.分为两个部分:第一部分,根据粗糙集理论求出属性项集的依赖度,继而得到属性项集在一条记录中同时出现的概率;第二部分,首先扫描数据库,得到每个1项集的概率,利用第一部分求出的属性项集的依赖度估算出2,3,…,k项集的概率,从而根据2,3,…,k项集的概率经过最小概率剪枝得到候选频繁2,3,…,k项集;又扫描数据库,得到所有候选频繁项集的支持度;最后用最小支持度和最小可信度得到最后的频繁项集,进而得到关联规则.此法能够避免重复扫描数据库,避免产生大量的候选集,大大地减少搜索空间和缩短搜索时间.
其他文献
装备系统质量综合评价是对装备的各单项性能评价指标进行综合评判,以确定其总体质量的优劣.事物常具有不同的属性,在将其从总体上加以比较时,常需先从不同的侧面加以评判,然后进行综合评价,这种评价称为多属性评价或多准则评价,它具有多层次、多因素、多目标等特点.本文采用基于BP网络的方法,对装备系统质量综合评价进行了尝试性的探讨.
神经网络集成(Neural Network Ensemble)是一种非常有效的工程化神经计算方法.当这种集成用作分类器时,集成的输出通常由个体网络的输出投票产生.投票法包括绝对多数投票法和相对多数投票法,理论和实践表明,后者优于前者.这两种方法通常作用于集成中的全部个体.而研究表明,对待集成的个体分类器进行必要的选择,可能有助于提高分类性能.研究表明,当神经网络分类器集成(Ensembling N
蚁群算法(ant colony algorithm,ACA)是20世纪90年代才提出的一种新型模拟进化算法,它是由意大利学者M.Dorigo等人首先提出的,称之为蚁群系统(ant colony system),并应用该算法求解TSP问题、分配问题、job-shop调度问题,取得了较好的结果.但同时也发现了一些缺点.为了克服基本蚁群算法的不足,人们对其作了若干改进.蚁群算法从本质上讲是一种模拟进化算
本文采用浮点编码方案,仔细分析和设计GA的实施细节,包括约束条件的处理方法、为防止早熟收敛问题而采取的措施、种群的数据结构及初始化算法.用matlab编程实现GA,用于求解一个具有强约束条件的二次规划问题.比较浮点编码和二进制编码的寻优结果,说明采用浮点编码方案,解的稳定性和运行时间明显优于二进制编码.此外,用启发式交叉取代一般交叉算子,可进一步提高GA的性能.但将局部寻优引入GA,未收到预期的效
随着入侵检测系统在大规模网络中的不断应用,必须解决大量擎报数据的快速分类和约简表示的问题.在本文中提出了一个利用广西聚类实现入侵检测系统的警报数据快速约简的框架.初步的数据分析和实验结果表明,此法是大量警报数据的一种可行的约简方法.
在超市数据上进行关联规则挖掘是R.Agrawal和R.Srihant在文中[5]中首先提出来的,从此出现了众多求关联规则的算法,所求的频繁项目集都依赖于用户给定的阈值,如著名的Apriori算法.用支持度来度量频繁项目集有一定的缺陷,对于最小支持度和最小可信度的选取有很大的主观任意性.如何给定阈值是一个困难的问题,如果阈值给得太大则可能得不到结果,如果阈值给得太小则会因为频繁集的元素过多而增加算法
关联规则的挖掘是当前数据挖掘中最热门的研究方向之一,它把挖掘过程分解为两个子问题:频繁项目集的求解和关联知识的表示.关联规则研究者普遍认为:关联规则挖掘过程中主要计算机资源的开销在于频繁项目集的求解过程,因此无论Savaser等人提出的PARTITION算法,Park等人提出的DHP算法、还是Toivonen等人提出的Sampling算法都试图提高频繁项目集的求解效率,并大多以R.Agrawal等
由于采用乘积算子需求解一个非线性数学规划问题,所以乘积算子在实际决策中的应用不是很多.但是当隶属函数是指数函数时,可转换为等价的线性规划问题.因此,本文研究在多目标模糊决策中利用极大乘积算子找出各目标整体满意度的最优值,即最优折衷解.提出了经典多目标运输问题的模糊极大乘子算法.
粗糙集与模糊逻辑都是软计算的范畴,软计算的指导原则是利用所允许的不精确性、不确定性和部分真实性得到易于处理、鲁棒性强和成本较低的解决方案,以便更好地与现实系统相协调.粗糙集与模糊集的特点相互补充,构成了新的研究热点.本文借鉴A.de Korvin的研究方法对模糊规则的提取公式做了有益的改进,在这个过程中发现利用决策矩阵得出确定性矩阵与可能性矩阵,再求决策规则是个好的方法,有待在今后的工作中进一步研
本文基于Rough数的概念提出了Rough矩阵的概念并引出了Rough矩阵的一些相关的性质,着重讨论了Rough矩阵的特征值问题,这对Rough集理论和代数理论的结合起了一定的推动作用.