论文部分内容阅读
从决策表中提取蕴含规则是粗糙集理论的重要内容,现有的基于粗糙集理论的规则提取算法有极高的时间和空间复杂度,因而通常认为不适合用于大规模决策表。本文提出了R_apriori算法,将数据挖掘领域中经典的apriori算法与粗糙集理论结合起来,应用于决策表中蕴含规则的提取上。该算法首先将决策表按其决策属性值划分为若干子块,形成D_划分;再将D_划分子块继续切分为更小的子块,应用apriori算法来提取子决策表中蕴含的信息,并通过子决策表标志矢量来减少搜索范围,同时引入项集簇的概念,减少了项集组合次数,在一定程度