论文部分内容阅读
给定数据库,在不考虑支持度和可信度情况下,事先能否预知最终会挖掘出多少条关联规则,这是个值得研究的问题.为此文中提出预期关联规则的概念,使上述问题转化成为如何计算预期关联规则集基数的问题.分别给出布尔型和数量型两种情况下的计算公式.对于数量型数据集,讨论当转换为布尔型数据后各个项集元素呈现的互斥性质.利用此性质导出一个膨胀矩阵和膨胀算法.该方法相对简洁地解决数量型数据集预期关联规则集基数的计算问题.计算和测试结果都表明,预期关联规则总量随着互斥元素的增加呈现下降趋势.这些结果对于深刻理解关联规则挖掘的实质,进而研发更加高效的挖掘算法十分有益.