论文部分内容阅读
关联规则挖掘常被用来探索类别型数据属性值间的关系。现有的大部分关联规则挖掘算法都是基于支持度-置信度框架。尽管最小支持度和置信度阈值确实有助于排除大量无趣规则的探查,仍然会产生一些用户不感兴趣的规则。原因是只有用户能够判断一个给定的规则是否是有趣的,而这种判断因用户、任务而异。此外,自动算法得到的部分规则,用户通常较难理解。已有的加入可视化方法的研究或者只是对结果的简单可视化,或者用户的交互不能很好的结合领域知识改进挖掘流程。本文将传统的关联规则挖掘过程嵌入到一个可视分析流程中,用户可以根据需要交互更改算法参数,选择或定义约束限定感兴趣的数据集,一方面提高了挖掘规则的效率,另一方面用户在挖掘过程中对数据的分布、结构有了更深刻的了解。 本文采用矩阵式的可视化方法,用像素颜色编码探索过程中得到的度量值、中间结果,用改进的马赛克图布局展示数据集在感兴趣维度上的分布。此外,本文还设计了一系列可视探索工具,方便用户交互地选择或改善不同类型的约束、关联的度量方法、探索的中间结果。最后本文用多个实际数据的探索示例说明本文方法的有效性。