论文部分内容阅读
可视化数据挖掘是数据挖掘和可视化技术的有机结合,这种结合使得数据挖掘技术的应用更具直观性和形象性,使得在数据挖掘过程中引入并发挥人类的形象思维能力成为可能。由此促进数据挖掘技术与具体场景的应用结合、与领域专家的知识结合、与普通用户的观感结合,进而在数据挖掘和知识发现过程中延伸人类的形象思维、提升知识发现的洞察力、提高发现知识的效力。
在研究及应用方面,以数据和结果可视化为代表的静态表示层次可视化数据挖掘比较成熟;而对于过程指导和交互集成层次的可视化数据挖掘研究尚有不足。本文以狭义观点的数据挖掘为研究范围,对数据挖掘过程的可视化与交互式内容进行理论研究和实践探讨。目的是对在挖掘过程中引入可视化和交互式支持及功能提出新见解、对其内容的统一建构进行尝试性探讨、对其开发实现开展实践性探索。
本文的研究工作和成果主要涉及以下几个方面:
(1)研究数据挖掘过程可视化与交互式的一般内容和基本需求。通过引入过程对象和过程粒度概念来对一般内容进行尝试性构建,而一般内容的构建有利于对过程可视化与交互式支持进行功能性需求分析。
(2)抽取数据挖掘过程的核心——挖掘算法为研究对象,以它为中心实现可视化和交互式方面的功能具有很好的辐射作用。为此,提出了挖掘算法过程可视化与交互式的参考模型。
(3)为了论证以上两方面的有效性,选取分类挖掘任务和基于决策树的分类算法为例,探讨了分类挖掘过程可视化与交互式的一般模型,该模型基于任务级别,可指导分类挖掘过程的可视化与交互式设计及实现。同时,对决策树分类过程进行了可视化与交互式方面的需求分析和内容概述,从中可以看到算法参考模型的应用。
(4)基于(3)的分析结果,研究设计并开发实现了一个支持过程可视化与交互式的决策树分类挖掘原型系统。然后在原型系统上进行了相关实验和演示,结果表明系统是有效的。
整个论文工作的思路是按照理论研究、模型建立、算法改进和工程实现及实验分析等步骤循序渐进展开的。