论文部分内容阅读
数据可视化与可视化分析是一个多学科交叉的研究领域,它的目的是通过图形显示数据中隐藏的特征模式和有价值的信息。体绘制作为体数据可视化的重要技术,已经被广泛地应用于生物医学、燃烧与气象模拟、地质勘探等领域。其中传递函数的设计是体绘制技术的关键任务,它将体素值转换为光学属性,可以帮助用户高效探索体数据中的重要特征。传统传递函数普遍基于单变量进行设计且交互方式单一,然而,许多科学现象往往需要多种属性进行表示,如气象数据是由温度、压力、湿度等多种属性共同组成,单变量传递函数无法表达其复杂的内部结构。因此,如何理解多变量体数据并对它们进行可视化已成为巨大挑战。解决上述问题的一个重要途径就是理解多个变量的相关性,并利用这些信息设计关联空间中多种属性的传递函数,通过调整传递函数,使用户能够对多变量体数据中的复杂特征进行交互式分析研究。本文针对目前多变量体数据可视分析方法设计不直观、操作复杂以及无法展现复杂特征等问题,从全局和局部的视角出发,提出了一种将子空间聚类方法与RadViz技术(Radial Coordinate Visualization)有效结合的多变量体数据可视分析方法。由于多变量体数据普遍具有数据规模大的特点,从全局视角出发,利用Kmeans++算法从原始数据中提取具有代表性的样本点;通过子空间聚类方法实现高维空间中代表性样本点在低维空间中的表示,以体现不同样本点所代表簇的相似关系,同时便于交互切换不同的子空间;对RadViz可视化技术进行改进,展示相应子空间内部数据在不同维度的分布情况,同时进行交互设计,支持用户选取感兴趣的特征,协助用户进一步探索所选子空间的局部细节信息。根据所提出的方法,构建了基于子空间分析与维度投影的交互式多变量体数据可视化系统SAMP-Viz(Subspace Analysis and Multidimensional Projection Visualization),它可以有效地消除用户探索的盲目性,降低用户交互的复杂性。实验结果表明,本文的方法能够有效协助用户识别多变量体数据中的复杂特征并准确表达数据在不同维度间的分布信息,在保证体绘制实时性的同时,通过便捷的交互手段提高了用户的分析效率。