论文部分内容阅读
数据可视化是一门研究数据可视表达的学科,其旨在将不可见或难以直接显示的数据转换为图形、符号、颜色、纹理等可视表达形式,帮助用户理解数据、挖掘潜在规律、分析有意义的模式。根据数据处理对象和方法的不同,传统数据可视化主要包含科学可视化和信息可视化两个方向。近年来,随着数据可视化技术与数据分析理论的逐渐结合,可视分析学应运而生。科学可视化、信息可视化和可视分析学共同组成了现代数据可视化的三个重要分支。不确定性指事物的存在状态或所能产生的结果不能被精确描述,数据的测量值仅描述了事物在某些特定假设下的特征。它是数据的一个重要组成部分。与数据矛盾和错误不同(通常由不正确的实验方式引起),其不可避免地存在或产生于数据收集、数据变换、可视化结果生成等数据可视化流程的各个环节。不确定性的存在会极大地影响数据可视化结果的可靠性,对它的忽视将导致数据分析者产生理解偏差从而做出错误的决策。要使数据可视化、可视分析成为一种有效的决策支持工具,必须以某种直观的方式将数据中的不确定性准确地呈现给用户。本学位论文以不确定性的来源为研究角度,围绕不确定性的建模、度量、可视化、规避等问题展开了相关研究。论文的主要贡献概括如下:●提出一种不确定性感知的多变量集合数据的可视化与探索方法。集合数据是一种典型的不确定数据,在数值模拟等领域内有着广泛应用。高维度、不确定是多变量集合数据可视化与探索面临的两大严峻挑战。在该工作中,我们首先采用核密度估计方法重构每个集合数据对象的高维分布,再联合使用集合均值差异与集合分布差异刻画不同集合数据对象之间的不相似性关系,接着采用改进的拉普拉斯投影算法将所有集合数据对象嵌入到二维可视平面,帮助用户可视探索集合数据集的内部结构、分布模式等。我们还提出两种集合不确定性度量方法,并设计了集合条可视表达方法编码集合数据对象的总体不确定性与分布。此外,我们开发了一款配备一系列交互工具的多变量集合数据可视探索原型系统。●提出一种基于LMDS两步投影算法的空间线几何的差异可视化及分析方法。纤维追踪是一种常用的DTI数据变换方法。它可将复杂的张量数据转换为基于空间线几何表达的纤维模型。为了可视探索因纤维追踪不确定性造成的追踪结果(纤维模型)差异,在该工作中,我们首先将不同纤维模型配准至同一空间,然后采用基于LMDS的两步投影算法将所有纤维模型投影至同一可视平面,并采用核密度估计方法增强投影结果的可视化效果,进而生成一系列纤维模型的签名图。为了帮助用户识别签名图之间较大差异的存在区域,我们使用了区域增长算法对截断方差图进行分割。我们还设计了DiffRadar可视表达方法编码差异区域内纤维的统计差异细节。同时,我们也开发了一款基于并排和显示编码比较模式的纤维模型差异可视探索界面。●提出一种基于层次式多类蓝噪声采样的多类散点图的可视简化与探索方法。在可视化过程中,可视化算法参数及可视化结果输出载体的局限性亦会造成用户理解和认知方面的不确定性。在该工作中,我们提出了一种层次式多类蓝噪声采样方法,并应用该方法降低多类散点图中显示散点数据的规模,同时保持不同数据类之间的相对密度特征,进而降低因散点覆叠问题和散点绘制顺序问题造成用户理解和认知方面的不确定性。为了增强可视简化结果的视觉感知,我们还构造了一个散点颜色优化模型,并提出了两种可编码局部趋势的散点形状设计。