论文部分内容阅读
数据可视化是近年来逐渐兴起的一门交叉学科,旨在通过图形、图像的手段将不可见的、难以理解的抽象数据映射成颜色、纹理、形状和符号等可见形式,帮助用户理解、分析和探索数据,涉及到数据挖掘、计算机图形学、人机交互、设计和可视分析等学科。在大数据时代的背景下,可视化技术更是强有力的数据分析手段,可以快速揭示行业潜在的行为模式和发展趋势。但是海量数据往往具有规模巨大、种类繁多、处理速度要求快以及价值提炼难度高等特点,为创建有效的可视分析方法提出了挑战,具体体现在:过程和动态性表现、基于模型的数据校验和用户兴趣驱动的层次化显示。而目前的工作大都是多维时变海量数据的表象可视化,数据模型与可视化显示脱节、分离,对海量数据内在规律的探索和表现不够。基于以上问题以及海量数据的这种高性能、可伸缩、实时性分析等需求,本文提出针对网络数据的模型驱动的数据可视分析研究方法,即融合数据规则、领域背景和层次展示,在可视分析过程中加入模型的交互引导,将用户知识和经验充分融入网络数据的分析和推理决策过程中,发现更多的隐含规则和信息。具体思路是:1.结合物理或者数学模型、知识规则和领域背景,来统一建立网络数据的模拟分析模型;2.考虑视觉表达、互动机制和用户的心理感知等因素,设计有效的可视化方法,对上一步统一建模生成的结果进行展示;3.将前端的可视化方法和后端的模拟分析模型进行交互螺旋式探索,真正实现模型与可视分析的紧密联系、相互指导,从而将可视化从一种后处理的显示手段变成一种过程分析、特征发现和优化模型的工具。为此,本学位论文围绕网络数据的模型建立和可视化表达展开研究工作,具体贡献根据模型的种类可以分为以下几个方面:參基于物理模型的舆情传播可视分析,即应用物理模型的概念、方法和原理,经过合理的映射、修正和拓展来模拟网络舆论的传播现象,揭示用户行为的本质和规律。在该工作中,我们提出了基于元胞自动机的论坛事件传播模型和基于动态流体力学的微博转发模型。前者用于模拟网络论坛中个体发帖数量的变化和观点的发展趋势,后者借用流体传播的思想模拟微博空间中用户转发消息的行为机制和过程。我们分别根据两种模型探索其内在规则和影响因素,并设计了不同的可视化界面来方便用户进行结果分析、参数调整和模型校验。·基于演化模型的集群行为可视分析,即应用可视化方法和交互技术来探讨集群演化的组织形态、演化的动力机制和路径等。我们提出了基于微博转发可视化的网络集群分析方法和基于火灾疏散模型的应急可视分析方法。第一个方法通过可视化技术分析不同地域、不同职业间的用户转发模式和情感分布,用于探索不同事件的微博转发特点;第二个方法结合火灾疏散时人员所处的复杂场景及疏散行为的特点,提出了一种用于大规模人员疏散的仿真方法,并结合可视化方法探讨疏散模型的合理性和疏散行为的连续性等。·基于几何模型的层次交互可视化,即根据网络图或者关系数据的拓扑结构,通过设计虚拟的能量系统,将点、边的属性特征融合到传统网络图的布局算法、聚类算法和边绑定算法中,并结合交互技术实现整体到细节的可视分析,帮助用户快速探讨数据属性和拓扑结构的内在联系。为此,针对多元图提出一种自适应混合尺度的可视分析方法,根据结构和属性信息划分网络图的层级结构,分析不同属性在社团结构中的作用;以及针对多维家谱数据,结合家族树模型,设计不同视图来分析家族的人口统计学信息,例如人口迁徙、繁衍规律和亲属结构等,进一步探讨家族发展和当时社会背景、地理信息以及自然环境等潜在的关联。最后我们将以上设计的所有可视分析方法与传统方法、系统进行对比,并邀请领域专家进行评估,或者设计用户实验、调查问卷等收集反馈和改进意见。大量实验结果验证了本文所提方法的有效性和实用性。