论文部分内容阅读
在大数据为背景的人工智能时代,基于复杂网络的统计分析方法已成为当前研究热点,并积极推动了大数据可视化的发展。针对大规模数据的可视化组织结构,传统的可视化表征形式受限于信息空间约束,复杂网络的表征形式作为大数据可视化中高维度高复杂度的可视化表征形式出现,借助网络结构来呈现大规模数据的宏观视角。目前对于复杂网络的可视化表征研究还处在模糊探索阶段,其可视化表征研究缺少针对性的构建算法,且大多还停留在可视化工具的使用,计算结果的可视化表征与用户交互体验都受限于现有的可视化工具表征形式。因此,本文着眼于大数据信息可视化,遵从Tomas信息可视化分析推理流程,通过理论分析与实际案例计算相结合,从数据统计分析、数据可视化表征、数据交互认知分析的三个维度,对大数据信息空间复杂网络的可视化表征进行了系统研究。首先,提出了基于节点之间双向曝光率的复杂网络优化解析算法;其次,基于JavaScript语言开发了一种可供用户交互操作的复杂网络可视化平台,并成功运用于麻省理工学院的学生选课系统;最后,从用户认知行为、生理特征角度对复杂网络可视化表征绩效进行评价,提出并设计了一种眼动追踪的实验方法,以算法计算结果作为实验绩效评价标准,并以实验结论反哺于可视化编码的计算应用。论文具体工作如下:(1)基于图论、无标度复杂网络等相关理论,探究复杂网络的数据结构复杂度降维转化形式;进行数据清洗、数据相关性分析以计算复杂网络空间复杂度;提出了基于节点之间双向曝光率的复杂网络优化解析算法,建立信息单元关系矩阵分析,构建了基于信息节点、信息关系和时间属性的学科知识的复杂网络。(2)采用Gephi和Cytospace可视化工具探究多种布局算法的可视化表征形式,并在优选布局算法结果的基础上,基于Javascript语言开发了一种可供用户交互操作的复杂网络可视化平台,这是本文的重要实践成果;创新性的提出了一种基于T检验的复杂网络数据可视化表征的渗滤阈值约束计算方法,在不丢弃重要数据关系信息的基础上做信息流的渗滤阈值分析,并定义了节点的权重、数量编码以及边的权重、数量、距离编码。(3)借助于复杂网络的数据统计分析方法,对构建的学科空间网络进行节点信息流、网络信息集群划分、网络结构衍变、信息集群简化的计算分析,并对列表式的计算结果进行了可视化表征,将计算分析和可视化视觉表征结合。(4)创新性的将用户认知行为、生理特征的心理认知测评方法用于复杂网络可视化表征的信息流搜寻绩效评价。依据无标度网络理论和迪杰斯特拉算法计算网络节点信息流路径,设计了复杂网络信息流可视化编码的感知分层实验;借助于眼动追踪实验的行为指标和生理指标数据,证明了不同可视化编码对复杂网络信息流视觉搜寻绩效有干扰,并明确提出了不同可视化编码的使用建议;提出前趋节点并用实验数据验证了其辅助信息流认知决策的有效性。