论文部分内容阅读
随着大数据时代的到来,对大数据的挖掘、分析、可视化已经成为当今时代的迫切需求。数据可视化综合运用计算机图形学、图像处理、人机交互等技术,以图形图像的方式表现和传达数据信息,成为人们理解复杂现象,探索数据蕴藏规律的重要途径和手段。 时序数据可视化是数据可视化领域中的一项重要技术。结合时序数据可视化与数理统计、机器学习、数据挖掘、模式识别等方法,可以帮助用户更好地提取有价值的统计信息,发现隐藏在数据背后的特征与模式。近年来,这项技术被广泛应用于统计学、信号处理、计量经济学、数理金融、天气预报、地震预测、控制工程等领域。 本文首先简单介绍了时序数据的定义和特征。然后从分类的角度,详细阐述了当前常用的时序数据可视化技术,包括线性、周期和分支时间可视化技术,单变量和多变量时序数据可视化技术、静态和动态可视化技术。随后,本文提出了一种基于维基百科词条访问日志数据的交互式可视分析工具——Visitpedia,来帮助用户检测隐藏在数据背后的重大社会事件以及分析这些社会事件如何随时间而演变。Visitpedia的独特之处在于,首先,它使用维基百科词条访问日志记录作为数据源。该类型用户反馈数据相较于网络新闻数据能更好地反映人们对于社会事件的关注点。其次,Visitpedia从时序数据分析而不是语义分析的角度出发,处理基于事件的任务,规避了繁琐的文本分析。该方法可看作传统方法的一种经济、高效的替代品。最后,本文使用了两个实际的案例分析来验证Visitpedia的有效性。