论文部分内容阅读
本文研究社交网络的可视化方法。首先分析了社交网络的基本特性;然后通过将社区识别与可视化相结合,提出了基于层次聚类的社交网络可视化算法,并且设计了针对大数据的基于MapReduce的并行可视化方法。实证分析表明:本文提出的算法的处理性能与可视化效果良好。 首先,以新浪微博为研究对象,详细研究了社交网络的宏观统计特性,阐述了社交网络微观特性研究的瓶颈。针对社交网络可视化这一基础性问题进行深入研究,详细综述了各种可视化算法的思想、流程、复杂度及优缺点,并且简要介绍了Hadoop分布式并行化架构。然后,简单介绍了基于层次聚类的社区识别算法及其评价函数,提出了基于层次聚类的社交网络可视化算法。详细阐述了该算法的思想与处理流程,并且提出了相关改进方法以使得社区识别更为准确、可视化效果更为美观。最后,针对社交网络的大数据趋势,详细设计实现了基于MapReduce的并行可视化算法,并且针对社区识别算法的迭代过程提出了两种改进方法。 实证分析表明: (1)基于层次聚类的社交网络可视化算法具有良好的加速性能。 (2)社交网络的数据规模较小时,适合运用单机算法实现其可视化过程;社交网络的数据规模较大时,则适合运用并行化方法实现。 (3)改进的两种并行社区识别方法的加速性能与效果良好。 (4)本文提出的算法在三种平台(移动设备、浏览器、计算机)上都具有良好的处理性能与可视化效果。