论文部分内容阅读
随着互联网技术的发展和社会网络的兴起,社会化媒体逐步替代了传统的媒介,成为Web2.0时代的主流。社会化媒体是用户传播信息、分享经验、表达情感的一种新型的互联网在线工具或平台。其中,以微博最为典型,因而成为了当前社会网络可视化分析的研究热点。社会网络可视化分析的关键在于关系圈挖掘算法和可视化分析:通过关系圈挖掘算法可以识别出不同的关系圈。传统的关系圈挖掘算法在识别重叠或非重叠关系圈的时候,计算复杂度会在某种程度上增加,在大规模网络结构上性能会迅速下降。因此,标签传播算法的诞生解决了该性能问题,但标签传播算法在标签初始化,标签传播或标签选择上的随机性影响关系圈挖掘算法的不稳定性和准确性;另外,通过可视化技术直观地展现关系网络便于社会网络分析。因此,建立一个关系网络可视化分析平台,具有一定的实验价值和应用意义。本文从微博用户的关系网络出发,重点分析了Speaker-Listener标签传播算法(Speaker-Listener Label Propagation Algorithm, SLPA),提出一种新的改进算法,并在此基础上设计并实现一个关系网络可视化分析平台。本文主要研究工作如下:(1)首先介绍标签传播算法(Label Propagation Algorithm, LPA)在重叠和非重叠社区的研究与改进现状,接着介绍SLPA标签传播算法,分析其在标签初始化和标签选择过程中的随机性。然后,优化标签,并在标签选择阶段融入协同过滤算法,提出一种基于协同过滤的标签传播算法(Collaborative Filtering-Label Propagation Algorithm, CF-SLPA).在人工合成网络和真实网络上实验分析改进算法的性能。实验结果表明,CF-SLPA算法识别关系圈的准确性和稳定性明显优于SLPA算法。(2)基于理论联系实践的原则,本文在社会网络垂直化细分领域,设计并实现了一个集数据采集,数据分析,社会网络可视化分析,关系圈挖掘及其应用于一体的关系网络可视化分析平台。(3)通过系统的演示展现平台的使用方法及其应用意义。关系网络可视化分析平台不仅便于关系网络的研究,而且为其他社会计算提供了具有实验价值的应用平台。(4)最后,总结论文取得的工作成果和不足,提出下一步的研究方向。