论文部分内容阅读
微博等社交网络在移动互联网中正占据重要地位,深刻影响着人们的社会生活。充分掌握社交网络的特点,更加全面地认识并利用社交网络,更好地服务于社会、组织和个人,对未来我国互联网的发展,乃至对国家政治、经济、文化等方面都有着积极的意义。因此,本文针对国内具有代表性的社交网站,研究使用社交网络开放接口来高效地获取数据的方法,及应用可视化技术分析信息传播机制,具有重要的现实意义和应用价值。本文首先介绍了社交网络的概念、背景、发展趋势,及其特征和功能。接着介绍了开放平台的相关概念,研究了新浪微博与人人网的开放接口技术框架,总结了通过开放接口获取数据的流程和方法,对使用开放接口获取数据涉及的信息格式以及授权过程进行了详细的分析。本文设计并实现了基于开放接口的微博数据获取与可视化分析系统。在对系统的功能需求进行分析后,给出了系统的结构及获取数据的算法,介绍了数据获取模块、信息查询模块、信息传播可视化分析模块、用户管理模块的实现及运行实例。其中的数据获取模块使用多线程与多账户复用,以及多级队列控制方法,优化了任务管理机制,使得本系统在获取丰富数据类型的同时,具有较高的效率。相比于已有微博数据获取系统,本文系统获取数据的效率更加高效,获取的数据类型更丰富,系统功能更全面。此外,本文还基于复杂网络与信息传播的相关理论,研究了微博信息传播机制的可视化技术。首先,系统中的信息传播可视化分析模块可以根据获取到的用户数据生成关系网络,通过计算相关度量参数并输出特征分布图形,对该网络结构特征进行分析,验证网络结构特征;还可以根据获取到的微博数据生成微博传播树,并通过绘图操作直观呈现微博传播路径,进行可视化分析。其次,借鉴经典的传染病模型,提出了微博信息传播模型,通过模型仿真和可视化实例分析对比,验证了模型的合理性,并由此给出了微博信息的安全传播建议。