论文部分内容阅读
复杂性科学被称为21世纪的科学,其主要目就是揭示复杂系统的一些难以用现有科学方法解释的动力学行为。我们将复杂系统理论作用于社会研究中,发现人类社会在其发展过程中的各种社会现象、社会文化以及社会行为等变化规律,对人类社会自身的控制与管理提供更多的研究实证和更有价值的结果。网络博客和论坛等是对现实社会的人及组织行为的映射,可用来分析个人和群体的行为模式,研究关于人群的交互方式、社会群体网络的形态及其演化规律。本论文以微博为具体研究载体,以复杂网络理论、系统动力学理论为主要研究方法,采用理论分析、数学建模、算法设计、数值实验等方法相结合的思路对在线社会网络的特征、规律;网络社区的评判标准、数学模型和挖掘等进行了系统研究,并取得一定成果。主要工作如下:(1)进行了微博网络特征分析,通过对新浪微博网络的实例分析,发现人类行为具有高度的复杂性。引入时间刻度,在用户的时间行为特征方面,发现人类行为存在长时间的静默与短期内的高频率的爆发的特点,出现了明显的非泊松分布,符合幂律分布的特点。在用户时间性特征上,也体现出分段幂函数的特点,符合人类社会其他网络特性。在用户的空间行为特征方面,人类的空间活动具有普遍的同时性。我们对微博网络的拓扑结构进行研究发现,节点出度具有分段幂律分布的现象,分析可能是由于存在大量的“明星节点”和新浪的推荐机制。发现网络具有网络中的大多数节点以较短的路径相连;网络具有较高的聚集度。通过计算节点相似度,基于BA模型提出基于语义的微博网络模型,将时间概念引入模型当中,应用马尔科夫链理论,计算网络节点的连接概率,实验证明构造网络符合真实网络的特性。(2)对网络社区结构特征进行了分析和刻画。建立了社区模型,定义社区为必须具有边界封闭性和内部紧密性两个特征。并基于此给出社区结构定义和约束条件。在社区结构挖掘方面,提出了一种基于子图同构和结构同构的频繁子图挖掘算法。该算法通过利用决策树将目标集(频繁子图集)与样本集(图集)存储起来,图集的决策树将图集中每个图的置换矩阵都存储起来,保证了后续频繁子图和频繁子图结构挖掘的完全性,在频繁子图的生成过程中,通过对候选子图集的检查,及时去除了那些不可能频繁的候选子图,因此减少了搜索的范围,提高了性能。对复杂网络社区结构挖掘具有一定意义。(3)讨论了以微博为具体形式的社会网络信息传播的原理、模式和机制,主要关注的是网络舆论的演化及观点的传播。通过微博实证研究,提出了社会公共事件的网络舆论演化五阶段模型,认为网络舆论从第一级的“社会沉默到聊天室/论坛表达”的最弱状态,可以很短时间发展到第五级“语言向行为舆论转化”的最强状态;而其回落过程也相当迅速。接下来,讨论了微博网络中一个新的“观点”的网络传播模型。提出了基于微博的观点传播模型,模型基于平均场的假设,将网络用户划分为未获得信息无观点的人群、己获得信息且明确支持某观点的人群和已获得信息且不支持任何观点的人群,并根据微博网络特点对模型进行了进一步改进;该模型符合经典的BA模型特点。最后讨论了“弱连接”理论,定义弱连接的成立必须是节点间有双向信息流存在的,给出了弱连接挖掘的算法思想,进行了初步的讨论。