论文部分内容阅读
随着互联网的发展,产生了包括Web在内的许多不同的信息系统。最近,在线社会网络广受欢迎,已经成为Web中最受欢迎的网站之一。这些网站的用户组成了在线社会网络,提供了分享、组织、查找资料的最好途径。这些网站为研究规模很大的在线社会网络的特性提供了条件。理解在线社会网络的结构既有利于改进现有的网络,也有助于设计出更好的网站。本文从团的角度分析在线社会网络YouTube的结构特性。所使用的数据源是采用滚雪球采样法获取到的YouTube在线社会网络的部分数据。本文的重点工作是利用标签传播算法检测团结构、优化算法并且分析团特性。本文的工作证明,在大规模网络中,标签传播算法是一种高效的团结构检测算法,利用这种算法划分出的团结构是优良的划分。但是,随着结束条件逐步严格,算法收敛速度显著变慢。为了提高算法运行速度,本文对标签传播算法做了优化。通过在合适的条件下介入循环过程,对那些已经划分入所属团的节点不再处理,只处理还没有达到稳定状态的节点。本文的研究证明,只要选择的条件合适,算法收敛速度会得到显著提高,同时团划分还保持在优良的水平。本文还分析了网络团结构的特性。尽管相同初始条件和结束条件下的划分仍然不是唯一的,但是通过分析f系数和Jaccard索引发现这些划分是彼此相似的。团划分与现实中的群之间是相互影响的,即在团划分中属于同一个团的用户往往也属于同一个群,或者分散在少数几个群中。而在一个群中的用户在团划分的结果中也往往同属于一个团,或者分散在少数几个团中。本文最后指出了在本文研究工作的基础上的进一步工作的方向。