论文部分内容阅读
随着网络技术和信息技术的快速发展,基十Web的社会网络快速普及,极大地改变了人们的生活、工作和交往方式。通过分析社会网络中的社团结构,能够更好地了解社会网络的用户构成,如用户之间的关系、社团成员的共同属性等。结点权重值是分析社团结构的重要工具,它标识结点在网络中的重要性和在社团结构中的位置,进而用于划分社团结构。现有计算结点权重值的方法主要考虑结点之间的链接关系,包括直接连边和间接连边,适合分析结构明晰的社会网络。而社会网络具有动态活跃性,社团结构也会动态变化,现有方法没有考虑结点属性相似性关系和结点活跃度对社团结构的影响,在分析活跃社团方面有欠缺。通过分析社会网络的特点,我们发现社团关系与网页页面有许多共性,如结点之间的关系、结点活跃度等。为此,本文借助网页搜索排序的思想进行社团结构划分,以解决上述问题。具体思想是:将社会网络中的各个属性映射到网页页面排序中,如用户结点映射为网页页面,用户结点之间建立的关系映射为页面之间的链接,用户注册的兴趣爱好等个性化信息映射为页面的关键字,而用户的活跃程度映射为网页的被搜索情况等。然后,可以将网页页面的级别映射得到社团网络中的结点权重值。这样,不仅反映了用户结点之间的链接关系,而且还整合了用户属性和活跃度等因素,使结点权重更能反映结点在社会网络中的位置。本文提出的具体算法分为两个阶段:结点权重值计算阶段与社团结点划分阶段。结点权重值初始化阶段,利用重构的PageRank算法,整合结点属性相似性和用户结点活跃度等因素。在社团划分阶段,社团结点按位置分为中心结点、成员结点和桥接结点。中心结点具有较高的权重值,首先对处于中心位置的中心结点进行划分归类,进而完成社团初步发现。桥接结点位于不同社团之间起连接作用,而成员结点数量众多,要根据桥接结点和成员结点在社会网络中具体结构与位置,合理进行桥接结点和成员结点划分。设计实现了基于PageRank算法的社会网络社团结构发现算法,通过模拟数据,验证了本文方法的正确性和有效性。