论文部分内容阅读
随着网络技术和电子商务的迅猛发展,在线购物、网上支付、即时通讯等应用已经成为人们工作和生活中不可或缺的一部分。SNS的出现和发展更是为网络用户提供了一个相对绿色、安全的交流平台,然而,社会服务的实现需要用户兴趣模型的寻找与构建,因此,如何从错综复杂的关系网中发现相似用户、挖掘社区结构已成为当前社会网络研究的热点问题。传统的社区挖掘研究以静态的观点对待社会网络分析,例如网络的度分布、边介数、聚集系数等等,而忽视了具有能动性的个体行动者。受此影响,现有的社区挖掘算法更加重视对网络拓扑结构的划分,而忽略了对社区内部成员的研究与分析,限制了网络社区概念模型的设计。本文提出应用粒子群优化算法的思想对社会网络进行结构挖掘,更加注重精英粒子的引导作用,同时结合社区内部成员的不同属性,对其进行角色划分。针对社会网络分析中存在的关键问题(动态挖掘、社区性质分析、社区成员角色划分、抗攻击性能分析等),本文基于粒子群算法算法的思想对网络社区进行了如下研究:(1)利用动量粒子群算法实现了对社区的动态挖掘。通过对社会网络的特征矩阵进行研究,提出把Capocci算法得到的前k个非平凡特征向量Vp=(Vp1,vp2…,Vps)(P=1,…,K)作为输入,利用粒子群算法挖掘社区结构。本文选取第一个为负的特征值之前的r个非平凡特征值,以及其对应的r个非平凡特征向量,也就是预测网络有r+1个社区。但这么选择的r.一定大于等于=m一1。在此基础上,将m的选取融入编码结构中,在优化的过程中动态发现社区。粒子群算法为网络社区动态角色挖掘算法的实现提供了理论依据。(2)结合社区的结构特征与社区内用户的属性进行分析。粒子群算法指出,种群中的粒子受到具体目标的驱动相互运动,因此,不仅是粒子近邻之间相互影响,更是因为具有同质的目标。社会网络中的个体更是如此,彼此之间的链接结构只是在表面上阐明了用户之间的显性关系,而没有从用户的性质上做进一步细分,用户的所有兴趣都表现在链接关系中,但是仅仅挖掘关系结构,并不能说明用户之间的具体联系。在社会网络中,同一用户可能不仅单对一方面感兴趣,而是可能同时对多个属性不同的事务感兴趣,由于结构挖掘把这些兴趣统一对待,因此无法区别同一用户在不同兴趣模型中的位置。结合粒子群中目标驱动的概念,从语法和语义两个层面进行社区划分,为社区定义主题。首先根据网络中节点之间的显性关系,对社区进行粗略的结构挖掘,寻找整个社会网络中存在的社区拓扑结构;然后根据社区内用户的特征向量为每个社区定义一个主题,而用户收到社区主题的驱动,交互影响。算法通过分析节点的性质与特征,优化社区划分结果,构建用户的兴趣模型和功能单元。该算法的提出为SNS科技论文管理平台的设计与实现提供了优化思想。(3)结合粒子群算法的基本思想,受到优先情节和增长定律的启发,本文提出了种网络社区动态角色挖掘算法。根据粒子群算法中局部最优个体对种群内部个体的引导作用,创新性的提出社区种子的概念。社区种子引导社区的形成,其余个体围绕社区种子形成一个个内部联系紧密,外部联系稀疏的社区。根据优先情节和增长定律,早出现的节点要比晚出现的节点具有更多的机会积累链接,因此结合精英粒子的概念,作者开创性的提出:假设度数最大的节点最先出现在社会网络中,则可以根据节点的度数分布,以时间为轴逆向推导整个社会网络的形成演化过程;同时,在社区挖掘的过程中进行用户角色划分,实现动态角色划分的过程。将该算法应用于SNS科技论文管理平台中进行文献聚类,然后以聚类为单元进行作者分析,有利于发现同意作者在不同聚类中的地位和角色,更好的进行个性化服务。(4)根据网络社区动态角色挖掘算法(Dynamic role assorted, DRA)和传统社区挖掘算法(G-N)进行社会网络安全保护策略的构建,引入“柔性退化”的概念,分析不同安全策略的柔性抗攻击能力。基于DRA算法的安全保护策略为社会网络中的特殊节点提供独特的防御措施,保障主要网络架构的流通性和网络的基本功能,构建“深度防御策略”限制网络攻击所造成的影响。该项策略重点体现了对网络防护的灵活性要求,在降低系统防护开销的前提下,增强了网络的稳定性和鲁棒性。将个性化安全保护策略应用于SNS科技论文管理平台,有效地提高了系统的快速重建能力和柔性抗攻击能力,使得系统能够灵活持久的保持信息流通性和安全性。(5)搭建了一个SNS科技论文管理平台进行算法的分析与验证。在该平台中,应用启发式动态社区挖掘算法对文献网络进行聚类,根据文献聚类的结果对文献的作者构建社区;同时根据动态角色挖掘算法分析每一位作者在不同社区中的角色和地位;最后在平台中分别检测基于DRA算法和G-N算法的SNS平台的抗攻击能力。该服务平台为广大科研工作者提供一个统一的学术入口,能够集成检索特定学科或专题领域的各类分散的学术信息资源,实现个性化定制和个性化推荐的服务。平台的实验运行结果表明了网络社区动态角色挖掘算法的适应性和可扩展性,提高了系统的灵活性和稳定性。