大规模社会网络中影响最大化问题高效处理技术研究

被引量 : 0次 | 上传用户:quanminyingyang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网和Web2.0技术的飞速发展,社会网络作为沟通现实人类世界的桥梁,已经成为交互沟通、知识共享和信息传播的重要媒介和平台。其中,影响最大化问题旨在发现社会网络中最有影响力的节点集合,是社会网络分析领域的关键问题,在许多重要场景中有着广泛的应用,例如市场营销、广告发布、舆情预警、水质监测、疫情监控等,因此具有很高的研究价值和应用价值。许多影响最大化应用策略的制定和部署对于算法求解时间十分敏感,因此,高效的求解算法是当前学术界和工业界研究影响最大化算法的核心目标。已有的研究成果主要集中于一些贪心算法和启发式算法,存在求解速度慢、计算效率低的问题。另一方面,当今社会网络的数据规模海量、数据耦合度高、网络结构动态变化。当面对大规模社会网络时,已有算法暴露出许多难以克服的问题:第一,社会网络中节点影响值计算的可并行性问题。已有工作专注于降低算法的复杂度,没有充分利用已有的并行计算架构来加速问题求解。而实际社会网络中存在大量的节点影响值计算可由并行计算架构并发执行。因此,在挖掘算法的并行性方面,影响最大化算法的执行速度仍有很大的提升空间。第二,已有影响最大化算法未充分考虑社会网络节点分布特性。社会网络中节点的度分布服从典型的幂律分布。然而,现有贪心算法大多采用精确计算的方式来计算所有节点的影响值,导致大度数节点的计算复杂度十分高,成为算法执行的瓶颈。第三,社会网络拓扑结构的动态变化问题。现有影响最大化问题研究专注于静态网络;当网络动态变化时,大都需要针对全网进行重新计算节点的影响值,会造成大量冗余计算,导致性能无法满足大规模社会网络的需求。针对上述技术瓶颈,本文系统地研究了社会网络影响最大化问题的高效处理技术,从以下几个方面展开研究:针对现有方法并行度差、算法复杂度高,从而导致运行时间过长的问题,本文基于CPU+GPU的异构并行计算框架,设计和实现了一种具有高并行度的影响最大化算法BUTA,并针对GPU体系结构做了进一步算法优化。本文通过深入分析社会网络中节点之间的层次依赖关系,发现了节点影响值计算的可并行性。在此基础上,设计了一种自底向上的逐层扫描方法BUTA。BUTA算法一方面可以在保证算法精度的同时大幅度降低算法复杂度,另一方面BUTA充分利用了节点的层次分布,以高并行度计算节点的影响值。为了使BUTA算法更加适配CPU+GPU的异构并行计算框架,本文设计了三种优化方法:K层合并、数据重组和合并访存,分别用于降低运行时分支,减少访存次数和提高算法并行度。针对已有影响最大化算法未充分利用社会网络节点分布特性的问题,本文提出了一种基于蒙特卡洛理论的采样估计算法ESMCE,大幅度提升了计算效率。本文对社会网络中节点的分布特性进行了建模和挖掘;针对大度数节点计算时间长的问题,本文引入蒙特卡洛理论,设计了一种节点影响值估计方法ESMCE。在采样过程中,ESMCE算法设计了一种由幂律指数指导的采样节点个数计算方法。之后,根据估计误差同精度要求之间的差距,本文提出了一种基于灰度预测模型的后续采样节点个数预测方法,以通过多次迭代采样来提高算法精度直至采样误差满足设定的精度要求。针对社会网络拓扑动态变化造成的已有算法计算效率低的问题,本文设计了一种增量式的影响最大化算法IncInf。本文深入分析了社会网络拓扑结构的演化特征,发现社会网络的拓扑变化满足优先连接原则,同时最有影响力节点的度数要明显大于普通节点。基于上述发现,本文设计了一种基于局部化理论的影响变化量高效计算方法。基于节点的影响变化量和原有网络对应的最有影响力节点信息,设计了一种剪枝策略,将候选节点范围有效缩小到影响值增长迅速、度排序靠前的节点集合,从而大幅度降低了动态社会网络影响最大化求解的复杂度,减少了程序运行时间。针对当前内容分发方法忽略了社会网络中的用户关联关系、地理位置等社会信息,从而导致用户访问延迟高的问题,本文设计了一种基于影响最大化的内容分发方法SCORE。同已有的内容分发方法不同,SCORE方法充分利用了社会网络中的用户信息,提出了一种基于影响最大化算法的缓存内容选择策略以快速准确地定位未来访问频率较高的关键内容。为了最小化访问延迟,SCORE方法通过挖掘用户之间的关联关系和地理位置信息,设计了一种基于K-MEANS聚类算法和加权球面平均计算方法的边缘服务器选择策略,从而将关键内容预先分发到离潜在访问用户最近的边缘服务器,以便于就近响应用户请求。实验结果表明,SCORE方法可以大幅度降低用户访问延迟,提升用户体验质量。综上所述,本文针对社会网络影响最大化问题的高效处理技术提出了有效的解决方案,并通过在真实数据集上进行实验验证了所提算法的有效性,对于推进社会网络影响最大化问题的研究和实用化具有一定的理论意义和应用价值。
其他文献
经过修饰和掺杂或具有特殊形貌结构的碳材料,具有比单纯碳材料更丰富的表面化学特征,在能源、生物分析以及生物医药领域有着更广泛的应用。在众多掺杂元素中,氮元素以其相似的原子尺寸,更高的电子密度,在碳材料的掺杂改性中的应用最为普遍。模板法合成碳材料,能在产物中保留模板的结构特征,可以合成出具有特殊表面形貌或内部微结构的材料,是理性设计和制备特殊形貌结构碳材料的实用方法。纳米酶是指既具备纳米材料特征又具有
王若虚,金代文学批评领域的重要学者,其富有思辨性的经学、史学、文学等辨惑呈现在他的学术专著《滹南遗老集》中。其有关文学方面的论著,阐发了他在文学创作、文学批评、作家修
文学教育,作为培养学生人文素质的重要课型被引入到众多职业学校文化课中。但是,主要因为“职业学校中的文学教育如何有针对性并产生实效”的问题未能引起重视和解决,使得开
目的观察中药薰蒸肢体治疗早期桡骨茎突狭窄性腱鞘炎的疗效。方法将早期桡骨茎突狭窄性腱鞘炎患者172例随机分为治疗组与对照组各86例,对照组选择双氯芬酸二乙胺乳胶剂涂抹治
作为日常语言学派中重要的代表人物,格赖斯于20世纪60年代后期提出了会话含义理论,为语用学的发展做出了极大的贡献。一方面,格赖斯将人们的意图融入到对语言意义和功能的研
汉语复句是句子这级语言单位中的重要成员,它使用频率高、覆盖面广。但由于汉语的复句较之于单句,在逻辑语义、结构层次等方面复杂了许多,因此,留学生在使用汉语复句时经常出
改革开放以来,我国经济、社会、文化迅猛发展,社会生活中出现了许多新生的事物或新的概念,随之也出现了许多新的词汇、用法,新词新语在翻译中如何把握,一直是翻译研究中一个
近年来,以微电子技术为基础,以信息系统为主导的信息革命正席卷社会的各个领域,以不可阻挡的趋势影响和改变人类的生活,联系和工作的方式。城市居住区的规划应当科学地预测未
<正> “20世纪·中国”美展是中央美术学院教师约半个世纪以来代表性作品的一次检阅。我们把展览冠以“20世纪·中国”这样一个重大的标题,是为了强调艺术与这个时代和祖国的