基于多话题的大规模社会网络影响力最大化研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:sunsarry
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,影响力最大化问题已经是数据挖掘领域炙手可热的研究方向,并且普遍应用于社会网络分析。然而,现有大部分研究在寻找最具影响力的种子节点的同时忽略了一个事实,那就是针对不同的话题,所选出的种子节点也是不同的。即使少部分现有研究考虑了话题因素,它们忽略了任何需要在网络中传播的商品或事件都是由多个话题组成的,只考虑单个话题是片面且不准确的。同时,网络中用户的兴趣往往也不是单一的,而正是用户的行为偏好直接决定了影响在社会网络中传播的结果。针对现有传播模型和算法在传播过程中未考虑多话题因素的缺陷,本文首先利用话题模型对文本信息进行建模,再将得到的话题分布结合到传统的独立级联模型(Independent Cascade Model)中,提出了多话题敏感的独立级联模型(Multi-Topic Sensitive Independent Cascade model,MTSIC模型)。利用MTSIC模型,可以帮助选出最贴近现实生活情况的种子节点。同时利用Topical HITS算法,获得用户的权威度和从众性,并融入到模型中,使模型更加准确。由于在网络上传播的商品或事件可能存在地理位置限制,因此地理位置信息也被当作一项重要因素加入到模型中。传统影响力最大化算法并不适用于多话题场景,因此提出多话题敏感的影响力最大化算法(Activation Nodes Similarity algorithm,ANS)。考虑到在大规模网络中进行影响力最大化分析是十分耗时的,因此本文提出了基于Spark的多话题敏感影响力最大化算法(Parallelization of Multi-Topic algorithm,PMT)并行算法以提高算法效率。由于传统评价度量未能体现多话题因素的重要性,因此本文提出了新的度量SIS来诠释影响力最大化算法效果。通过在数据集DBLP和Twitter上的实验结果显示,MTSIC模型可以更准确的模拟真实情况下节点的激活情况并且ANS算法可以找到在现实情况中更倾向于接受商品或事件并进行传播的种子节点。而PMT算法的高效性也被证明。从各个方面进行的实验结果证明了本文所提出的传播模型及算法是效且高效的。
其他文献
安卓操作系统(Android)具有界面交互性良好、应用程序开发快捷的特点,但其图形框架部分使用Dalvik Java虚拟机,占用大量的系统资源,结构复杂,在工业控制领域的嵌入式设备上移
近几年,电子竞技运动蓬勃发展,已成为一项有益健康的体育项目,与此同时,用户对于游戏对战平台的要求也越来越高。当今主流的游戏对战平台主要研究如何减少游戏数据的分发延时,而对
随着多媒体技术和存储技术的发展,互联网上的视频数据在不断地增长和传播,如何从庞大的视频数据中快速检索到人们感兴趣的视频内容,是亟待解决的问题。视频事件检测与标注工
人脸在人类的交流中起着重要的信息表达功能,人脸呈现的表情传递着人类复杂的情绪和感受。但由于人脸的生理学结构非常复杂,计算机从人脸中提取的特征常常难以直接利用。本文
近年来,在Hadoop平台上集成FPGA进行算法加速的研究受到了广泛关注。通过利用Hadoop将计算过程在节点之间并行,以及在单个计算节点上利用FPGA硬件加速,这些研究对特定算法的
无线传感器网络集成了传感器、嵌入式计算、网络和无线通信四大技术,它在军事、医疗、家用等多个领域均有广泛的应用,被认为是21世纪最重要的技术之一。无线传感器网络通常运
近年来,可视化技术在医学领域发挥越来越重要的作用。连续扫描的二维医学图像通过可视化技术三维重建,能够提供更丰富的解剖学和病理学信息。彩色体数据一般来源于人体的生理
不同领域的研究者们提出了大量的理论和模型来解释个体情感的产生、变化和传播方式。随着社交网络的迅猛发展,其简单、实时、高效、开放的信息发布特点为研究者们提供大量的
随着桌面虚拟化技术的发展,虚拟环境下计算机外围设备的应用开始备受关注。人们希望在虚拟计算环境中,应用程序可以使用远程USB摄像头进行聊天,或者使用远程USB打印机打印本
随着软件应用的不断深入,软件可信性受到了高度关注,形成了围绕“软件可信性”的新的研究热点。软件可信评估是可信性研究中的一个基本问题,在软件可信性保障活动中占据了极