论文部分内容阅读
随着科技的发展,在线社交网络迅速崛起。社交网络中人人都能参与到信息传播过程中,形成巨大的信息传播网络,实现了用户关系和信息交互的高度融合。但是,在线社会网络拓扑结构的复杂性和用户行为特征的多维性,导致信息传播变得错综复杂和难以控制。如何探知在线社会网络中的信息传播规律,预测传播行为和趋势,挖掘关键传播用户,建立高效防范措施是亟待研究和解决的问题。本论文的信息传播预测研究主要涵盖两方面:对于节点的预测,以用户为中心,研究信息传播的影响因素,预测用户的转发行为;对于结构的预测,以信息为中心,研究信息传播的趋势和规模,预测信息的流行程度。其主要内容如下:1.在节点预测层面,利用社交网络中用户行为及关系数据,构建信息转发预测模型。首先,针对转发行为的复杂成因,提出兴趣驱动、习惯驱动、结构驱动三种驱动机制。其次,由于用户特征具有多维性,利用隐含狄利克雷分布(Latent Dirichlet Allocation,LDA)主题模型在处理“一词多义”、“多词一义”问题上具有的优势,将传统对文本建模的方法迁移到用户特征建模准确挖掘多维用户特征。其中,针对连续属性值建模,使用高斯分布对LDA进行改进,并提出一种基于改进LDA的信息转发预测模型。最后,考虑到时间因素的影响,采用时间切片方法,动态监测用户特征,提高转发预测的准确度。实验表明,该模型能够有效预测用户的转发行为,并挖掘影响信息转发的关键因素。2.在结构预测层面,利用社交网络中节点行为数据和信息传播网络,构建信息流行度预测模型。首先,针对网络中个体差异性及用户关系的强弱性,从个体行为维度和节点交互维度,分别引入节点自身影响力和节点间的影响力量化差异,并设计一种改进的PageRank算法度量节点传播力。其次,针对信息传播主要受信息源驱动和早期信息感染群体驱动的影响,结合信息发布者的个体特征和早期信息传播特征作为模型输入,利用逻辑回归(Logistic Regression,LR)分类器训练得到一种基于节点传播力的信息流行度预测模型。实验表明,该模型能够更准确地预测信息的流行程度,及时发现网络群体事件并识别重要传播节点。