论文部分内容阅读
社会媒体是人们彼此之间分享意见、经验和观点的平台。社会媒体拥有大量的用户群,用户之间相互交流、发布、分享、协作和传播的信息,生成了大量的用户生成内容(User Generated Content,UGC)。近年来,社会媒体发展迅猛,Facebook、Twitter、新浪微博和腾讯微博的用户数分别突破了10亿、5亿、4亿和5亿,UGC信息在上述社会网络中呈现网状交叉传播,随着转发次数的增加,传播速度呈指数增长。社会媒体的内在结构称为社会网络,社会网络正在深刻地影响和改变着信息的传播方式、人们的社交方式、大众的生活理念,社会网络也随之成为工业界和学术界的研究热点。虽然社会网络目前已经非常普及,但兴起时间不长,很多问题亟待解决!例如社会网络上信息的传播模型构建、传播规律分析等等。本文针对社会网络的信息传播规律问题,进行了深入的研究和剖析,提出了几种信息传播模型和信息拓扑分析方法,这些研究成果既可以应用于信息传播预测、广告精准投放、传播态势感知、个性化信息推荐等多个领域,也可以发现不良用户和信息,保障网络信息安全。本文的主要工作包括:(1)在传播机制分析方面,深入地对比了社会网络和其它网络结构的设计差异,分析了社会网络中独特的信息传播机制,提出了社会网络的信息传播树生成算法;(2)在传播模型构建方面,引入了网络动力学模型和流行病学中的传染病模型,将其应用在中国著名社交网站“新浪微博”的大规模数据集上,通过实验结果的对比分析提出了七种传播模型;(3)提出了信息拓扑分析方法,其中基于信息幅度阈值的信息传播分析方法能够对信息传播进行聚焦,同时传播拓扑用户节点分析方法可以进行用户关联、用户习惯及用户兴趣分析;(4)综合上述三方面的研究成果,设计并实现了社会网络信息传播分析系统(SNIDAS),该系统包含了多源数据获取模块、信息传播树构建模块、社会网络传播模型分析模块、信息拓扑分析模块。通过系统实验与评估,该系统能够有效洞察和分析社会网络的信息传播规律。