基于个体传播动力计算的社交网络信息传播研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:baozhuangpms
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络作为互联网最热门的应用之一,随着流行和普及,人类的沟通交流已不再局限在相同的时间和空间内。快速发展的社交网络不仅是用户展示自我价值、表达利益诉求和维护人际关系的重要途径,也为信息传播与分享提供了高效平台。社交网络带有明显的社会特征,其主体是用户,信息传播由人类的心理活动与行为共同驱动。传播的过程依赖于复杂的个体与群体关系,带有随机性,容易相互影响。传统的理论和简化模型,难以准确地描述传播过程。因此,社交网络信息传播作为一个多学科交叉形成的研究方向,研究工作存在高度不确定性和复杂性。本文结合了复杂网络理论、流行病传播动力学、机器学习和语义分析等学科的思想和方法,对社交网络数据获取、传播行为实证分析、传播动力计算、文本情绪理解与模型构建等问题进行了研究。  论文以单向弱关注类社交网络和移动社交网络为主要研究对象,通过对群体行为数据的统计分析,提出引发个体传播行为的主观和客观传播动力因素。研究发现,主观传播动力主要来自个体自身对信息的传播意愿,而引发传播意愿的根源可被归结为三种因素:个体对观点的认同度(包含个体的兴趣相似性)、个体的关系强度及个体与传播源的接触频度。客观传播动力来源于两种因素:个体自身的影响力与消息文本的情绪结论。论文致力于合理科学地量化这些传播动力因素,提出一种基于文本情绪分析的信息转发分类模型,以及一种融合多种传播动力计算的社交媒体传播时空演化模型。论文的研究工作主要包括以下内容:  1、基于群体行为特征分析的个体影响力判断。通过分析新浪微博开放平台API,提出了一种基于JSON结构树的微博信息解析方法,将JSON对象转换为一种类似HTML DOM的树结构,存放关键信息的DOM节点位置,最后抽取特征节点的内容。该方法获取速度快,对海量数据获取有较强的针对性。获取数据后,进行包括关注与粉丝比例、粉丝数量与质量,转发对象分布与转发频率等项目的统计分析,发现个体的影响力是一种影响信息传播的客观因素,进而提出一种个体的影响力判断方法。该方法以粉丝和关注的数量、转发和评论的数量,转发分布律和粉丝对节点的影响力贡献为条件,通过影响力贡献数列计算粉丝对不同的关注者不同的影响力贡献。实验结果解释了社交网络的群体传播现象,总结了个体影响力与活跃用户自身属性、转发特点和粉丝行为的关系。  2、个体兴趣的相似性计算与重叠性识别。面向移动社交网络分析消息的传播因素,提出个体的主观传播动力概念—兴趣相似性。以复杂网络的社团发现理论为基础,根据谱平分算法的思想,通过Laplace矩阵计算获得个体的兴趣相似性值。根据群体对单一主题的不同兴趣程度,结合第二小特征值概念,提出兴趣边界值概念,构建谱分割算法对节点进行兴趣相似群体分类。针在图论中可被描述为在节点之间,引发个体传播多主题信息的兴趣重叠性,结合派系过滤算法的特点,提出一种 k类群过滤算法。通过迭代回归计算和重叠矩阵,识别出具有兴趣重叠特征的节点和多兴趣主题的圈子。仿真实验显示,对比传统的谱平分算法和派系过滤算法,新算法在量化个体对消息的感兴趣程度,识别单一和多主题的消息传播群体方面获得了更好的效果。  3、基于文本情绪分析的信息转发分类模型。个体阅读微博文本后,对内容的情绪理解会产生推动信息传播的动力。首先,为了识别文本中的情绪结论,应用语义网络对微博内容进行知识表示和自然语言理解,总结出微博中出现频率最高的53个情绪结论词汇,包括副词和代词。其次,从微博样本中抽取确定的情绪词汇,疑似的情绪词汇则采用不确定性推理计算其可信度。从Hownet本体知识库中获取词语、义项和义原的相似性作为推理证据的可信度,从而计算出结论的可信度。最后,定义微博的转发数量范围,应用朴素贝叶斯分类方构建转发分类器,对分类器的鉴别正确性进行样本训练,评估测试效果显示,分类预测已经达到较高的准确率。  4、融合个体传播动力计算的传播时空演化模型。首先分析社交媒体的信息传播机理和流程,定义传播规则。根据传染病动力学理论,用图论的方法把个体分为传播节点、未感染节点、免疫节点三类。结合MLW模型特点,定义传播圈子描述模型中节点和边的变化。其次,提出主观传播动力因素概念:个体传播意愿,包括三种构成因子:个体关系的强弱度、个体对观点的认同度和个体接触传播源的频度;代入兴趣相似性值,以CODA模型为基础设计了量化方法。在服从幂律分布的非均匀网络中,构建平均场方程组描述节点的演化过程。最后,以个体影响力值为条件,提出波纹传播动力计算方法,计算传播的动力值和持续时间。构建BA网络仿真实验,结果显示,模型有助于深刻理解社交媒体的演化过程,解释了传播现象,获得了信息传播与个体传播动力变化的基本规律。  综上所述,研究社交网络群体的行为特征、文本的情绪特征,量化个体传播动力,对发现潜在的传播规律和预测传播效果,具有重要的理论意义和应用价值。
其他文献
XML自1998年由W3C提出之后,已经成为因特网上数据表示和数据交换的新标准,各行各业都在使用XML描述本领域信息,随着XML文档的急剧增加,如何有效存储、管理和查询这些XML数据
随着Internet迅猛发展,接入Internet的用户数量剧增以及服务网络固有的延迟,造成Web服务器负载和用户访问延迟严重等一系列问题,用户的服务质量得不到很好的保证。缓存技术能
随着计算机系统性能的不断提高、存储数据量急剧增加以及信息越来越复杂,用户如何高效组织和管理信息成为信息技术的重要课题。文件系统作为操作系统中存储和管理信息的主要构
随着Web服务技术鉴于其封装性、松耦合等特点获得了的广泛应用,众多的服务提供商将他们的服务以Web服务的形式封装并发布。相应的,消费者对于服务的功能、反应速度、服务质量
随着我国经济体制和行政体制改革的深化,社会正处于转型期,在这种形势下,要求政府及时主动公开政府信息,加强与公众之间的沟通,为公众提供高效便捷的服务,履行公共服务的职能
随着通讯与计算技术的不断发展,无线传感器网络正在发挥越来越重要的作用。无线传感器网络通过传感器节点收集并传输观测数据,最终将观测数据交付观察者。它跟传统无线网络最
数据挖掘是指从大量的、不完全的、有噪声的、模糊的数据中提取出隐含在其中的、人们事先不知道的但又潜在有用的知识的半自动化的方法,它是解决“数据丰富、信息贫乏”的有
一个网站由许多个网页组成,网站上的信息分布在这些网页上,而不同用户对不同网页上的信息感兴趣,现在随着网络技术的高速发展,网络上的信息呈指数增长,所以人们要想在众多的信息资
随着Web技术的发展,互联网上出现了一系列基于内容的图像检索应用,即“以图找图”。石材图像检索系统是为石材行业开发的一个基于Internet环境的实用信息系统,该系统可通过石
随着社会信息化进程的不断深入发展,人类对信息的需求和依赖程度越来越高,如何从海量的信息资源中快速有效地获取有用的信息,已经成为研究的热点。目前文本聚类的方法主要有