社交网络中基于两阶段的意见领袖挖掘及其信息传播模型研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:shuang9988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前社交网络已经成为人们进行信息交互的重要平台,在参与社交网络活动的用户中,有少部分用户在网络世界中受到更多其他人的认同与追捧,本文称这部分用户为社交网络中的意见领袖。意见领袖能够在信息交互的过程中对其他用户产生思想或行为上的影响,在信息传播过程、舆论引导和监督等研究中发挥了重要的作用。因此,社交网络中的意见领袖挖掘已经成为社交网络分析的重要组成部分。社交网络中意见领袖的比例较小,但大多数意见领袖挖掘方法都需要评估全网中每个用户成为意见领袖的可能性,导致算法的计算复杂度较高。另外,在社交网络中意见领袖往往比普通用户更容易扩散信息,而当前的信息传播模型常忽略用户角色的不同对信息传播过程的影响,造成信息扩散预测结果的偏差。针对上述问题,本文提出了一种基于两阶段的意见领袖挖掘算法和一种基于用户角色的线性阈值传播模型,以及相关的计算方法与理论。论文的主要工作包括:(1)提出一种基于两阶段的意见领袖挖掘算法。将意见领袖识别的过程分为两个阶段:聚类和排序。在聚类阶段,从社交网络拓扑结构上分析出能充分表现意见领袖特征的拓扑属性,使用K-means算法对用户的拓扑属性进行聚类。并选择满足意见领袖条件的簇加入到候选意见领袖集中,缩小识别意见领袖的数据规模。在排序阶段,分析候选意见领袖集中用户的历史行为数据,从用户活跃度,用户影响力和扩散中心度三个角度计算用户领导力,并依据用户领导力排序获得意见领袖。(2)提出一种基于用户角色的线性阈值模型。模型首先根据激活者和被激活者角色的不同来确定激活者对被激活者的用户影响权重。同时考虑到当同一个用户被多次激活时,最新激活该用户的活跃用户对其影响最大,引入影响权重随时间衰退的概念。动态化影响权重累加的过程,减少信息扩散过程中被多次激活的活跃者总数。(3)在实验中,将本文所提的两个算法分别与多个其他算法进行对比。验证了本文所提出的基于两阶段的意见领袖挖掘算法,能够在降低计算复杂度的同时准确识别意见领袖。也验证了本文所提出的基于用户角色的线性阈值模型,能够量化用户角色对信息扩散过程造成的影响,以及能够有效地减少信息扩散过程中被多次激活的活跃者总数。
其他文献
三甲基甘氨酸在化工、食品、医药、养殖和发酵等行业具有广泛的应用前景。重点阐述了三甲基甘氨酸的制备工艺,并对各种工艺路线进行了比较分析,对其未来发展进行了简要分析。
“桑”文是藏族特有的一种文化形式。它作为一种民俗文化,不仅仅反映着人们的精神世界即原始的万物有灵观念(自然崇拜)和佛教信仰,而且也体现着藏族不同历史时期的社会制度,
水上技能课程教学训练,技术结构复杂、掌握难度大、要求高。针对蛙泳技能训练问题,从蛙泳教学实际着手,具体分析腿部动作存在问题,寻找解决途径,提出合理的纠正方法,创新组训
【案情】2019年1月,哈尔滨市民张一斌在某电商平台的一家旗舰店购买了一对品牌情侣首饰。根据该旗舰店的商品信息,该品牌首饰原价5548元(在网站界面上,该价格被删除线划掉),
在电除尘器前布置热回收器,可以实现提高除尘效率和余热利用的双重目,是目前广泛采用的电除尘新技术。本文采用商业CFD软件,利用多孔跳跃、换热器模型,模拟热回收器内温度、
来自山东的作家张炜一直是当代文坛的热点和焦点,几乎他的每部作品都会引起广泛的关注和争议,该如何解读张炜及其创作呢?本文试图通过张炜的叙述文本、创作谈、散文随笔和文
本文主要针对基层财政局预算资金绩效管理优化问题展开深入研究,重点阐述了几点优化措施,比如树立正确的战略发展观念、制定完善的预算编制体系、加大监督力度、明确绩效考核
本文以英山地域的文学现象作为具体的研究对象,从多种向度,试图阐释英山新时期出现大批作家的社会历史文化的原因、英山地域文本具有的特定内涵以及特色。首先,笔者从文学发生论
袁昌英是一位不应该被遗忘的学者、教授、剧作家。她中西文化视域融合下的诗性创作,不仅仅指其戏剧创作的艺术性,更在于她将个体体验与艺术创作糅合为一体的诗化人生,表现出
阳江具有丰富的海洋旅游资源,经过近些年的发展,当地滨海旅游业已初具规模,但同样面临挑战。本文分析了阳江滨海旅游业发展的优势、劣势、机会和威胁,在此基础上,对阳江滨海