基于微博的信息传播建模与节点影响力研究

被引量 : 17次 | 上传用户:cedzyh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博自问世以来,便以其实时性和便捷性受到用户的钟爱,成为Web2.0时代网络应用的新宠。庞大的用户数量以及便捷迅速的消息发布与传递方式使其成为了当前信息传播及舆论扩散的重要平台,造就了众多影响力巨大的用户。然而,微博在带来便利的同时,也对舆情管控及国家安全提出了新的挑战。研究微博网络的信息传播过程,挖掘信息传播中的影响力节点,建立针对微博特点的分析方法将具有重要的意义。目前,关于微博中的信息传播与节点影响力研究主要存在以下问题:1)微观层面的传播研究无法全面反映微博中信息扩散效应;2)以静态属性为主要指标的影响力度量方法无法体现微博应用特点;3)当前影响力最大化研究没有引入微博的传播特点和拓扑特征导致相关算法并不适用于微博网络。针对上述问题,本文依托国家“十二五”863计划项目,开展微博网络中的信息传播与节点影响力研究。主要工作和研究成果如下:1.建立了一种基于行为预测的微博网络信息传播模型。首先分析了决定微博用户消息转发行为的因素,提取了一系列数值化特征,利用机器学习中的分类方法建立了用户转发行为的预测模型;在预测模型的基础上设计了微博网络的信息传播规则,刻画了微博用户的群体信息行为,建立了一种阈值传播模型。在新浪微博数据集中的仿真结果表明,通过引入用户的转发行为预测,本文提出的传播模型可以较好的模拟真实网络中信息传播的速度与广度,同时,实验还发现存在一部分影响力用户对信息传播起到关键作用。2.建立了微博网络影响力模型,提出了一种新的影响力度量算法。在对微博用户影响力进行合理定义的基础上分析了决定用户传播影响力的三大因素即活跃度、传播度和粉丝数量,进而提出了影响率的概念来描述两用户间的影响力关联强度,建立了有向加权的用户影响力模型,并在此模型的基础上引入PageRank算法思想,提出了一种新的微博网络用户影响力度量算法MIR-IM(Microblog Influence Rank based on Influence Model)。在新浪微博数据集中的仿真结果表明,MIR-IM算法在挖掘影响力用户的问题中,明显优于经典的PageRank算法。3.提出了一种基于微博网络的影响力最大化算法。分析了实现微博网络影响力最大化需要解决的两个关键问题,即1)建立符合微博特点的影响力传播模型;2)设计高效的Top-K节点选取算法。针对这两个问题,首先引入影响率的概念建立了扩展的线性阈值模型,之后在此基础上设计了启发式的影响力最大化算法框架HGAE。在新浪微博数据集中的仿真结果表明,与传统的社会网络影响力最大化算法相比,HGAE算法通过引入微博特性在最终的影响范围上有明显提升。
其他文献
考试观是指学生在学习生活和个人经验的基础上形成的,对考试及其功用、目的、性质、策略、应对等方面所持有的感知、观点和看法。学生考试观一直是国外教育学与心理学的研究热
<正>会计转型与时代发展相互推动,相伴而行。移动互联网+、云计算、大数据等现代信息技术的高速发展,正在倒逼现代会计蕴含者一场深刻蝶革,传统的记账型财务会计将日趋弱化,
改革开放以来,我国经济转轨、社会转型,加之多元文化及市场经济的负面影响,由突发事件所引发的一系列问题,正从思想、行为等多方面对大学生产生重大影响。胡锦涛总书记在庆祝
畲族是我国五十六个民族中不可分割的重要一员。在历史的积淀中,盘瓠神话经久不息地在畲民口头流传,并被记录于谱牒之中,刻画于祖图之内,成为展示民族远古史的重要材料。自汉代起
产业布局对经济发展具有重要意义,而海岸带区域的独特自然资源、社会资源和经济资源造就了该区域独特的产业布局模式。以长江三角洲地区为例,针对海岸带区域独特的经济、社会
<正> 我站地处内蒙古大青山北麓,气候干躁严寒,风沙甚大,天气变幻莫测,无霜期仅为110天,纯属典型的大陆性气候,对养鱼事业的迅速发展带来不少的困难。尤其是鲤、鲫鱼产卵、孵
在网上交易中,识别对方营业执照的真伪是防范交易风险的重要手段之一,企业必须要炼就一双火眼金睛。
<正> 实施标准化,以获得最佳的生产经营秩序和效益,是企业质量管理工作应当持续追求的永恒目的。在国家“复关”,企业“下海”的市场经济大趋势下,贯彻实施GB/T 19000系列标
在饲料中分别添加0、1×109、3×109和5×109cfu/kg枯草芽孢杆菌(Bacillus subtilis),测定投喂相应饲料后第1、4、7、14、21、28天以及停止投喂枯草芽孢杆菌后的第7、14天克