面向微博舆情的用户挖掘及消息传播预测关键技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:nopromises
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络的迅速发展,微博在人们网络生活中的位置越发重要。相比于传统媒体,舆情事件消息在微博平台上的扩散速度更快、传播更广。微博为人们获取信息带来了便捷的同时,也为不法分子提供了平台。若有不法分子利用社交平台散布虚假信息,将会给人们的生活带来极大的不便甚至是危害。因此对微博舆情事件的传播过程进行监控、分析其中引起大规模转发的关键用户、预测未来时间的消息传播规模,这对控制舆情事件的不良发展有着十分重要的意义。在舆情事件传播中,用户更加关注与其地域紧密度高的舆情事件和感兴趣的舆情事件。然而,现有的关键用户挖掘算法并未充分考虑舆情事件的地域特征。基于此问题,本文提出一种面向微博舆情的关键用户挖掘算法——KURank算法,针对舆情事件的地域特殊性和描述针对性的特点对PageRank算法进行了改进。同时本文采用超网络的概念,从社交子网络、信息传播子网络、地域子网络和描述词子网络四个方面描述微博消息。实验证明,对于微博舆情事件,KURank算法能有效地识别出促进事件传播的关键用户。在微博信息传播过程中,事件的大规模传播通常都是由关键用户引起的。在消息传播预测中,关键用户对消息传播的影响需要重点考虑。因此,本文提出一种基于关键用户的消息传播预测模型——KU回归模型。该模型采用KURank算法计算每个时间窗口的关键用户,以每个时间窗口的新增关键用户在所有用户中的比例为自变量,以微博规模增长率为因变量构建多项式回归模型对微博传播趋势进行预测。实验证明,KU回归模型能够有效的解决舆情事件消息传播预测的问题,其预测结果与实际数据曲线拟合良好。综上所述,本文重点地考虑了舆情事件的特定地域和特定事件描述的特征,进行微博舆情事件的关键用户挖掘,并基于关键用户和多项式回归函数构建消息传播预测模型。并通过实验验证了 KURank算法和KU回归模型的可行性和实际效果。
其他文献
随着企业在质量、价格、时间、柔性和创新等竞争领域的经营业绩越来越依赖于供应商网络,伙伴关系和有效的供应商管理变得越来越重要。在选择供应链合作伙伴的过程中,由于竞争地位与收益的不平衡,缺乏相互信任等因素会造成合作伙伴评价指标与实际值不相符合。为了能更好地提高企业选择合作伙伴的效率并减少其选择成本,选择最小二乘支持向量机(LS-SVM)算法对合作伙伴进行选择。实验证明,LS-SVM比普通的向量机不仅具
随着Internet技术的兴起,B/S结构逐渐取代C/S结构成为网络应用开发所采用的的主要结构模式。B/S结构拥有众多优点,比如部署方便、升级维护简单,结构易于扩展等。但是随着客户端
并行处理技术近年来已成为计算机界研究的一个热点。采用并行处理技术来解决大数据量或时间复杂度高的问题不仅在计算机界,而且在其它科学领域都是首选的。而算法是并行处理技
在企业信息化日新月异的今天,SOA,即面向服务体系架构已经成为解决企业应用软件建设困境的必由之路。通过SOA应用、SOA企业架构和方法论、SOA基础设施这三个适合中国国情的切
基于内容的图像分类方法是计算机视觉领域中的难点和热点问题之一。目前几乎所有的图像分类方法都依赖于用图像底层特征间的距离来度量图像内容的语义相似度,实现对图像内容
上下文感知系统的广泛应用反映了其日益增长的市场需求和潜在的巨大经济效益。上下文感知系统通常是大型的、复杂的异构系统,开发这样的系统涉及到软件、硬件和网络的实现,设
本文以中国石油勘探生产信息门户为应用平台,介绍了Web服务的概念和核心技术,研究了基于不同平台下,设计、构建、部署、应用Web服务的方法。根据勘探生产门户信息共享的需要,
无线传感器网络是由部署在监测区域内大量的微型传感器节点组成,通过无线电通信形成的一个多跳自组织网络系统,能够感知、采集和处理被监测对象的信息,并发送给观测者,实现人
现代教育对考试形式、考试效果、考试统计、考试的即时性、学习效果的评价等要求越来越高。传统的纸质考试方式、人工教学评价方式越来越适应不了需要。随着专家系统、数据挖
Web技术日益成熟,基于Web的应用软件被应用到各个领域,尤其是Ajax技术的出现,使得Web应用变得更高效、更便捷、交互性更强。在大多数基于B/S模式的Web应用中,由服务器端主动