基于微博的突发事件检测和信息传播建模

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:hexinyu2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博客自问世以来,以其实时性和便捷性受到用户的钟爱,成为网络应用中炙手可热的新宠,微博上聚集的大量用户及相对自由的言论信息又使得微博成为把握社会脉搏的有力工具。所以本文的研究基于微博平台,致力于发掘微博平台中的突发事件并在此基础上进行微博网络中信息传播方式的建模。本文的工作主要分为以下几个方面:首先,获取基于微博研究的数据集。进行“人民微博”上的信息抽取工作,应用针对该微博平台页面信息结构设计的爬虫,对该平台的整体信息和热点信息分别进行抽取并存储,整体信息一次性抽取,内容包括微博信息,用户信息和用户关系信息等;热点信息实时抽取,内容包括热点微博信息,热点用户信息和热点关键词信息。而后,检测微博中的突发事件。微博的简短性使得其对事件的描述中,事件的主题词以很高比例出现,并呈现与事件一致的受关注程度,所以本文突发事件的检测部分以事件主题词的检测为线索。首先选择微博语料适用的特征值和数据组织方法;而后构建时间窗内各词的特征轨迹,结合特征轨迹的时域和频域特征判定词的突发性,由于突发事件的主题词包括其人物、地点信息,这些词通常是未登录词但对事件的表达意义重大,所以在该过程进行新词发现;最后根据各突发词的在微博中的共现情况进行聚类,实现突发词与突发事件的对应,并利用已有微博信息提供突发事件的详细描述。最后,构建微博用户网络的信息传播模型。在突发事件信息的基础上,结合微博中信息传播的途径和特点,构建了微博中信息传播的五元组模型,分析了模型各元素的影响因素和元素的表征方法,并在此基础上实现了微博网络中信息传播过程的模拟。这部分着重对微博网络中节点的信息传播能力进行分析,舆情监督过程通过控制信息传播能力强的节点可以有效控制信息的传播。本文的突发事件检测工作能够较真实、及时的映射社会上的重大事件,对民众了解时事,有关部门提前预警都有一定的帮助;信息传播建模工作可以预测信息传播的过程及关键节点,为信息传播监督和控制工作提供参考。
其他文献
微电子技术专业课程理论性较强,在高职院校中开设此专业,教材的选用和课程的教授都有一定的难度。针对《半导体器件物理基础》课程教学中存在的问题,结合课程特点,就高职院校
自1998年以来,我们用干扰素治疗腮腺炎60例,疗效显著,报告如下.1 临床资料共120例,年龄3~14岁,均有发热及腮腺肿大、疼痛,其中68例(男女各34例)并发脑膜脑炎,52例并发睾丸炎.
基于参考咨询服务现状和O2O服务模式的特点与内涵,针对高校师生的文献信息需求,构建了一种线上与线下互动融合的图书馆参考咨询服务模式。对O2O模式下图书馆参考咨询服务的总
恰当准确的细节描写是文章生动感人的"助推器"。小学作文教学应提升细节描写能力,从环境细节、动作细节、语言细节和心理细节来造势蓄情、流露真情、表白真情、显露柔情,这样
电铲是露天开采中的主要的大型装备之一,用于矿山表面物的剥离和矿石的采装作业。我国的电铲长期依赖于进口,设计开发具有自主知识产权的电铲产品,具有积极意义。本文分析了国内
本文是在实习期间,以公司的实际产品为背景,设计的一种基于无线网络的虚拟存储设备。设计的开发平台是Mini6410,所用的主控制芯片是S3C6410,主机和目标机的软件开发平台均是L