微博突发事件检测及溯源技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:BCB
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的迅速发展,网络逐渐融入人们的生活当中。微博近三年急速发展,突发事件检测及溯源已成为热门的研究方向。通过突发事件检测技术,帮助人们自动检测突发事件,随后借助溯源技术找到事件源头,帮助人们进一步了解突发事件的前因后果。本文研究了关于中文分词、微博文本特点、消息和事件传播模型,突发检测模型和用户关系模型,而后基于这两个方面的研究成果,提出了基于MACD的突发事件检测算法和基于多维度分析的微博突发事件溯源方法。本文提出一种结合字典分词和统计分词的新分词方法,迅速、准确切分微博内容。本文提出一种基于MACD的突发事件检测算法,采用考虑用户影响力和用户作息的滑动事件窗口机制,从两个方面提高突发事件检测算法的准确性。创新性地提出一种“词作息表”法,为每个词配备作息表,有效消除用户时间作息和用词时间作息。最后本文利用一种基于突发词距离的事件聚类算法,有效聚类事件。实验证明,该算法能够有效去除用户作息和低质用户带来的伪突发,提高突发事件检测的准确性。本文提出一种基于多维度分析的微博突发事件溯源方法。该方法从微博属性维度、结构维度出发,计算微博初始权重。随后基于行为维度分析微博之间的关系,计算微博最终权重。本文还提出一种基于事件描述词的内容相似度计算方法,较文本编辑距离计算方法,大大降低时间复杂度。本文深入研究用户之间的交互关系,提出基于直接转发与隐含转发的行为分析方法,有效度量权值传递系数。实验证明,该方法具有较低的时间复杂度,较高的溯源准确度。
其他文献
随着互联网应用技术的不断进步,以及规模的不断扩大,如何保障网络信息的安全性已成为新一代互联网急需解决的重要问题。基于并行分析的防火墙、入侵防护系统和流量检测系统等
工作流活动多实例,特指一个活动,有多个不同的工作流参与者。每个工作流参与者都执行一个同构的活动。工作流活动多实例所代表的业务流程在现实中非常常见,最常见的比如投票
传统网格门户往往作为网格项目或者网格中间件研发的一部分,具有很大的依赖性,不容易进行独立开发。随着大量网格门户的开发,进行了很多重复性工作,造成了大量人力、物力的浪
随着互联网技术的高速发展,各种异构的无线网络随之孕育而生。未来无线通信领域,必将是一个多种异构无线网络融合的趋势。因此,用户如何能够在多个异构网络覆盖的区域,通过合
P2P(Peer-to-Peer,即对等网络)是近年来广受IT业界关注的一个概念。由于广大的网络终端节点(普通用户拥有的节点,即通常意义上的终端设备)的计算和存储能力以及连接带宽随着摩
随着网络技术的普及,越来越多的学校建设了自己的校园网,校园网为信息和技术的交流提供了更大、更广阔的空间。基于网络技术开发的计算机辅助教学系统,已成为一种新兴的教学媒体
Web服务是当前万维网技术讨论的热点,作为一种分布式技术的革新,它最大的优势在于定义了应用程序之间交互的标准化,并且使用XML作为数据传输的中间格式,突破了应用程序所在平
随着现代生物技术的不断发展特别是基因组计划的实施,人们不断获取大量的基因序列数据,准确、高效的对基因序列数据进行分析并挖掘出隐藏在其中的对人类有用的信息是非常必要
在过去的几年里,随着数字化的不断深入以及网络应用呈指数式的上升,通过因特网来进行视频监控变得越来越流行。其主要原因是该技术背后蕴藏着巨大的市场,如视频聊天,远程监控,远程
随着无线终端设备使用的日益广泛以及互联网技术的飞速发展,它已经和人们的生活有了越来越多的联系,无线网络已经成了很多人生活中必不可少的一部分。同时无线局域网的安全性