面向微博消息流的异常消息检测关键技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:fctznh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当代是共享信息的时代,随手移动端的发展和网络普及化,微博成为人们生活中一种不可或缺获取信息的便捷途径,它可以实现与他人分享、交流、互动信息等功能。然而随着微博消息数量的日益膨胀,突发消息和垃圾消息会在微博平台上的扩散速度更快,传播更广。如何快速有效的检测微博的中异常消息已经成为微博舆情监管领域重要研究的方向。突发消息检测的研究重点是微博中合理调整滑动窗口的大小以及合理选取阈值的大小。基于此问题,文中是基于时间序列方式的微博滑动窗口,针对固定窗口检测突发消息的灵敏程度小,阈值的固定化不能适应消息变化快慢等缺点,本文结合滑动窗口算法和自适应阈值算法,提出自适应滑动窗口及判定阈值微博突发消息检测研究。该模型考虑到网络流量实时性对窗口和阈值要求灵活的特点,通过实验数据选择时间跨度长短不同的微博消息,用对比方式验证自适应滑动窗口比固定窗口检测消息的时间要快、要合理,更好分析突发消息波动的趋势。用对比实验验证自适应阈值的正确性,更好的预测微博突发消息的起伏变化。在微博检测突发消息的过程中,检测的消息中会存在垃圾消息。如何将数据信息提取出来服务于用户,最终目的是要净化垃圾信息。根据人工标注和匹配规则方式对垃圾消息分类的识别适应性差的问题,因此本文提出融合KNN和SVM的微博垃圾消息检测算法研究。该算法采用有监督学习,判断样本点到决策平面的距离,对于分类模糊的样本点进行再次分类。通过实验证明,融合方法能有效提高垃圾检测的正确性,有效识别垃圾的问题。综上所述,本文重点分析影响突发消息检测的滑动窗口和阈值两关键点,改进系统检测突发消息敏感性。并基于融合分类器,提高垃圾消息检测的效率。通过实验验证了自适应滑动窗口算法和阈值算法及融合算法的正确性和有效性。
其他文献
无线传感器网络是通过分析处理传感器节点收集到的信息来感知真实的物理世界,这不仅有助于网络分析客观世界,而且大大提高了人类认识物理世界的能力。路由协议是WSN中不可缺
私家车数量的不断增长让洗车业务得到了快速的发展。普通的洗车行内部一般采用人工手动对车辆牌照进行记录,而车牌的自动识别可以达到自动识别会员的目的。洗车行内环境特殊,
研究题目来源于国家“十一五”科技支撑计划课题“勘察设计企业信息化关键技术研究与应用”的子课题“基于SOA技术的勘察设计企业应用软件架构系统”。Web服务具有开放性、互
近年来,随着电子电路和计算机技术的发展,嵌入式技术广泛应用于工业领域各个方面,测控系统基本上是一个嵌入式系统和上层通用计算机的结合体。工业设备逐步实现了自动化和智
P2P技术是一种资源分散存储与共享的新兴技术。其体系结构与C/S体系架构相对应,资源存储上化集中为分布,资源使用上化分布为集中。因此,它是一种很有创意的技术。该技术一出
随着互联网技术和多媒体技术的发展,以数字图像为代表的多媒体数字视觉信息量剧增,并且渗透到人们生产生活的各个方面,因此,如何有效地获取和使用图像信息,成为了当前科学领域以及
随着多媒体技术的飞速发展,数字多媒体信息的应用得到了很大普及,越来越多的人享受到了数字多媒体信息给人们带来的便利。然而凡事有利也有三分弊,通过网络和其他渠道便利地
随着天气预报技术的发展,数值预报产品日益丰富,预报方法多种多样。在实际应用中,对每个具体的问题,各种预报方法得出的结果通常是不一致的,因而不知道如何将它们统一起来。
学位
随着科技的进步和时代的发展,移动电话的用户群体正在以我们无法想象的速度增加着。现今的我们很难想象没有无线网络的日子将如何度过,无线通信已经像空气、水和电一样,深深的扎