耦合关系在微博水军识别中的应用研究

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:zxh1372226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着微博、Twitter等社交平台的飞速发展,用户可以方便的获取资讯、建立朋友圈并分享位置、心情等个人信息。社交网络的便捷性、开放性、实时性特点使其成为网络信息资源的重要汇聚地,其中包含具有一定价值的可用信息,也存在大量无实际意义的灌水或垃圾信息。微博水军就是利用网民因信息不对称所导致的信息真空来达到误导舆论走向、制造热门话题、发布恶意链接等目的,导致严重干扰网络正常秩序,造成公众财产损失,阻碍社会公平正义发展的后果。因此,微博水军识别对净化网络环境、保障网民的利益有着重要的意义,目前已成为网络水军研究的热点问题。  当前大多数水军识别方面研究均是以研究对象的主要特征具备独立同分布特性为基础,因此,本文针对新浪微博的水军识别问题提出一种应用耦合关系的改进算法,首先通过新浪微博 API接口获取用户相关原始数据来构建用户特征模型描述,其次利用计算耦合相似度方法度量用户特征的内耦合和间耦合关系,将其添加为分类器输入参与预测。测试实验结果表明耦合关系的应用使得度量指标均有一定的提升,微博水军识别的效果有所提高。  本文研究的主要内容包括:  ①综述分析了经典微博水军识别方法的优缺点,并在此基础上构建了新浪微博用户特征模型,包括关注数与粉丝数之比、朋友数与关注数之比、账号等级、原创微博比例、含链接的微博比例、微博内容相似度、微博发送频率和用户耦合相似度;  ②采用用户耦合相似度计算的方法度量用户特征的内耦合和间耦合关系,并将耦合关系应用到预测系统的分类器构建过程中;  ③针对新浪微博用户的水军识别问题,通过数据集获取、数据预处理和特征提取,采用朴素贝叶斯、决策树和逻辑回归三种经典算法验证耦合关系的应用效果,并给出了各项度量指标的对比结果与分析。
其他文献
海上船舶自动识别系统(AIS)是一种采用TDMA方式工作的新型助航设备。其优点是信息量大、实时性好、抗干扰能力强和越障碍传输。主要应用领域是船舶避碰、船舶交通管理系统。
随着个人电脑以及互联网全世界范围内的普及,计算机游戏产业正作为一种新兴的产业迅速发展。有调查显示,到2007年,其市场总额将达到1000亿美元。因此,它被那些行业分析师认为将在
虚拟现实技术的应用现在越来越多,而虚拟场景则是虚拟现实的一个重要组成部分。本文首先介绍了虚拟现实的概念和国内外现状,然后介绍了目前比较流行的创建虚拟场景技术。接着
随着Internet和www迅速发展,网络信息资源的动态性、分布性、多元性和无序性等特点,使信息的处理变得越来越困难。大量网络信息资源以半结构化数据的形式存在,如何用可靠的系统
随着面向对象的软件开发技术的迅速发展和应用,面向对象的测试技术成为研究的热点问题。在面向对象软件中,由于类之间消息传递的复杂性,使得类级测试成为面向对象软件测试的
随着互联网的迅猛发展,大量的新服务、新应用、新算法不断涌现,网络应用对互联网可扩展性的要求也越来越高。在下一代网络体系结构的研究中,网络结构的可扩展性也受到研究人员的
随着Internet技术的发展以及音视频压缩技术的进步,基于Internet的多媒体交互平台受到了越来越广泛的重视。目前,利用流媒体技术进行远程网络教学已经逐渐普及,本文以构建基
本文以我国未来空间站的需求为背景,根据“空间站AOS系统方案设计”的指导思想,对未来空间站AOS的系统结构、系统数据流、关键设备的设计规范以及嵌入式实时操作系统VxWorks
本文针对电缆隧道巡检机器人的防摆控制问题进行研究。由于其运行轨道随着隧道环境的变化而起伏多变,具有上下斜坡等特殊路段,导致机器人在巡检过程中机身连续摆动,从而严重
IP电话也称网络电话,出现于1995年,是随着信息技术进步而产生的新业务。它是在网络上采用语音压缩包交换技术来传输的语音电话。通过数十年的飞速发展,目前VoIP技术已从具有语音