基于用户行为的网络论坛水军检测研究与实现

来源 :西南交通大学 | 被引量 : 0次 | 上传用户：tonyyuhua

【摘要】

：

网络论坛水军是活跃在网络论坛中一个或一群人,他们通过话题炒作等行为影响网络舆情走向。其主要手段就是在主流论坛中大量发帖,回帖造势。由于这些网络论坛水军的行为往往会

【作者】

：

吕晨

【出处】

：

西南交通大学

【发表日期】

：

2017年期

【关键词】

：

网络水军网络爬虫特征提取分类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

网络论坛水军是活跃在网络论坛中一个或一群人,他们通过话题炒作等行为影响网络舆情走向。其主要手段就是在主流论坛中大量发帖,回帖造势。由于这些网络论坛水军的行为往往会伴随流言制造、事件真相掩盖甚至引发针对某些事件的大规模动乱,因此有必要对其特征和行为开展深入挖掘,然后形成合适的方法和标准在海量的论坛信息中检测出这些水军甚至是其所属的水军公司或组织。这对打击网络造谣犯罪、防止网络舆情极端爆发进而影响社会稳定等具有重要意义和实际应用价值。目前国内外基于帖子内容的网络论坛水军检测和分析技术尚不成熟。本文设计了一个基于用户行为和分类方法的网络论坛水军检测系统。首先在模拟登录论坛后使用宽度优先搜索的聚焦爬虫程序"浏览"相关论坛页面,下载相关的论坛数据并结构化存储在数据库中,然后从这些数据中提取出8个能够用于分辨正常论坛账号和水军账号的特征,接着用一种辅助人工标记的方法标记训练集和测试集,并使用C4.5决策树算法构建分类模型,对网络论坛用户是否是水军做出判断预测,将预测结果分别与人工主观判断结果和辅助标记结果比较后取得了 78.00%和89.49%的预测准确度。该实验结果证明了本文提取的论坛用户行为特征具有较高的分辨力和有效性,同时得出基于用户行为的网络论坛水军检测方法可以有效地检测论坛中的网络水军的结论。第一部分是绪论部分,主要包括对网络论坛水军的产生、发展和网络论坛水军检测意义的介绍以及对网络论坛水军检测研究的国内外现状的概述;第二部分简单介绍了本文涉及到的关键技术和方法;第三部分详细阐述了论坛数据的采集和存储方法设计,包括网络论坛模拟登录的实现、聚焦爬虫程序的设计和数据库设计;第四部分主要分析了水军检测相关研究中用户特征的提取方法并重点阐述了针对本课题研究对象的网络论坛用户行为特征方法;第五部分设计了一个基于用户行为和分类方法的网络论坛水军检测系统,并利用该系统实现了对网络论坛水军的检测和识别;最后是对本文的总结和对该领域未来研究方向的一些展望。

其他文献

研究生创新自我效能感的结构与特征实证研究

通过分析研究生创新自我效能感的内涵,以243名研究生为被试,验证研究生创新自我效能感的四维结构模型,并分析其特征。结果表明,研究生群体中,男生创新自我效能感显著高于女生

期刊

创新自我效能感结构特征研究生实证研究

脑卒中后发生抑郁的相关因素

脑卒中后抑郁症状的发生与医学、社会、心理等多方面因素有关,本文就此作一综述,以期对临床有一定的参考价值.

期刊

脑卒中抑郁影响因素并发症综述

透析相关性腹水

透析相关性腹水发生于维持性血液透析治疗的终末期肾病病人,其诊断需排除腹腔恶性肿瘤、肝硬化、心功能不全、血管病变及感染等病因.其发生机制有多种因素参与,主要与腹膜通

期刊