新浪微博恶意用户研究及检测

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:gipy2a1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网的普及,微博作为一种新的媒体形式和交流平台也越来越流行。与此同时,微博平台上不断涌现出的各种恶意行为,开始成为破坏微博安全和内容质量的最大威胁。如何鉴别恶意用户,成为社交网络研究领域的一个重要课题。现有的针对微博的研究大多数以Twitter为平台,其成果无法直接应用于新浪微博等中文微博平台。因此,专门针对中文微博的研究也是相当有必要的。本文以新浪微博为研究对象,提出了一种基于行为特征检测的微博恶意用户鉴别方法。我们采用了多种方法收集了恶意用户样本:通过架设主动式蜜罐账号,我们吸引了114个恶意用户;利用微博爬虫程序,我们捕获了1459个恶意用户。此外,我们还从淘宝购买了微博推广服务,从而获得了8000个恶意用户样本。我们将恶意用户样本按照行为模式进行分类,归纳总结了三种不同的恶意行为模式:过度广告、重复转发以及过度关注。我们针对所得到的三种不同行为模式的恶意用户进行了深入的分析,通过与正常用户比较统计特征值的方法,归纳总结了他们的特点并且找到了能够区分恶意用户与正常用户的特征。在此基础上,我们利用机器学习技术实现了多种恶意行为分类器,并且将这些分类器整合在一起构成了自动检测系统。我们利用重新收集的测试数据集对该系统进行了测试。该系统能检测出82.06%的恶意用户,而误报率则只有5.92%。
其他文献
通过近三年的野外观察和实验揭示了活血丹的盗蜜者为中华木蜂.但其雌雄个体具有不同的访花特性和影响.雄蜂的体形稍小,访花频率是雌蜂的4倍,单花访问时间较雌蜂短(2.18s/7.48s),但在一
CPC分类体系以ECLA分类体系为基础,并采用IPC分类体系的分类标准和层级结构,既融合了ECLA分类体系和USPC分类的体系的优势,又更好地与国际专利分类体系相融合,其细分相对于IPC、E
针对西南低山-浅丘地区的生态地质环境问题,以内江市为研究对象,利用遥感监测和地理国情监测数据,对内江市生态地质环境质量各因素间的协同机制展开研究。通过对影响生态地质
<正>一、前言随着经济全球化趋势的到来,企业文化对企业的生存与发展所起的作用越来越大,成为企业竞争力的基石,决定企业兴衰的关键因素之一。纵观成功企业的发展,都有深厚的
会议
目的探究超声诊断对乳腺非肿块型病变的应用价值。方法选取2015年3月~2016年3月在本院接受治疗的80例乳腺非肿块型病变患者,按照其检测方法的不同分为对照组和观察组,各40例,
目的:对乳腺非肿块型病变的超声表现展开观察与探究,以期为临床诊断提供可靠依据。方法:选取我院收治的46例乳腺非肿块型病变患者为研究对象,所有患者经穿刺活检或手术治疗诊
毛泽东思想是20世纪中国历史的产物,又是指导亿万中国人民推动历史前进的伟大精神力量。在中华民族几千年的文明史上,毛泽东思想发挥了此前任何一种思想理论都未曾有过的动员
简要介绍了我国机车柴油机活塞技术开发体系,即以活塞加速寿命试验技术、组合活塞仿真分析技术、活塞环槽抗磨损试验技术和组合活塞失效模式及失效原因分析技术等为核心的活
目的比较腹腔镜与传统开腹子宫肌瘤切除术的优缺点,观察两者的临床疗效,探讨腹腔镜下子宫肌瘤切除术的临床适应证,以评价腹腔镜下子宫肌瘤切除术的临床价值。方法回顾性分析自20
在新媒体风行的时代背景下,直播的发展方兴未艾,呈现出新的传播特点,也暗合了固有的传播学规则与理论。在共处共融的新媒体生态下,研究直播形式在内容创作方面的特质与规律越