基于CBOW模型的微博水军识别

来源 :苏州大学 | 被引量 : 0次 | 上传用户:blus95
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网平台的快速发展,人们和互联网之间的关系越来越密切,大量水军涌入互联网平台,从中获利。然而,水军的行为却严重破坏了互联网秩序、损害了网民的利益,因此互联网水军的识别也变得愈发重要。早期的水军识别主要是针对水军特征构建有监督的机器学习模型,一定程度上可以识别出特征较为明显的水军。互联网水军如今在不断升级,试图通过模仿真人的行为,躲避水军识别模型。本文选取了国内比较有代表性的平台——新浪微博,摆脱了以往单一地从用户特征出发的研究角度,考虑到用户使用微博时存在网络社交关系,创新性地从水军团体的“一致行动性”的角度出发,提出了 CBOW-MiniBatchKmeans模型。该模型向量化了用户的关注信息,再对用户作聚类分析,从而根据水军的关注信息实现了水军的无监督发现。实证结果显示,该模型在大量数据上的表现是高效的,并且发现的水军,根据人为的二次判别证实是有效可靠的。
其他文献
<正>一、基础设施公募REITs发展现状(一)政策体系初步构建近年来,围绕基础设施公募REITs制度建设,形成了由国务院及有关部门进行顶层设计,地方政府推动落实,交易所、行业协会执行保障的政策监管体系。国家发展改革委、中国证监会等有关部门,相继出台了《关于推进基础设施不动产信托投资基金(REITs)试点相关工作的通知》《公开募集基础设施证券投资基金指引(试行)》等政策文件,明确了基础设施公募REI
期刊
待遇表现问题,在日语语言学里,是一个非常重要的研究课题。即使是同一会话对象,当场所和人间关系等因素发生改变时,待遇表现也会随之而产生变化。平安时期的贵族社会,是一个很严峻的等级十分明确的社会,在这种环境下,人们有着怎样的语言生活,以及待遇表现在当时有着怎样的表现形态,是一个不得不去考虑的重要问题。《源氏物语》作为平安时代的重要作品,可以说犹如镜子一样,反映了当时贵族社会的具体形态。因此,本论文以《
学位
随着人们安全意识的不断提高,开始更加注重电梯使用的安全性能,且对电梯检验标准、检验水平提出了更高的要求和标准。文章主要对电梯工作原理及其组成系统、检验检测工作实施的意义进行简单阐述,指出电梯检测的内容、常用的检验技术,分析电梯检验检测中常见的问题,并结合这些问题提出相应的处理对策,以期促进电梯检验检测水平的提升。
期刊
受高层建筑大量兴建影响,电梯在我国大量使用,已经成为人们生活与工作的重要组成部分。基于此,简单分析电梯检验检测工作要点,并深入探讨电梯检验检测现场安全管理策略,具体涉及明确测试内容、做好相关监督、聚焦定期检验、严格落实工作计划、突出检验工作重点、强化单位之间合作,以供参考。
期刊
<正>在我国公募REITs试点取得初步成功的基础上,进一步优化公募REITs相关制度及配套体系,增强基金管理人专业能力,充分调动各行业领先企业参与公募REITs积极性,有助于实现我国公募REITs行稳致远。不动产投资信托基金(Real Estate Investment Trusts,简称“REITs”),是一种以发行收益凭证的方式汇集特定多数投资者的资金,由专门投资机构进行不动产投资经营管理,并
期刊
随着社会的不断发展,各建筑结构都在搭载各种各样的便民设施,其中电梯的问世有效解决高层住户上楼难的问题,使得群众生活质量大幅提升,因此可以建造更高楼层的建筑,合理利用土地资源。随着电梯运行高度的不断提升,其安全性和稳定性越来越重要,一旦达不到预期标准,很容易出现严重的伤亡事故。对此,本文通过分析电梯检验过程中常见的问题,明确提升检验质量的策略,以期提升电梯设备的实用性,为未来行业发展保驾护航。
期刊
<正>小学科学教育是普及生活科学知识,培养学生科学素养的先导课程。但是小学生的科学观念尚未树立,知识的接受程度差,对于科学知识缺少横向性认识。跨学科的大单元教学,以学科贯通融合的重要教学方式,为小学科学教育提供有效的教学模式和途径。
期刊
随着我国社会经济体系的快速发展,高层建筑数量与规模连年攀升,在此影响下,人们对电梯的依赖程度不断加深,电梯已成为人们日常生活工作的重要辅助工具。因此,电梯运行质量更是直接影响人们生活质量与安全。为提高电梯系统运行可靠性与高效性,电梯系统的检验工作逐步走向正轨,各类先进技术手段的融合更是让电梯检验管理变得更为有效,但很多电梯在使用时依旧存在机房与设备之间的连通故障、制动器部件问题等。在本文中,笔者将
期刊
随着互联网飞速发展,微博等社交媒体也迅速成长起来,与此同时,微博平台上网络水军也越来越多。为了能够识别水军,还网络世界一个清净之地,本文针对Twitter平台,利用3个不同数据集以及Scikit-Learn库中3种分类算法进行实验,实验采用相关性检验方法比较不同特征集差异,得出提高分类效果准确率的有效特征,并通过不同机器学习算法训练数据集,得出最优算法。本实验在Twitter真实数据集下进行,实验
期刊
目的总结22例婴儿重症百日咳的护理方法。方法通过回顾性分析的方法分析22例婴儿重症百日咳的护理评估、症状识别、营养支持、药物护理、预防接种指导等方面的综合护理方法。结果经过积极治疗与护理,22例患儿均康复出院。结论儿童百日咳多是家庭内传播发病,且发病年龄低、症状重、并发症多、治疗时间长,通过综合的治疗和护理,可以康复。同时建议通过提高育龄妇女的相关疫苗接种率,可控制成人感染率,从而降低婴儿百日咳的
会议