基于交叉验证网格寻优随机森林的黑产用户识别方法

来源 :科技视界 | 被引量 : 0次 | 上传用户:fresco_xp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的普及,黑色产业成为了一种新的违法途径。黑色产业的猖獗不仅损害了社会利益,同时也影响了正常用户的体验。本文提出了一种基于交叉验证网格寻优随机森林算法的区分黑色产业用户的方法。本文收集的黑产用户数据为某论坛的恶意刷违法消息的用户数据。利用随机森林机器学习数据特征,通过交叉验证以及网格搜索技术完成模型参数寻优,得到训练好的模型。并且比较了其他常见的几种分类算法在识别黑产用户的准确率。线上和线下实验表明,基于随机森林算法的模型在预测区分黑色产业用户上相比较于其他几种算法准确率更高,表现更为稳定。为
其他文献
保证金质押作为低风险担保方式之一,受到商业银行广泛使用。但近年来,商业银行信贷业务保证金被有权机关强行扣划,致使信贷资金陷入"脱保"的事件时有发生。本文分析了保证金
实现土地适度规模经营是我国当前农业发展的重大问题之一。根据我国30年来人地关系变迁的历史和未来人口城市化高峰期农村人地关系发展的初步展望,并借鉴日本、韩国的历史,提
目前对滑动轴承在理论上的研究比较多,但理论与实践结合的效果不是很理想,导致工厂中的工程技术人员实际经验较成熟,理论知识相当贫乏的现状。 以流体动压润滑理论为指导,结合
以环氧氯丙烷为交联剂,合成了不溶于水的β-环糊精交联聚合物,用于去除微污染水中的氯苯。通过静态实验考察了时间、pH值和温度对β-环糊精交联聚合物去除氯苯的影响,通过动
课堂口令,是语文课堂中必不可少的一种有效管理、调控课堂的手段。小学一年级学生刚刚步入一个新环境,注意力不易集中,自由散漫,严重缺乏纪律感,教师需要教导他们向有纪律的
本文主要对于轨道交通系统的节能减排应用问题进行探讨,在分析轨道交通各相关系统的能耗特点基础上,重点探讨了相关的节能对策与技术,并结合地铁的实际情况,介绍各类节能技术
汉唐多言"五礼"(吉、凶、宾、军、嘉),宋明多言"四礼"(冠、昏、丧、祭)。宋代是"四礼"形成的关键阶段,四礼之学的理论基础、内容框架、思想内涵都于此时奠定。本文以儒学复兴
历书在过去又称为“通书”、“宪书”,是一种古老的书籍门类,经过一千多年的发展,现代历书已演变出多种形式,例如国内市场上比较常见的日历、月历、年历、台历、怀历、挂历、
期刊
1944—1945年间,随着战争的持续进行,围绕地方财政权的争夺和地方武装力量的统辖问题,余汉谋的第七战区和李汉魂的广东省政府之间持续杯葛,军政对立日趋严重,并最终以李汉魂