众包竞赛的离群点欺诈用户检测算法研究

来源 :统计与信息论坛 | 被引量 : 0次 | 上传用户:wjs9988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对基于众包竞赛中欺诈者筛除机制的黄金标准数据方法、聚类算法的离群点检测算法K means算法和DBSCAN算法,依赖于事先给定的参数,不适合大规模数据集检测的问题,提出基于样本连通图的离群点检测算法。首先,给定参数并重复调用离群点检测算法,识别数据中的离群点和聚类;其次,计算每两个样本之间的连接次数和连接强度,在给定连接强度下界δ的情况下,根据样本的连接强度来构造样本之间的连通图;最后,根据样本之间的连通情况,对样本进行标记,把样本标记为聚类节点和离群点。实验结果表明,该算法在放宽参数设置范围的情况下,
其他文献
进入20世纪90年代中后期以来,我国农民收入增长速度放慢,农民收入逐年下滑,严重影响了农村经济的发展。文章分析了农民增收难的原因,探讨增加农民收入的对策。
基于空间计量视角拓展门限随机前沿模型,从技术效率时变和非时变两个层面分别构建空间门限随机前沿模型。模型同时考虑了生产单元的异质性和空间相关性,适用性较佳。分别使用
工业化、城市化的推进对土地快速增长的需求和保护耕地、保障粮食安全是我国土地利用过程中面临的两难选择。我国当前的土地征用制度存在较多问题,使得地方政府对土地过度非农
根据1993—2016年中国地区层面城乡居民消费数据,测度并比较了消费增速放缓与消费不平等的福利效应。研究发现:第一,无论城镇地区还是农村地区,消费增速放缓与消费不平等均具
为21世纪培养什么样的人才,是当前高等教育面临的重要课题,体育教育对培养全面发展的高素质人才起着十分重要的作用,通过简要分析现行体育教育弊端,提出几点教育改革意见,特别是以
确定地基承载力是地基设计的重要问题,在规范法确定地基承载力基本值时常遇到实际指标与规范指标不相符、使用内插法又不方便的情况,通过对粉土地基承载力基本值与其主要影响