面向移动广告的欺诈检测算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:SunwithKing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于移动终端设备的广告推广是当今最重要的广告营销途径之一。除了移动端浏览器的网站外,移动设备中的应用软件也是移动广告的重要载体。为广告主提供广告栏位和用户流量,是许多移动应用的重要收入来源。然而为了获取更多利润,一些移动应用会通过伪造虚假用户流量来骗取更多的广告收入,从而对广告主的广告推广资金造成重大损失。如何识别虚假欺诈流量,是广告主和广告平台必须面对的重要挑战。传统的移动广告欺诈检测方案主要依赖数据研究员制定的人工规则。随着欺诈设备和欺诈手段的不断更新换代,原有的人工规则已经越来越难以区分出欺诈性的用户流量。因此本文针对移动广告场景的欺诈检测问题,提出了一种使用多种机器学习算法相结合的移动广告欺诈检测方案。该方案的主要创新工作如下:(1)针对欺诈检测场景中条件判别规则具有较高识别率,以及该场景存在大量稀疏类别型特征的特点,本文分别构造了GBDT模型和神经网络模型,通过将两种不同侧重的单模型进行组合的方式,提高方案的综合检测效果。(2)针对该场景存在大量无历史数据的新用户,以及用户与媒体的关系网络能反应出新用户的欺诈性偏向的特点,本文引入了图嵌入技术构建用户的关系向量。同时为了使下游检测模型能充分挖掘图嵌入向量中的用户关系信息,本文结合wide&deep神经网络模型擅长挖掘稀疏类别型特征的特点,提出了一种支持嵌入向量输入的改进模型Emb Deep Fm。实验表明,结合了图嵌入向量信息的神经网络模型能有效提高对无历史数据的新用户的欺诈检测能力。(3)针对GBDT模型和神经网络模型擅长预测不同特征分布的样本的特点,本文提出了一种基于差异分组融合的集成学习结合策略DG-Blending,充分利用了两个模型能力的差异性。经实验对比,新模型结合策略比现有结合策略的融合效果有明显的提升。实验结果表明,本文提出的移动广告欺诈检测方案在AUC指标下具有非常突出的欺诈检测效果,能很好的识别复杂模式的广告点击欺诈行为,为机器学习算法在移动广告欺诈检测领域的应用提供了一种可行的解决方案。
其他文献
本文将研究信用衍生产品CDO分层中脱离点和附着点的最优化问题。在以往对CDO的学术研究中,大部分的研究精力都集中在了CDO分券的定价上。在CDO产品的分层结构上,几乎清一色地
近些年来,随着深度学习概念的引入和与之相关的各种计算平台的不断涌现,使得其在图像、语音和自然语言处理中得到广泛的应用,并呈现出它的独特强大优势,而且这种应用还在继续
脑胶质瘤是中枢神经系统最常见的脑部恶性肿瘤,具有发病率高、复发率高、死亡率高、致残率高和治愈率低的特点,术前对脑胶质瘤精准诊断成为挽救患者生命的重要前提。影像组学
众所周知,用条件分位数来拟合数据时,有一些非常好的特性,比如在碰到重尾数据或则离异数据时,条件分位数都表现得非常稳健,尤其是条件中位数.因此对条件分位数的研究一直以来都是数理统计中的热点问题.以往对条件分位数的研究往往是在完整数据下进行的,但是在现实生活中,我们遇到的数据常常不是完整数据.删失数据是一种我们实际应用中经常遇到的一类数据,删失数据分为删失指标随机缺失数据和删失指标完全随机缺失两种,其
用户行为识别研究过程中,用户行为数据是课题研究的重要基石,传统的人工收集数据方式存在误差较大、效率低下等问题。随着物联网技术、通信技术和智能移动设备的飞速发展,推
硫化矿物(水溶性硫化物、固相硫化矿物)在表生环境中含量高、分布广泛,其在开放环境中氧化导致土壤酸化和重金属离子释放,威胁环境和人类健康。锰氧化物作为土壤与沉积物中重要
时距知觉指对客观事件持续性的知觉,包括对某一事件持续时间的知觉,也包括对两个相继事件时间间隔的知觉。以往研究发现个体对呈现在临近扫视时的视觉刺激时间间隔的知觉往往表现出低估(即时距压缩现象),但对扫视时听觉刺激的时距知觉却能够保持真实。虽然不少研究在注视与扫视条件下已经证实了视听跨通道的时间“腹语术”效应的存在,即无关的听觉刺激能够“捕捉”视觉刺激的呈现时间从而使被试对视觉刺激的时间知觉发生偏转,
21世纪以来,中国面临着老龄化进程加快、劳动年龄人口不足、人口发展不平衡等一系列人口结构性问题,为实现人口良性稳定发展,2013年十八届三中全会提出“单独二孩”政策,紧接
从1990年以来,我国的汽车行业销量经历了爆发式的高速增长的历程,汽车已从当年遥不可及的奢侈品变为当前家家户户都可拥有并不可缺少的日常代步工具,我国也从建国初期的零基
2016年6月23日,英国全民公投选择脱离欧盟,对全球金融市场产生了巨大影响。本文主要研究2017年后脱欧相关事件对于欧元兑英镑价格的影响,对价格序列进行分阶段的定性分析,并