基于深度学习的网络广告点击率预测模型研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:ayong790401
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络广告是互联网行业的主要经济来源之一,随着机器学习和互联网的发展,海量广告信息的有效利用,极大地增加了网络广告的商业价值。在数据时代,广告点击率预测作为广告投放系统的核心技术之一,主要研究海量数据下用户与广告的潜在联系,实现广告的精准投放。在广告点击率预测中,数据集通常高度稀疏,传统的方法多基于线性模型,特征之间相互独立,依赖人工特征组合。而自动组合特征的模型又缺乏深层次的高阶非线性特征,并且普通的深度学习模型仍然存在训练难度大,没有考虑到深浅特征融合等问题。本文研究的目标是对给定的数据通过深度学习模型挖掘用户-广告潜在的联系,从而实现更精准的广告点击率预测,具体研究工作如下:(1)本文针对现有模型存在的问题,提出了一种基于广度深度模型改进的栈式自编码因子分解机模型,本模型引入了基于字段的因子分解机和栈式自编码器来分别作为广度和深度部分。和广度部分的逻辑回归相比,因子分解机模块实现了浅层特征的自动组合,避免了大量的人工组合特征的问题。在深度部分,通过栈式自编码器无监督逐层预训练的方式提取了高阶非线性特征,并将训练好的嵌入层参数作为因子分解机模块的初始化权重,在一定程度上加快了模型的收敛速度。最后在模型整体训练时进行有选择性的微调,使模型高效地融合了浅层组合特征和深层高阶非线性特征。通过实验表明,在输入数据一致的情况下,该模型具有更好的预测效果。(2)本文分析了实验数据集的特点和问题,并进行了相应的数据预处理。在此基础上,本文从实际业务出发,构造了历史点击率特征。由于用户日志无法直接加入到训练中,本文按照行为类型和时间段两个方向从行为日志中构造出了用户行为特征。实验表明,这两组特征的加入可以明显提高预测的精度。(3)本文设计实验,分析并确定了栈式自编码器逐层预训练过程中的节点数与隐藏层深度,并对比了不同隐藏层微调层数以及不同超参数对模型效果的影响。最后,本文通过与基线模型的对比实验,验证了本文模型在收敛速度和预测效果上有较明显的提升。
其他文献
在暗浜地层内施工钻孔灌注桩时,易产生钻孔扩径、孔内塌方事故,产生"叉腿桩"及诱发搅拌桩次生"叉腿",造成钻孔灌注桩与搅拌桩之间的产生大的缝隙。基坑开挖时,基坑外侧的地下
对信用卡客户进行潜在风险识别对于银行的资金安全具有重要的意义。利用分类算法对客户进行分类是一种可行的解决方案。利用决策树、朴素贝叶斯、支持向量机等多种成熟的分类
在聚丙烯中试装置上进行催化剂和助剂配方的筛选以及聚合工艺的优化等研究,开发了聚丙烯瓶盖专用树脂YPJ-706,并在工业装置上生产出弯曲模量大于1.4 GPa,常温冲击强度大于或
本文提出了对原材料质量控制的理解和分析,提出了一般控制方法和要求,是对ISO9001系列标准的深化理解和实践。
本文采用正己烷溶剂进行索氏提取,用GC/MS测定导热硅胶中耦连剂的含量。该方法检出限(S/N=3)为0.01mg/kg,回收率为90%-105%,相对标准偏差为3%-10%,该方法简便、准确、灵敏度
在市政道路建设的过程中,旧路改造是非常重要的一个环节,其质量直接影响到了道路运行的能力,因此,在这一过程中,我们一定要对每一个重要的环节进行控制,只有这样,才能更好的
三.水貂暴涨有源头下面就谈一谈今年春世界貂皮市场的暴涨原由:春节后仅月余时间水貂皮收购价格就从去年末每张140元(公皮)上涨到300元的高价,现在太多人不明白为什么又是“一夜之
地理信息化教学是利用现代信息技术与信息资源,以现代地理教学媒体为媒介的一种现代化教学模式。它与研究性学习有着共同的追求,二者的整合顺应新课程改革的理念,也提高了学
在信息技术飞速发展的时代背景下,各式各样的新型教育教学模式不断涌现,如翻转课堂、微课、慕课、视频公开课等,网络成为了新时代的教育学习平台之一。这些线上教育的改革和
综述了国内外双组分纤维生产状况、发展趋势、加工应用以及生产聚乙烯/聚丙烯皮芯型纤维(ES纤维)所用的主要原料及原料来源。双组分纤维是差别化的纤维,可复合且不损坏纤维内