基于深度学习的点击率预测模型研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:senfa88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网时代的到来,对人们的生活方式和思维观念产生了颠覆式的影响。同时也使传统行业发生了巨大的改变。计算广告因其得天独厚的优势,成为广告主要的投放模式,和传统的媒介不同,计算广告采用大数据和机器学习的相关技术,实现广告的精准投放,达到千人千面的个性化推荐效果。计算广告领域的核心问题是准确地预测用户对待预测商品的点击率,一个性能优秀的点击率预估模型不仅能为商家和平台增加收益,同时也能改善用户的体验。早期的点击率预测算法受计算能力的限制,一般采用结构较为简单的传统机器学习算法,需要复杂的人工特征工程以获得更好的效果。近年来,随着硬件计算能力的不断提高,深度学习因其对数据强大的拟合能力,在诸如图像识别,自然语言处理等领域大放异彩。国内外各大互联网公司和一些研究机构也在探索将深度学习应用到点击率预测领域,并取得了一系列优秀的成果。本文对点击率预测领域的一些经典模型进行了分析总结,梳理了它们的设计思路和优点,并着重分析了双塔模型在点击率预测领域的应用。其次,本文分析了当前的点击率预测模型在挖掘用户潜在的兴趣偏好信息方面的缺陷和不足,特别是在用户历史行为信息的利用上,往往忽视了行为的时序特征,而这是预测结果有不可忽视的影响。在此背景下,本文借鉴了用于处理序列特征的相关算法,同时对实际的应用场景进行了分析,设计了两个处理用户的行为序列信息的子网络BSN,用于挖掘用户行为背后的兴趣信息以及兴趣和待预测商品之间的关联关系,并将其融合到双塔模型中,得到了新的点击率预测算法,分别命名为RBSN-FM和ABSN-FM。本文的主要工作和创新点如下:(1)在循环神经网络的基础上,设计了一个用于挖掘用户兴趣偏好信息的子网络RBSN,它包含了兴趣提取层和局部激活单元,其中,兴趣提取层采用循环神经网络,负责从用户的行为中提取兴趣信息;局部激活单元用于计算兴趣信息的权重,权重代表兴趣同候选商品的关联关系。(2)调研了Transformer模型在处理序列信息中的出色表现,在它的基础上,提出了一个基于注意力机制的子网络ABSN,负责挖掘用户的行为偏好信息,它由两个包含Multi-Head Attention结构的部分组成,分别负责捕获用户行为背后的兴趣偏好和兴趣偏好同目标商品之间的联系。(3)为了验证本文提出模型的有效性,本文在淘宝的展示广告数据集和华为2020年DIGIX全球校园AI算法精英大赛的广告CTR预测数据集上与基础模型的进行了对比实验。同时选择了AUC和Logloss两个指标作为模型性能的衡量指标。实验结果表明,本文提出的点击率预测模型在预测性能上较基准模型有更好的表现。
其他文献
随着我国油气资源开发的不断深入,井筒完整性问题层出不穷导致减产甚至严重事故发生。目前单一的探测方法,难以对井筒完整性多个所需的探测目标做出精准的评价。采用声波探测方法和瞬变电磁探测方法分别对测取水泥环状态与套管信息,可为井筒完整性评价提供重要依据。为了提高测井效率,单次下井就可以获取多个目标的探测信息,设计了声波电磁复合式的井筒完整性检测系统。首先基于瞬变电磁法探测原理和声波法水泥胶结质量检测原理
学位
增量学习是人工智能领域的重要研究方向之一,旨在让模型在不重复学习先前数据的情况下持续学习多个任务。随着人工智能技术的快速发展,增量学习逐渐成为智能算法应用在实际场景中的驱动力,引起工业界和学术界的广泛关注。虽然增量学习已经取得了长足进步,智能算法能够以较小的计算和内存代价持续学习多个任务并取得较好的结果,但在实际场景的应用方面仍然面临诸多需要解决的理论问题和关键技术,如增量学习中固有的灾难性遗忘问
学位
随着社交网络的逐步兴起,随着多媒体技术的高速发展,图像已经成为日常生活中人们表达自我和理解他人的重要媒介。目前,大多数计算机视觉任务都集中在教会机器像人类一样“看”,很少关注机器如何才能像人类一样“感受”,而认识人类情感是通向强人工智能的必经之路。由此,图像情感分析应运而生,主要目的是理解人类对不同视觉信息产生的情感体验。作为计算机视觉领域的重要课题,图像情感分析的进展将会推动相关领域的研究(如图
学位
近年来,我国加大了对高污染企业的整顿,“十四五”规划中专门提出了4.6亿吨焦化产能清洁生产改造工程计划。K焦化公司近几年在环保方面加大了整改力度,环境成本逐年上涨,但公司目前仍未将环境成本单独核算,且环境成本的确认范围不全面,不利于为管理层提供详细的环境决策信息。在K焦化公司的环境成本核算中引入MFCA,可以将环境成本核算与生产过程紧密联系,单独核算环境成本,推进公司的清洁生产改革。本文基于环境成
学位
目的 构建首个认知域信息传播的动力学理论模型以推动认知域信息攻防的体系建立,并利用仿真数学模型进行概念验证。方法 在理论构念上提出认知域信息传播的核心-易感-感染-康复传播动力学模型(Hub-Susceptible-Infected-Recovery, HSIR),基于龙格-库塔法的非线性积分方程进行模型仿真验证。结果 标准HSIR模型的仿真结果显示,认知域信息在1万人的群体中传播,将在第46天达
期刊
在碳减排的大环境下,大力发展再生能源对实现“双碳”目标具有十分重要的意义,而再生能源最大的消费主力之一就是电动汽车。电动汽车的核心之一是电池管理系统(Battery Management System,BMS),BMS主要的作用就是实时监控汽车的行驶状态,但目前BMS仍有不足,存在精度低、体积大等问题。由于锂电池估测系统对汽车行驶安全至关重要,因此开发了精度更高、体积更小的锂电池估测系统。论文研究
学位
随着计算机与互联网技术的深入发展,人类生活与互联网的结合愈发紧密。在这一态势下,计算机和互联网系统的安全性对于人类生活生产的稳定运行极其重要。然而自计算机软件诞生以来,代码漏洞就在影响着软件和系统的安全稳定。如何在软件开发和编译阶段就对代码漏洞进行检测,是软件技术发展中的关键环节。Go语言是一种兼具python的快捷开发特性和C语言的高性能和高安全性等特征的语言。Go语言的使用过程中同样有代码漏洞
学位
对于监控场景来说,摄像机的运动、环境光照等因素的变化相对可控,而物体剧烈运动是引起模糊核突变的主要原因。传统动态场景去模糊的方法都基于相邻帧之间的位移较小,适用于处理平滑变化的模糊核。而动态场景中通常包含多个运动物体,很容易发生模糊核突变的情况,在由粗到精的框架内传播时,模糊核突变会导致重构误差。本文针对双向光流去模糊方法中存在的微小结构重构失误导致伪影的现象,提出了一种对多尺度金字塔进行分层处理
学位
针对当前基于知识图谱的推荐模型没有充分挖掘知识图谱语义结构信息的问题,提出一种融合知识图谱表示学习方法和信息协同传播机制的推荐模型KCOD。KCOD基于经典的知识图谱表示学习模型DistMult与TransR建模并推理实体三元组的语义关系,然后通过交叉计算每一阶历史交互实体向量推理结果与候选物品实体向量推理结果的相似度,进行模型训练及偏好预测。实验结果显示KCOD的性能优于经典对比模型。
期刊
社交平台信息发布和获取的便捷性,方便了人们的沟通交流,但是也给谣言的产生和传播提供了肥沃的土壤。谣言一般产生于人们普遍关注的热点领域,极易引发各类不安定事件,影响社会和谐稳定。建立谣言传播模型,探究谣言传播影响因素,有助于治理谣言。现有的研究很少考虑到空间因素对谣言传播的影响、初始传播者不同的影响力以及通过优化网络结构治理谣言问题。借助分形理论,可以使谣言传播模型的研究更加完善。本文利用分形理论的
学位