【摘 要】
:
随着互联网技术的快速发展,在线广告系统已成为各个互联网公司的重要收入来源。广告曝光预估是在线广告系统比较重要的一个环节,其为广告主提供未来的广告曝光效果参考,通过这个预估参考,广告主能避免盲目的优化尝试,降低试错成本。计算广告的难点在于首先数据量大且数据维度非常高,并且不同特征之间相关性很高。因此,如何快速处理高维数据以及自动做特征交互是解决问题的关键。在计算广告领域常用的深度学习模型基础上,提出
论文部分内容阅读
随着互联网技术的快速发展,在线广告系统已成为各个互联网公司的重要收入来源。广告曝光预估是在线广告系统比较重要的一个环节,其为广告主提供未来的广告曝光效果参考,通过这个预估参考,广告主能避免盲目的优化尝试,降低试错成本。计算广告的难点在于首先数据量大且数据维度非常高,并且不同特征之间相关性很高。因此,如何快速处理高维数据以及自动做特征交互是解决问题的关键。在计算广告领域常用的深度学习模型基础上,提出了一种新的神经网络结构。首先,针对计算广告数据特征高维稀疏、特征间高度交互等特点,引入融合因子分解机和注意力机制模块,以有效获取高纬度稀疏特征的低阶交互关系。将用户的曝光记录作为语料库使用Word2Vec方法做词嵌入,将训练后得到的向量直接输入深层网络部分。同时,在深层网络部分使用批标准化,加大网络层数,提高特征交互的阶数。改进模型的主要优点有三个。第一,考虑了不同组合特征重要性不同之后,引入了注意力机制为不同组合特征赋予不同的权值,提高了模型的表达能力。第二,使用批标准化,加深深层网络部分,引入高阶特征交互。第三,采用Word2Vec方法得到嵌入向量相比于直接使用,提高了模型的运算速度和效果。最后采用腾讯2019广告算法大赛数据,对改进模型和其他模型进行实验验证。实验结果表明,改进模型相比于Light GBM模型在均方误差指标上降低了3.7%,并且运算速度提高了54.1%。实验验证了改进模型的有效性和可行性。为了进一步提高模型的预估准确率,采用了一种基于模型融合的广告曝光预估方法。实验结果表明,模型融合的方法相较于改进模型在均方误差指标上下降了0.7%。
其他文献
基于活性位和复合结构对催化剂进行原子级可控的设计和制备是非常重要的。本文致力于通过区域选择性原子层沉积(ALD)方法实现复合催化剂的设计和改性,具体包括:基于晶面选择性与结合能差异,通过调整和优化区域选择性ALD工艺,开发了MnOx/Pd/Al2O3和FeOx/Ni/Al2O3两种不连续包覆的复合催化结构,并分别应用于苯甲醇选择性催化氧化和甲烷干重整反应。通过对两种催化剂的催化性能包括活性、选择性
随着社会生产模式的转变以及科学技术的发展,本质安全、与人共融成为新一代机械臂的发展趋势。本质安全意味着轻型、低速、柔顺的机械臂本体,而基于传统电机、液压的刚性关节驱动器存在功率密度比小、质量大、柔顺性差、安全性低等缺点,基于人工肌肉的柔性关节驱动器具有功率密度比大、质量轻、柔顺性好、安全性高以及高效模拟人体骨骼肌的收缩运动等优点;与人共融意味着机械臂与人处于同一工作空间,在确保人的安全情况下自主完
句法分析作为自然语言处理中的重点与难点问题,一直广受关注。而组块分析作为浅层句法分析的重要一环,降低了完全句法分析的任务难度。组块分析系统主要是识别句子中的组块信息并对其分类。组块信息可作为中间产物应用到自然语言处理的诸多领域,比如信息检索、信息提取、文本分类、语音识别等等。随着人工智能地普及,深度学习技术已在诸多领域取得丰硕的成果。当然,自然语言处理也是深度学习的用武之地。基于循环神经网络(RN
马铃薯产业在我国保障粮食安全和增加农民收入方面有着重要的战略地位,但无性繁殖的马铃薯受到多种病毒的危害,严重影响块茎的产量和品质。培育抗病毒的品种是最为经济有效的方法,但是能够感染马铃薯的病毒种类繁多,而且马铃薯复杂的倍性导致常规育种进程缓慢。基于CRISPR的高效率基因编辑技术不仅成功应用于基因表达调控、染色体定位中,也被用于抵御多种作物的DNA和RNA。本研究基于病毒序列的保守性,设计了靶向几
在深度学习图像预处理的问题中,某些应用场景下图像数据的方向和视角可能对预测结果产生影响,杂乱的背景也可能造成干扰,例如对书法练习作业的图片进行自动点评的场景中。这种情况下在数据集预处理的过程中,对用户拍摄上传的图片进行视角优化工作,对后续的训练、识别以及其他图片用途可能有着不可忽视的作用。依据在线教育平台的书法作业智能点评系统对作业图像视角和背景进行优化的开发需求,采用open CV和Tensor
随着近年来电子商务的迅猛发展,各大电商平台不断崛起,以营促销活动为主要手段的价格战也在各大电商间频频上演。销量预测是这一系列营促销活动的源头和必要环节,是维系整个供应链系统的重要节点,也是管理者进行计划、采购、仓储、营销等活动的重要依据。当前部分企业将营促销活动的重点放在活动模式的创新上,仅使用简单的统计学习模型或机器学习模型进行销量预测,没有充分考虑消费者行为和营促销特点,导致预测与实际有较大的
在大数据背景下,安全多方计算解决了多源数据分析与融合过程中数据各方拥有者的隐私性问题。同时,在数据被充分利用的前提下,安全多方计算保证了数据的加密性与隐私性。理性安全多方计算扩展了传统的安全多方计算,是博弈论与安全多方计算融合的产物。引入理性参与者使得安全多方计算模型更加符合现实意义和实际应用,通过效用函数的分析保障了计算结果的可靠性。本论文结合信息论、博弈论和安全通论,对安全多方计算中参与者行为
近年来中国基建行业对“一带一路”沿线直接投资的项目规模、涉及的国家及行业不断扩大。但与此同时,中国基建行业在沿线国家投资时因遭遇政治风险而导致项目被叫停甚至取消的现象也时有发生。由于政治风险具有复合性与不可预测性,一旦发生对基建投资项目的负面影响极大且损失可挽回余地小。在此基建行业投资背景下,本文展开对中国基建行业在“一带一路”沿线国家直接投资面临的政治风险研究。首先,本文对政治风险、“一带一路”
随着多媒体技术及互联网技术的发展和普及,线上数字化娱乐已经迅速融入了人们的生活中,技术深深地改变了数字娱乐产品的生产方式与人们的消费娱乐模式。于此同时,数字化娱乐产品的生产方式与新的消费模式的形成,极大提高了数字化娱乐产品的生产效率,各种影音娱乐产品呈现爆发式增长的趋势。面对庞大的信息海洋,如何利用新技术智能地为人们选择适合自己的包括娱乐产品在内的各种产品成为现实的需求。在这种时代背景下,推荐系统
滚动轴承作为主轴旋转的核心与支撑部件,通常工作在交变载荷、高温和重载等工况下,这使得它成为旋转机械最容易失效的部件之一。因此,对滚动轴承进行状态监测和故障诊断是保障设备正常工作的关键。包络分析是滚动轴承故障诊断中使用最多且成熟的方法,但是其中关键性的步骤—解调频带的选择依旧存在问题,容易受到无关噪声干扰而选择错误频带导致诊断效果不佳。因而,本文以滚动轴承振动信号作为研究对象,将多噪声干扰下滚动轴承