基于深度学习的搜索广告点击率预测方法研究

被引量 : 0次 | 上传用户:maryren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的飞速发展,海量数据背景下的网络营销方式越来越受青睐。在线广告作为新的广告形式应运而生,展现出了巨大的市场潜力和商业价值,搜索广告是规模最大,增长最快的在线广告形式,它根据用户搜索的内容投放相关的广告,如今已经成为互联网行业的主要收入来源之一。搜索广告背后最为关键的技术是广告点击率的预测,它不但关系到广告投放的排名,也影响着广告点击的收费。因此,如何有效的利用海量历史数据对搜索广告的点击率进行预测是一项非常有意义的工作。目前已有的工作大多基于浅层模型进行搜索广告的点击率预测,浅层模型在特征学习方面是直接使用统计学习方法计算得到的特征,特征中每一维的含义固定并且孤立,不能表达内部之间的关系。本文研究的目标是通过给定的信息预测搜索广告的点击率,通过使用深度学习模型,挖掘更多的特征之间的关系,从而能更有效的提高预测的结果。具体地,本文主要包含如下三方面的研究内容。第一、本文从搜索广告点击率预测的定义出发,分析了数据集的数据的分布和特点并对数据集进行了预处理,在此基础上,本文根据对搜索广告的认识和在实际应用中的特性,提取了六类不同的特征。其次,针对深度学习在搜索广告点击率预测应用中的训练耗时和内存限制,本文设计了一种基于GPU计算的分块实现方案。第二、本文首先使用了朴素贝叶斯模型、逻辑斯蒂回归模型和支持向量回归模型等主流方法对点击率进行预测,并分析了他们的不足。进而使用基于深度神经网络模型的搜索广告点击率预测的方法,我们使用dropout方法来降低在训练时过拟合造成的影响。实验结果表明,在特征相同的情况下,本文使用的深度神经网络模型方法能取得比主流方法更好的预测结果。第三、本文提出了面向搜索广告点击率预测的卷积神经网络模型,通过基于局部窗口概念的卷积操作和亚采样操作,完成了从局部到整体的特征学习。在KDD Cup 2012中Track 2数据集上的实验结果表明,本文所使用的基于卷积神经网络的搜索广告点击率预测的方法能有效的提高点击率预测的结果。
其他文献
目前国际上主要通过回购、外交以及司法途径三种方式追索流失海外的文物,其中回购费时费财,并且客观上会抬高文物价格;而外交途径会受国家力量对比和国际交往的影响。司法追
注册资本制度是公司法的核心制度,是公司资本形成的关键环节。可以说公司注册资本制度直接影响着商事活动的开展。建立完善的注册资本及相关制度,对平衡股东和债权人利益、鼓
<正>作为一种新的业务模式,直销银行需要展现其与传统银行业务不同的特点,真正创造出增量价值。文/本刊记者章蔓菁在被称为互联网金融元年的2013年,北京银行和民生银行先后宣
<正>保持客户及产品的简单化以及强化营销,是ING Direct致胜的关键,值得国内银行和互联网企业学习。ING Direct是ING集团(荷兰国际集团)的全资直销子银行,也是全球最大的直销
伺服控制,也叫做跟随控制,是让控制对象可以跟随指令运动的一类控制系统,现在伺服控制广泛应用于各个领域,伺服控制被越来与广泛的使用,其被广泛研究同时得益于伺服电机等伺
<正>一、关于《一竹斋图》卷《一竹斋图》卷上的落款是"甲子春正月",即为康熙二十三年二月(1684年),是恽寿平51岁时,于他人生中最后的一个十年岁月初始时,为他的好友一竹斋主
在催化反应工程中,改进常规多相反应器(如淤浆鼓泡床、滴流床反应器等)的性能具有重要意义。新型的整体式结构化催化反应器具有低压降、高传质速率和容易放大等优点,成为替代
<正> "正泰"是一家专业电器制造公司,它为您创造一流的电器设备,也为您提供至善的服务。"正泰"也是一个年轻而富有朝气的学习型组织,具有崇尚科学,坚持创新和终身学习的传统,
目的:了解山东省定向医学生专业认同的差异性及影响因素,为提高定向医学生专业认同度,为学校完善培养方案和更好培养基层医疗卫生人才提供理论依据。方法:采用普查方式对山东
<正>作为次级债券的重要设计、发行和交易者,银子银行系统是次贷危机的催化剂和放大器。2007年,美国太平洋投资管理公司(PIMCO)执行董事麦卡利(PaulMcCauley)第一次提出了影