在线广告中高层特征表示及点击率预测方法研究

被引量 : 0次 | 上传用户:fgdWE4RTTY
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着广告行业的不断发展和壮大,广告收入也逐渐成为很多公司的主要经济来源。为了更好的优化广告投放效果从而获得更大的利益,弥补传统广告的一些不足,在线广告行业迅速兴起,采用计算的方式来提高广告的投放效率。目前,比较重要的两类在线广告分别是搜索广告(Sponsored Search Advertising)和实时竞价广告(Real-timeBidding),在大数据和计算广告学相交融的背景下,这两类广告也越来越成为人们的研究热点,而这一热点中最核心的一个问题就是广告点击率(Click-throughRate)的预测。因此,如何的利用从复杂的广告日志中更准确的预测广告的点击率也成为了一项极为重要的工作。本文以更准确的预测搜索广告和实时竞价广告的点击率为目标,在基本特征的基础上通过深度网络获取高层特征,然后结合基本特征与高层特征来准确地预测点击率。具体的,主要包含以下几个研究方面:首先,本文分析了广告日志字段中的含义以及一些数据集处理的相关工作,介绍了在点击率预测问题上常用的评价指标。在这基础之上,利用主题模型、相似度算法以及一些统计信息提取了用于计算点击率的一些基本特征,主要有:各类ID类型特征、历史点击率特征、相似度特征、兴趣属性特征和一些映射数值特征。并对特征的有效性进行了分析。其次,本文利用朴素贝叶斯模型和支持向量回归模型对广告点击率进行了预测,基于这两个模型的各自的特点,选取类别属性特征放入朴素贝叶斯模型中进行预测,选取历史信息和兴趣行为特征放入支持向量回归模型中进行预测。之后根据预测结果选取了更具表现力的特征作为后续研究的基础。在此基础之上考虑到单一模型的局限性以及在不同特征集上的表现结果,提出了采用模型融合的方法对广告点击率进行预测。最后,由于浅层的基本特征的表现力有限,不能很好的挖掘彼此之间的相互关系和潜在因素,所以在分析了这些特点之后,提出了一种基于深度网络的高层特征表示和点击率预测方法。针对前几节中提取出的有效的基本特征按照这些特征的不同表现特点采用不同结构的深度网络学习得到高层特征,之后把高层特征和一些基本特征进行组合,再采用逻辑斯蒂回归模型和支持向量回归模型进行点击率预测。在搜索广告数据集和实时竞价广告数据集的实验中表明,这种高层特征能很好的提高点击率预测的准确度,也很好的表明了点击率预测方法的有效性。
其他文献
随着三维激光扫描仪技术的不断发展,三维激光扫描仪在文物保护、3D打印、3D游戏、医学成像、逆向工程等领域得到了广泛的应用。当前,三维重建技术仍然是计算机视觉领域的研究热
目的总结腹腔穿刺冲洗引流治疗阑尾周围脓肿的效果。方法回顾性分析了本院收治的1例阑尾周围脓肿的患者,患者年龄较大不易行手术治疗,入院后在彩超定位局麻下行冲洗引流管放
目的:本研究旨在通过现况调查及时掌握社区老年人慢性病与生活方式的流行病学现状,分析社区老年人慢性病与生活方式的关系。在此基础上进行病例对照研究,探讨老年人常见心脑血管
银行卡作为20世纪最具创新力的金融服务产品,融合了现代信息技术与传统金融业务,成为日常支付中不可或缺的重要工具,扮演着促进社会消费和活跃金融信贷活动的重要角色,银行卡产业
21世纪以来,我国高等教育规模迅速扩张,逐步实现了由“精英教育”向“大众化教育”的转变。随着“大众化教育”时代的来临,当代大学生的考风败坏现象层出不穷,考风作弊问题屡禁不
论述在初中生物学实验教学中,教师如何针对实验教学中经常出现的各种错误,采取不同的纠错方法,帮助学生学会分析错误的原因,通过综合使用实验纠错法、观察纠错法、示范纠错法、比
永磁同步电机具有结构简单、体积小、效率高和运行可靠等诸多优点在数控机床、航空航天和机器人研究等领域得到了广泛应用。然而永磁同步电机是一个强耦合、多变量、非线性的
在专业工程领域,机械设备经常采用永磁同步电机作为驱动源以提供动力,永磁同步电机的性能则将直接影响到这些装置的驱动稳定性。而由于专业设备使用环境的复杂性和特殊性,对于电
随着社会的发展,教育在社会中的作用也越来越明显,教育基本已经成为我们每个人生活中的一部分。教育的每个阶段都需要得到重视,我国的高等教育在不断发展的同时,需要对其发展的不
在2003之后,房地产业已经发展为涉及土地、建设、交易和金融服务等多部门的重要产业,与此同时房地产市场的波动对国民经济的影响也越来越显著。政府为了防止房地产市场波动对宏