基于注意力机制的文本搜索点击率预估模型

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zhangyi89521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
点击率预估是推荐系统、搜索等应用场景中的核心问题,也是互联网广告投放效果的重要指标。现代互联网广告主要分为搜索广告和展示广告,其中搜索广告是规模最大的广告形式。以搜索场景为例,用户搜索关键词寻找目标,广告平台通过获取具有商业价值的关键词,结合点击率预估结果展现用户最可能点击的广告。因此良好点击率预估模型既可以带来好的用户体验,也能让广告平台达到收益最大化。
  通过研究近年来基于深度学习的点击率预估模型,发现现今存在的很多点击率预估模型在挖掘特征之间的交叉关系上存在不足,对特征重用度不高。基于此,结合词嵌入和注意力机制,设计了一种基于自注意力机制的深度卷积网络,通过设计重用层和深度卷积网络的方式解决这两个问题。主要研究工作如下:
  首先在历史搜索数据集上进行特征构建,将文本特征转换成数值特征,结合XGBoost模型记忆能力强和DeepAFM模型泛化能力强的优点,将两个模型进行融合,并得到点击率预估模型。融合模型没有考虑到上下文信息,忽视了词语与词语之间的依赖关系,基于此,结合词嵌入,设计了一个基于层级注意力机制的点击率预估模型,在模型中使用了双层双向GRU网络结构,并对每一层都使用了注意力机制,增强模型在时间序列上的抽象能力和语义提取能力。在层级注意力模型基础上进一步优化,设计了一种能充分挖掘语义向量在不同维度上关系的点击率预估模型——基于自注意力机制的深度卷积网络(Self-Attention-Based Deep Convolution Network,SDCN)。
  以AUC和准确率为评价指标,在三个模型基础上进行对比实验。从实验结果看,SDCN模型的AUC达到0.8477,相比于其他对照模型,AUC有0.63%-2.14%的提升,准确率有0.75%-2.06%的提升。在模型子结构的有效性验证上,融合模型中子模型、层级注意力模型中两层注意力结构以及SDCN模型中重用层、外积、卷积对模型均有促进作用。以SDCN模型为例,外积运算对模型促进作用最大,卷积计算本质上是注意力机制的一种形式,对模型依然具有促进作用。
其他文献
【摘要】由于长期以来,高考绑架了日常教学,现在的高中语文课着实令老师尴尬,令学生沮丧。具体来说,老师教的学生不想学,学生学的测试偏不考,考试出的学生都没见。学生对语文课只有厌倦和反感,老师对语文课只有无奈和叹息。这一切都是由于语文课的教、学与考的严重脱节,都是高考语文以及等而下之的各种语文考试惹得祸。要改变这一切,就得从根本上捋清语文学习的根本目标。在我看来,基础教育阶段,语文的根本目标就两个:读
期刊
【摘要】当前作文评价的相对滞后,已经成为制约作文教学的瓶颈。有效的评价是激发学生的作文兴趣的一条有效途径。针对当前的评价问题,主要对策有:(1)评价要体现激励性,(2)评价要体现新趋势,(3)评价内容要综合化,(4)评价方式要多样化,(5)评价主体要多元化。  【关键词】作文 教学 评价  【中图分类号】G633.3 【文献标识码】A 【文章编号】2095-3089(2014)09-0094-01
期刊
【摘要】说起歌剧作曲家,大家首先想到的是威尔第,跟威尔第同年出生的德国作曲家瓦格纳声誉虽比不上威尔第,但在歌剧的改革以及对后世的影响上,他的成就绝对是举世无双的。本文对歌剧创作的一代宗师——瓦格纳的生平以及艺术成就等方面进行详细的阐述。  【关键词】瓦格纳 歌剧改革 戏剧 主导动机 无终旋律 半音化和声  【中图分类号】J832 【文献标识码】A 【文章编号】2095-3089(2014)09-0
期刊
【摘要】语文课有效的阅读教学,就是在引导学生学习运用语言的同时,教会学生认识生活,思考人生,提升品性,净化心灵。从而达到“教”作文,就是教做人的教学目的。这也正是新教材所倡导的大语文观。  【关键词】阅读、教法、诵读、联想想象 创意  【中图分类号】G633.3 【文献标识码】A 【文章编号】2095-3089(2014)09-0101-01  新课程以全新的教育理念冲击着每位语文教师。阅读课究竟
期刊
【中图分类号】G623.2 【文献标识码】A 【文章编号】2095-3089(2014)09-0095-01  从教三十来年,一直从事小学班主任的教学工作,虽不能说有什么经验之谈,但还是有一些切身的体会,今天写出来和教育同行们探讨。从多年的语文教学中,我感觉作文教学一直是语文教学的难点,也是学生学习语文的重点。  我常听语文老师说:“学生的作文辅导真难!”可又经常听到学生们说:“作文难,难作文。”
期刊
【中图分类号】G633.3 【文献标识码】A 【文章编号】2095-3089(2014)09-0108-01  阅读能力是当今社会人们获得成功的基本条件,也是一个人未来成功从事各项工作的必备能力。因此,如何培养孩子的阅读兴趣、提高孩子的阅读能力成了一个教育的关注点。  语文“新课标”的“阅读教学建议”第四条中扼要阐述了如何“逐步培养学生探究性和创造性阅读能力”的新课题,其目标主要是想通过多角度、有
期刊
【摘要】提高英语学科教学质量,除了平时要扎扎实实开展好各项教学工作之外,还要切实抓好各阶段的复习备考工作。我和本组教师采用“重基础、巧练习、育能力”的日常教学复习策略;“攻击式” 期中快速复习策略;“扫荡式”、“攻击式”、“演练式” 并用的期末复习策略;依纲务本夯基础、精讲多练求实效、实战模拟促提高的中考复习策略,使我校的英语成绩在全县中考中名列前茅,使我所执教班级的英语成绩在全县英语教师中名列前
期刊
【摘要】初中生怕写作文,厌写作文,认为作文无材料可写成了初中语文教学一大症结,笔者以为以日记教学为突破口,重视学生日记写作的指导、批改、讲评,激发学生写日记兴趣,通过多写日记,可以达到积累素材、练习写作技巧、提高思想认识,从而爱好写作与提高写作水平的目的。  【关键词】日记 指导 作文教学  【中图分类号】G633.3 【文献标识码】A 【文章编号】2095-3089(2014)09-0091-0
期刊
【摘要】由2014年高考山东省英语试题改革不难看出考试更加注重基础。根据完形填空题型的命题依据:格式塔心理学以及对完形填空题型的认识与理解,对学生处理完形填空题型时所出现的症状做了了解、分析,寻找到适用于学生的方法,指明方向,与学生共同成长,共同进步。  【关键词】高考改革 完形填空 格式塔心理学 五不要 五有心人  【中图分类号】G633.41 【文献标识码】A 【文章编号】2095-3089(
期刊
随着互联网进一步蓬勃发展,社交网络、电子商务、网上银行等网站上每天都流通着亿级的企业和用户信息,网站本身存在的漏洞会导致敏感信息的泄露,因此网络漏洞扫描至关重要。
  通过对漏洞扫描技术进行调查分析,针对其中的爬取网页部分的URL去重和漏洞扫描部分展开优化,一方面本文通过采用FarmHash算法压缩结合布隆过滤器的方式进行URL去重,减小了时间和空间复杂度,提高了爬虫爬取的速度和漏洞扫描器的扫描速度。另一方面本文使用动态链接库和插件技术设计实现了漏洞扫描库,内置八十多个漏洞扫描插件,并支持用户自定义