广告文本表示学习与点击率预测方法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:jql
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络广告能以较低的成本将商品和服务信息传播到世界的各个角落,逐渐形成了一个以计算和技术驱动为特征的网络广告市场。作为广告系统关键部分,点击率预测建模需要处理广告、上下文、用户三方复杂的信息,识别其中潜在的模式和规律,是行业中具有相当难度的问题,引起了工业界与学术界的广泛兴趣。研究广告点击率预测,对于降低广告投放成本、提升用户体验和提高媒体金融收益,都有重要的理论和实际意义。
  近年来,国内外关于点击率预测的研究取得了飞速发展,但仍存在一些需要进一步解决的问题。首先,广告文本数据篇幅短小、结构紧凑、词汇间相关性强,对其进行有效表示是一个难点;其次,现有较新的广告点击率预测模型多采用深度学习或模型集成技术,虽然很大程度上提升了点击率预测精度,但面临含噪声或多字段分类数据且包含文本数据时,仍然存在点击率预测精度受到影响或难于有效建模的问题。针对上述问题,本文从广告文本数据表示学习、面向噪声数据的点击率预测方法、面向多字段分类数据的点击率预测方法三个方面展开了相关研究,主要工作体现在:
  (1)针对现有方法没有充分挖掘广告文本数据中潜在语义信息的问题,利用BTM(Biterm Topic Model)模型能高效提取短文本主题的特性,对广告文本进行主题特征建模;主题数目对主题向量有重要的影响,鉴于BTM不能自动获得合理的主题数目,设计了基于密度聚类的主题数目自动寻优方法,旨在获得优良的主题特征向量。
  (2)针对传统词汇语义表示模型通常只考虑局部上下文关联关系的缺陷,结合已获取的主题向量,提出了融合主题特征的词汇语义表示建模方法,该方法对全局上下文和局部上下文共同建模,既保留了窗口上下文的词序信息,又增强了主题信息对词汇的影响;通过对词汇语义进行多角度挖掘,获得了语义丰富的词汇表示。在此基础上,设计了两种句子级的短文本表示方法,旨在获得广告文本数据Embedding表示,为点击率预测建模打下基础。
  (3)为解决含噪声与文本数据场景下广告点击率预测问题,借助模糊数理论处理噪声与不确定性的优势,提出了面向噪声数据的广告点击率预测方法。该方法引入模糊参数管理神经网络子模型,扩大参数搜索空间,使得数据中的不确定性得到描述;通过堆叠多个子模型构建模糊深度神经网络,可以处理广告数据间复杂的不确定性关系并获得更具区分度的高阶抽象特征,在含噪声与文本数据场景下,能一定程度上提升点击率预测精度。
  (4)为解决包含大量分类字段数据与文本数据场景下的广告点击率预测问题,借助Embedding映射网络及因式分解机模型高效处理稀疏向量的能力和树模型处理连续向量的能力,提出了面向多字段分类数据的广告点击率预测方法。该方法借鉴Wide&Deep Learning模型的思路,一方面采用Embeding映射网络和因式分解机对广告分类数据进行建模,然后通过堆叠降噪自动编码机进一步提取高阶特征;另一方面采用梯度提升决策树对广告文本数据进行高阶特征提取,最后将两部分高阶特征拼接后进行点击率预测;这一方案可以高效解决多字段分类数据和文本数据场景下的建模任务,并获得较好的点击率预测效果。
  
其他文献
学位
学位
学位
学位
智能视频监控是利用计算机视觉和图像处理方法,在不需要人为干预的情况下,对摄像机拍摄的图像序列进行自动分析,实现动态场景中运动目标的检测和跟踪,判断目标的行为。这是随着数字视频技术的发展而产生的一个新的研究课题,其在国防安全、民用事业等多方面有着广泛的应用价值和极大的发展前景。以复杂场景下的运动目标检测和跟踪作为研究内容,对目标检测、阴影消除,目标跟踪及在移动平台实时实现问题等关键技术进行了研究,为
学位
如今,智能便携式移动设备在人类生活中正扮演着无法取代的角色。作为这些设备的持有者,用户本身具备社交属性且他们彼此间存在着社交关系。此外,新型无线网络技术(如5G技术)的迅速发展为移动用户之间的通信提供了强有力的支持。移动用户基于无线网络实现互联,并通过在线社交网络(Online Social Network,OSN)服务(如Facebook和微博)共享信息,构成了传统的移动社交网络(Mobile
在信号场之于无限边界的开放空间域上,构成了继陆、海、空、天的第五空间域,形成了物理空间内人与人、物与物、人与物的动态可交互虚拟空间。国家在无界开放网络空间域上提出保障信息和资源安全和保障关键信息基础设施互联互通的战略要求,势必为网络空间安全重要内容之一的网络异常行为检测和识别研究提出新的挑战。  本文以国家网络空间安全战略为导向,以保障关键信息基础设施互联互通为目标,立足分组交换技术的网络环境,针
物联网作为世界信息产业发展的第三次浪潮,未来发展潜力巨大。物联网是支撑城市智能交通的重要技术。在面向城市交通的物联网环境下,通过改善基础设施、实施城市交通专用道、快速城市交通、轨道交通等多模式,应用先进信息技术,城市交通得到了快速发展,对城市居民出行发挥了重要作用。面向智慧城市交通物联网的图像数据是大数据,基于该大数据,从系统工程的视角出发,在分析交通规划的影响因素及城市交通能力及运行现状调查分析
随着互联网的飞速发展,通过互联网获取相关信息已经成为现代人获取信息的常用方式。搜索引擎等网络检索系统的出现,加速了网络信息获取的速度和准确性。然而,以搜索引擎为代表的检索系统并不能完全满足用户的搜索需求。为了使搜索结果更加贴近用户当前的搜索需求,搜索排序技术和查询扩展技术极大的提高了搜索的准确率,从而提高了用户的搜索体验。然而,现有的搜索排序通常基于PageRank等传统的排序技术,并没有考虑用户
学位