基于多分类器融合模型的展示广告点击率预估研究

来源 :上海师范大学 | 被引量 : 6次 | 上传用户:dfsdasdas
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今互联网广告的投放的主流趋势为“精准化”投放,智能营销平台积累了海量的广告数据和用户数据,如何有效利用这些数据去预测用户的广告点击概率,是大数据应用在精准营销中的关键问题。本文主要基于特征工程和模型构建两个方面,构建展示广告点击率预测模型,对广告主实现精确投放、广告媒介追求利益最大化及提高用户上网体验具有重要的指导意义。特征工程阶段。首先,对广告数据进行一系列可视化的探索性分析,具体通过饼图、堆积图、箱线图和柱形图等,直接观察数据集结构和特征,初步验证不同类别特征的点击率分布存在显著差异。接着,对不同类型特征进行数据清洗、特征规约和特征变换等处理,有效降低数据噪音。最后,从特征选择、特征提取和特征构造三个方面,对广告素材信息、用户信息、上下文信息以及媒体信息等多源特征进行融合提取,获得大量有效的特征集数据,为之后的机器学习算法能够达到更佳的性能提供可靠的基础。模型构建阶段。首先,分别使用原始数据集、通过特征工程处理得到的数据集,依次训练Logistic回归、XGBoost模型和LightGBM模型这三个单一算法模型,通过比较LogLoss和AUC,得到基于特征工程的LightGBM模型的预测效果最好。接着,基于Stacking集成思想,提出预测展示广告点击率的多分类器融合模型,通过真实的广告投放脱敏数据,得到在LogLoss和AUC方法评估中均明显优于以上单一算法模型,充分验证了本文模型的有效性,对展示广告点击率的应用研究有一定的扩展意义。
其他文献
结合规则推理(rule-based reasoning,RBR)和案例推理(case-based reasoning,CBR)的混合推理是人工智能领域新的研究热点。国内外学者在混合推理领域做了大量理论和应用研究工
教育的本质在于文化的传递.将生命教育理解为一种教育文化的自觉和新的价值选择,将有益于我们从更广阔的视野去认识生命教育.任何一种教育的理念和实践都应该与一定的文化环
<正>(2015年7~8月)7月1日福建省农村信用社联合社印发《福建省农信系统推进普惠金融发展三年实施方案(2015-2017年)》,提出开展便捷普惠、阳光普惠、创新普惠、民生普惠、教
<正>规范、正确的电梯施工安装方法和程序是长期以来实际工作的总结,对确保电梯安全运行意义重大。违背这些方法的一些做法给电梯安全运行埋下了巨大的隐患。例如,一种所谓的
单片机课程是高校电气、电子和计算机等专业普遍开设的一门工程技术类课程,以培养学生的单片机系统分析、设计及初步产品开发等实际工程应用能力作为教学目标。围绕学院在单片
介绍了美、俄在燃烧合成技术的历史起源方面的论述,以及这项技术在我国的发展状况和当前面临的问题,并就面临的问题,提出了初步看法。
期刊
<正>早于一九四零年代末期,匈牙利医学教授安德烈彼图强调运动障碍儿童需要成为一个活跃主动的人,能在社会上独立及有创造力。引导式教育就是以教导脑瘫儿童活动与学习为重心
会议
<正>卢荣斌,社会工作师、沙盘游戏治疗师、家庭教育指导师、婚姻家庭咨询师,新会蒲公英社工中心党支部书记、总干事,新会家庭教育协会创会会长、新会区第15届人大代表,2014年
针对当前人类面临的陆地资源和能源日趋严峻的危机,讨论了深海资源和能源开发利用的前景,认为深海资源和能源是21世纪的资源储备,要保持世界经济的可持续性发展,就必须运用海洋高新
日光温室特殊的温、光、水、气等环境因子改变了葡萄本身固有的自然生长规律,导致促早栽培葡萄新梢花芽分化不良,连续丰产性差等问题。针对这些问题,综述了近几年日光温室环