一种DSP广告点击率预测的研究与实现

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:wxa180395
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着程序化购买的模式日渐清晰与需求日益增大,需求方平台(DSP Demand-Side-Platform)发展非常迅速,近年来市场规模每年已达数百亿元,广告点击率预测作为需求方平台的核心技术之一,对提升需求方平台的竞争力起着关键作用。本文立足于DSP广告点击率预测的具体场景和需求,通过查阅大量相关文献,对点击率预测模型进行了深入分析,研究了谷歌、微软、脸书等大公司在广告点击率预测问题上采用的方案,重点参考了脸书提出的梯度提升决策树组合逻辑回归的模型[1],把逻辑回归替换为基于特征列的因子分解,得到一个新的预测模型:梯度提升决策树和基于特征列的因子分解的组合模型。通过梯度提升决策树对连续特征及选择性对部分原始特征进行转化生成新特征,很好地进行了特征组合并且避免过度拟合,而基于特征列的因子分解模型通过分解成多维空间,使模型的精确度更高。其次在庞大特征空间的问题上,针对单个特征采用卡方检验进行特征选择,以过滤一些对训练没有帮助的特征,从而降低特征空间以及提高训练数据的质量;同时使用散列技巧对卡方特征选择的结果进行降维,以达到一个在具体实现中可接受的量级。本文同时基于计算框架Spark对这一模型进行了实现,把整个实现过程分为4部分:梯度提升决策树部分对连续特征和部分类属特征进行特征组合生成新特征;基于特征列的因子分解预处理一阶段对连续特征进行压缩处理;而预处理阶段二实现卡方特征选择及散列技巧;最后将前3部分的特征合并对基于特征列的因子分解模型进行训练。大部分算法的实现都是基于Spark MLlib库,如梯度提升决策树、卡方特征等;而基于特征列的因子分解的算法实现借助于第三方扩展库。最后通过实验和其它几种常用模型的对比,论证了本文模型的有效性。
其他文献
自2000年在北京召开城市色彩专题讨论会起,城市色彩规划在城市规划与建筑界引起重视,并在全国范围内引起探索和讨论,至今热度不减。历史街区色彩作为城市规划中重要的一项领
本文以金洞林场当年生闽楠幼苗作为试验材料,设置全光照、30%、50%、70%、90%,共5个遮荫处理,研究不同遮荫强度对闽楠幼苗形态生长、光合特性、生理特性、叶解剖特性、冷境生
背景 急性胰腺炎(Acute Pancreatitis,AP)是临床常见的急腹症,病理特征主要是胰腺腺泡细胞损伤,后出现胰蛋白酶原激活,继而触发炎症反应,临床上多表现为轻型,但有20%-30%的AP
随着社会的发展,能源的需求量急剧增长,不可再生能源将限制人类社会的发展,因此,新能源的研究和应用迫在眉睫。太阳能因其取之不尽、清洁安全的特点,被人们广泛应用。人们使
油菜是世界范围内广泛种植的重要油料作物,也是我国食用植物油的来源之一。干旱是全球范围内危害农业生产的主要非生物逆境之一,严重影响油菜的正常生长发育及产量和品质。近年来,前人在甘蓝型油菜的抗旱机理方面已做了许多研究,然而在半干旱地区,油菜生长发育的水分环境具有干旱与湿润交替进行的特点。因此,研究甘蓝型油菜在干旱及旱后复水条件下的生长状况,以模拟半干旱地区油菜生长的水分特点,对研究甘蓝型油菜对干旱胁迫
在地震引起的楼面运动作用下,建筑内部的浮放物品可能因滑移或倾覆发生损坏,造成经济损失,影响建筑功能正常使用,甚至造成人员伤亡。本文考察建筑内部浮放物品的滑移和摇摆运
非凸两分块优化问题广泛出现在数据挖掘,信号与图像处理,稀疏优化,神经网络,支持向量机等实际问题中.乘子交替方向法是求解两分块凸优化问题的一种有效方法.但当目标函数非凸时,经典乘子交替方向法的收敛性不能保证.本文分别针对非凸无约束优化问题及非凸线性约束优化问题提出两类改进乘子交替方向法.研究内容如下:首先,对非凸无约束优化问题给出一个正则化乘子交替方向法.证明该算法的全局收敛性,并在增广拉格朗日函数
目的:探讨蒙药阿木日-6在治疗肠吻合术后患者的胃肠道功能恢复的临床有效性和安全性。方法:将选自内蒙古民族大学附属医院蒙医外科2018年11月至2020年2月符合肠切除+Ⅰ期肠吻
集约化农业生产中化肥和农药的大量使用,是导致河湖水体富营养化、地表水质污染退化的最主要原因。广西是我国甘蔗种植面积最大的省份,占全国甘蔗种植面积的60%以上。据统计,
超级电容器,作为一种新型的功率型储能器件具有的功率密度较高、循环性能稳定并且能够进行快速的充放电等特点。这些优良的性能让超级电容器的应用前景受到广大科研工作者的高度关注。在目前已经报道了的各类电极材料所制备的超级电容器当中,将镍基硫化物作为电极材料所制得的超级电容器已经能够实现在较高的功率密度的同时具有不错的能量密度和良好的循环稳定性,极具投入应用的希望。本文主要以镍基硫化物为研究对象,通过不同的