【摘 要】
:
预算约束下如何分配广告印象是RTB竞拍的主要研究问题之一。通过对广告印象的合理分配可以让广告获得良好的营销效果,进而使交易平台和需求方平台获得更高的收益。传统的分配方式站在交易平台的角度通过“价高者得”进行分配,这使得分配策略永远固定在最高出价的需求方身上。在复杂且规模大的RTB拍卖环境中,这种方法会导致需求方在前期过度消耗预算,从而影响需求方乃至交易平台的最终利益。同时,从算法的角度考虑,由于环
论文部分内容阅读
预算约束下如何分配广告印象是RTB竞拍的主要研究问题之一。通过对广告印象的合理分配可以让广告获得良好的营销效果,进而使交易平台和需求方平台获得更高的收益。传统的分配方式站在交易平台的角度通过“价高者得”进行分配,这使得分配策略永远固定在最高出价的需求方身上。在复杂且规模大的RTB拍卖环境中,这种方法会导致需求方在前期过度消耗预算,从而影响需求方乃至交易平台的最终利益。同时,从算法的角度考虑,由于环境规模造成的拍卖序列过长也会导致现有算法学习过慢以及训练困难。首先,针对如何分配广告印象问题使得平台和需求方互利共赢的问题,本文将RTB广告印象分配问题依照不同等级预算限制建模为一组多级的马尔科夫决策过程集合,并使用深度强化学习算法为各MDP问题自动学习广告分配策略。其次,为了解决预算过早耗光以及算法训练困难等问题,本文提出了多级预算分配约束DQN(Multi-Level Budget Constraint DQN,MLBC-DQN)框架。该框架可以将长序列决策环境分为多个不同级别预算的短序列环境,在不同级别预算的短序列环境中分别使用DQN来训练动作的估计回报,然后使用不同级别Q估计值加权得到的结果指导算法最终选择与环境交互的动作。在短序列环境中智能体能够快速学习到有效的策略,以此指导大序列环境的学习,从而克服预算过早耗光,同时也可缓解序列过长导致算法难以收敛。最后,为验证本文提出的模型及算法的有效性,本文在i Pin You上应用了两个数据集来对模型和算法进行验证。实验结果表明,与传统的线性分配策略、传统DQN相比,本文提出的MLBC-DQN框架能够有效地学习广告印象分配策略。在保证平台收益的前提下,使需求方获得更高的CTR值,从而让需求方获得更大的利益,最终达到促进广告资源营销效果的目标。
其他文献
图像生成是机器学习领域的一项研究任务,其目标是学习数据潜在分布,从而产生能够以假乱真的高质量图像样本。目前研究者们提出了很多生成模型应用于图像生成任务,并且已取得一定效果。但是,如何生成高质量的数据样本仍然是计算机领域不断追求的目标。目前,有关图像生成方法主要存在以下两个难点:一方面,生成图像样本模式单一,无法完全覆盖训练图像样本的所有模式,即出现模式损失问题;另一方面,由于模型设计本身存在固有的
近年来,随着数据挖掘技术的日益成熟和离群点检测研究的持续深入,离群点检测研究已经在欺诈行为识别、网络恶意入侵检测和医疗健康检测等多个领域得到了广泛的应用。离群点检测技术虽然在理论研究和应用系统构建方面已经取得了很大进步,但是在无监督和半监督离群点检测中,仍存在算法对数据的适应性差和对数据信息利用不足等问题,还需开展深入研究。基于上述背景,本文针对无监督和半监督离群点检测中的问题,开展了以下研究工作
汽车行业正处于智能变革的时代,自动驾驶可以提供更安全、更节能、更高效、更舒适的出行体验,毫无疑问是国际公认的未来汽车发展方向。其意义不仅在于该行业的技术升级,更会带来全球化供应链和产业生态的革新,是各国必争的战略高地。随着深度学习和计算机视觉技术的兴起,自动驾驶为提升交通安全与效率提供了新的解决方案。其中视觉与红外相机为自动驾驶技术中所有传感器里最被看好也是最有发展潜力的,如何快速准确得识别定位行
对海量数据进行深层次的分析利用推动了数据挖掘技术的发展,聚类分析作为数据挖掘中的关键算法,已应用到众多领域。基于聚类分析与培养质量评估在本质上的一致性,可将该算法应用于研究生培养质量评估领域。针对培养质量数据集多样性和模糊性的特点,本文提出了一种面向培养质量评估的特征加权聚类算法,可以对培养质量进行高效、精准地聚类分析。本文的主要研究工作如下:(1)深入研究HCM算法和MG算法的核心思想,针对其为
目标检测的任务是在特定场景下找出图像中所有感兴趣的目标并确定目标的特征信息,包括目标的位置、目标综合评分以及目标所属的类别。目前,目标检测广泛应用于自动驾驶、行人检测、工业检测等诸多领域,是计算机视觉领域的核心问题之一。近年来,随着人工智能的发展,基于深度学习的目标检测算法开始得到广泛的研究和应用。其中实时目标检测算法YOLOv3的检测速度较快且精度良好,广泛用于各类实时目标检测应用中。YOLOv
癌症是威胁人类健康的重要因素之一,这类疾病治疗困难又极易复发,给患者和社会造成了巨大的负担。同时,随着高通量测序的发展以及二代测序的普及,生物医学的发展也步入了大数据的时代。众多癌症公共数据库的建立并开放获取,使得以大规模基因表达数据为基础的肿瘤生物信息学研究迅速发展。本文以基因表达数据为基础,对癌症进展阶段分类及泛癌样本分型的相关技术展开研究,主要研究内容和研究成果如下:(1)针对癌症进展阶段分
近年来,智能机器人、无人驾驶等技术的飞速发展在引领产业变革的同时对环境感知技术提出了新的挑战。无人驾驶技术在交通管制、物流运输等场景中具有普遍的应用价值。但无人驾驶能够稳定、安全行驶的前提是能够获得目标在三维空间内的朝向、尺寸、三维中心点等信息,激光雷达能够高效的获取三维世界中深度信息,从而达到无人驾驶系统实时性要求,但激光雷达造价高昂,很难实现量产。因此提出一些基于视觉的三维目标检测算法,但仅通
作为模型的降维表示,中轴因其具有良好的性能被广泛应用于工业领域。随着中轴应用的不断拓展,工业领域对于中轴的标准也越来越高,因此,许多学者针对模型的中轴生成方法进行了研究,本文在研究现有国内外中轴生成方法的基础之上,提出了基于双法线跟踪的模型中轴生成方法,该方法的具体研究如下:(1)现有中轴生成方法主要基于近似中轴的思想,采用经过中轴近似得到的结果来作为模型中轴,使得生成的中轴质量不是很高。针对这一
就我国目前企业发展来讲,国有企业不断趋向于市场化。就全面预算管理来讲,我国的全面预算管理正处于刚刚起步阶段。还并没有设定一套完善的预算管理体系。目前我国的企业管理模式有很多种,但是经过不断的对管理模式优化,衍生出新型的全面预算管理模式。全面预算管理模式作为我国的核心运行模式,他为企业现代化发展起到了一定的作用,所以,我国的国有企业全面预算管理不但能够高效的优化企业内部管理制度,还能有效提高管理水平
目标跟踪是计算机视觉的一个极具挑战性课题,有着重要的研究意义。现阶段目标跟踪算法对于快速运动弱目标的跟踪效果不佳,快速运动弱目标主要表现为目标与背景的对比度低且在快速运动场景下目标与背景不断发生变化,难以捕捉到全局信息,使得模板污染变大,导致跟踪失败。针对上述问题本文提出了一种时空信息连续多特征融合孪生网络跟踪算法,能有效地解决上述问题并表现出良好的性能。本文具体工作如下:首先,通过对公开数据集进