基于因果推断的乘客干预效应研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:xiaozao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在如今的大数据时代,信息传递与反馈变得尤其快速,随着科学技术的不断发展,人类社会步入崭新的信息化时代,互联网的迅速发展使得人们的生活方式发生了极大的改变。各种打车的APP层出不穷,出行变得越来越方便。而对于运营打车APP的企业,在市场竞争不断加大的情况下,如何更好的运营,对不同的乘客使用独特合理的策略,从而提高收益和留存率,成为大家关注的话题。乘客干预效应是智能补贴算法的一环,它的涵义是指乘客被发放优惠券、收到召回短信等措施干预后,对干预做出的反应情况。智能补贴算法在不同的场景下有着不同的作用和需求,我们需要考虑补贴成本是否足以支撑商业逻辑。因此,我们没有办法按已经成熟、可以落地的广告和推荐等领域的算法,最大化转化率或者点击率来实现,只能开拓新的算法谱系,这个算法谱系的核心是增量预估算法和动态规划的结合。也就是说,可以通过增量预估,预测得到不同金额成本带来的增量,通过动态规划找到一个组合,使得增量最大的同时满足成本限制。增量预估算法本质上属于因果推断。近年来,探索因果关系的研究越来越受统计学与计算机科学领域学者的青睐。因果关系与相关关系既有相似又有不同,而在现实业务逻辑中,我们更关心的是变量间因果关系的识别,而不是相关关系的断定,由此产生了因果推断的研究领域,利用试验性研究或观察性研究得到的数据,评价变量之间的因果作用以及挖掘多个变量之间的因果关系。因果推断在生物和医学领域开始比较早,应用也比较广泛,它的理想情况,是希望从真实的观察数据中找到因果关系,但是这个问题以目前的学术研究条件尚不足以解决,有学者评论说这很可能会是成功迈向AI的第一步,足以见其难度。因此,我们采用另外一种目前应用更广泛的方法,即AB实验,来衡量某个因素对最终结果,这一方法客观且较为准确,缺点是要进行实验,即控制其他变量不变,只施加某个干预,并观察它对结果的影响,这也是因果推断的一种简化。本文就主要研究了在滴滴出行的商业背景下的增量预估算法,即乘客干预效应(乘客被发放优惠券、收到召回短信等措施干预后,对干预做出的反应情况),重点看乘客被干预后一段时间内的GMV的提升情况。在研究过程中,为了获取数据,首先需要进行AB实验,在实验环节,由于我们在研究乘客的干预效应时,落地场景一般是对处于衰退期乘客的召回,因此,在人群选择时定位了处于衰退期的人群。同时,为了保证数据的有效性,在AB实验配置环节,进行了分组方法上的创新,采用匹配均值的分组方法,更有效地消除了协变量的影响,保证对照组和实验组在各个特征的分布上更加一致,从而提高数据的准确性和有效性。在获取实验数据后,我们构建了43个特征变量,然后进行了因果推断相关模型构建,通过模型进行了异质性的乘客干预效应研究预测,即预测乘客在被发放优惠券后,对干预做出的反应情况,通过对一段时间内的成交总额的增量预估,更精准的锁定用户群,从而减少补贴成本的浪费,提高补贴发放的效率。
其他文献
大数据时代,随着技术手段不断进步,海量数据不断涌现。分子生物信息学领域的微阵列数据,网络购物的用户行为和交易数据,信息化金融市场的交易数据等等,这些庞大的高维数据给传统分析的低维数据数据分析方法提出了挑战,也推动了多重假设检验理论的应用和发展。随着生活水平的提高,人类寿命不断延长,癌症已经成为危害人类健康的头号敌人。而多数癌症患者早期大多性状不明显,且同一类癌症往往性状表现也不尽相同,如何从分子水
学位
随着长三角一体化发展上升为国家战略,党和国家对长三角区域产业协同发展提出了更高的要求,这对长三角三省一市而言既是一次难得的机遇,同时又面临着前所未有的挑战。长三角地区如何立足自身资源禀赋,形成区域产业分工协作、优势互补的发展格局,打造我国强劲活跃增长极,引领全国高质量发展,成为了一项极具现实意义的时代课题。鉴于此,本文尝试从区域间产业关联的视角,通过编制长三角地区间投入产出表,对长三角地区间的产业
学位
疫情之下,全球金融市场进入大波动时代,各国金融调控政策、突发事件层出不穷,例如美联储无限量QE、欧央行7500亿复苏基金、中美关闭使领馆、阿塞拜疆和亚美尼亚爆发空战...如何智能监控全球舆情,从而最快速地做出反应、最大可能地规避风险,就成了一项特别重要的工作。自然语言处理技术作为一种新兴技术,在发展过程中,便于金融产生了联系。在《全球金融科技权威指南》一书中提到了Econob公司,这家做自然语言处
学位
一个准确的电力负荷供应决策对于电力系统来说至关重要,而其中最为关键的就是对电力负荷的预测。而电力负荷日峰值的预测是其中一个重要指标。在目前的研究中,研究者们往往侧重于提高电力负荷整体的预测精度,而预测的稳健性一直被他们所忽视。在建立模型的过程中,我们往往会利用模型选择法来选择某一“最优”模型作为后续预测的模型,而人们却忽视了模型选择过程中的不确定性。模型平均则是用来解决以上问题的一个有效办法。它避
学位
基于深度学习的、与年龄相关的人脸图像分析已经成为计算机视觉领域的一个重要研究内容,在众多深度神经网络模型中,生成对抗网络是最具魅力的模型之一,它强大的生成能力让我们可以完成许多有趣的事情,例如图像风格迁移、文本到图像的合成、图像超分辨率、人脸衰老图像生成、图像修复等。人脸图像衰老合成作为一个应用范围非常广泛的研究方向,包括追捕通缉犯、寻找走失儿童、自动升级职员数据库、提高人脸识别系统的鲁棒性以及科
学位
近年来,随着全球性的经济发展以及世界各地区的经济增速和动能的衰弱,以及全球性的债务水平的升高以及金融市场的局部动乱等一系列问题的日益加剧,资本直接进行的投资活动也略显较为低迷。尤其是2020年新冠病毒疫情爆发以来,美国、欧洲和其它许多国家政府不尽如人意的处理,导致投资者对经济发展形势进一步看衰,全世界范围内的经济十分不稳定。在此背景下,黄金和许多其它虚拟货币的价格均出现了较大幅度的上涨,加剧了相关
学位
线性双自回归模型(Linear double autoregressive(DAR)models,LDAR)可以用来很好地拟合厚尾数据,它的条件均值和条件标准差部分均采用了线性结构,其模型结构使其更加具有稳健性。目前,线性双自回归模型已有的估计方法是由Zhu et al.(2018)提出的双加权分位数回归估计(DWQRE),最优DWQRE估计量的渐近方差在特定的条件下可以达到CR下界,该估计量的渐
学位
在社交媒体高速发展的今天,网络上的社交文本形成了一个极具价值的文本库,尤其是对于美妆品牌而言,中国市场的美妆行业近几年正在急速扩张,其中新模式社媒营销起了很大的推动作用,比起其他行业,美妆行业是较早应用互联网技术进行社会化媒体营销的行业之一,因此社交文本成了该行业一个很重要的信息来源。本文旨在通过分析社交媒体平台中消费者关于美妆品牌的真实评价,提取合适的关键词进行情感分析、IPA分析及共现分析,使
学位
命名实体识别是指识别出一段文本中具有人名、地名、专有名词等特定含义的实体。中文命名实体识别任务是自然语言领域的基础任务,是许多上游任务的基石,而医学文本是中文命名实体识别的一个非常重要的领域。本文就医学文本命名实体识别中存在的嵌套实体识别难的问题提出了一些有效的解决方案。对于命名实体识别,业界通常采用序列标注的方法来识别实体。对于非嵌套实体这样做是方便且有效的,但是对于嵌套实体而言,会出现一些问题
学位
随着互联网时代的到来,社交网络蓬勃发展,已成为当代社会信息传播的重要渠道和载体。在线社交网络中每天产生海量且流动的信息。然而信息流行度分布极其不均,绝大部分信息的流行度较低,只有极少数信息具有着较高的流行度。因而了解信息是如何传播的,以及什么样的因素驱动信息的传播,并对信息流行度进行预测成为了广大科研人员的关注热点。本文针对社交网络中的信息流行度预测问题展开实证研究,主要内容如下:对社交网络流行度
学位