【摘 要】
:
聚合支付平台每天能够收集到海量的线下门店交易数据,这些数据是在平台上进行业务分析以及研发智能化服务的基础。通过对海量的商户信息和交易流水数据进行分析和挖掘可以得到商户的潜在特征,从而能够为商户提供个性化服务,并对平台的相关业务进行优化。本文关注的是聚合支付平台的商户流失预测问题,从业务场景出发提出了适用于聚合支付平台的特征工程方法,能够帮助业务部门了解商户流失的原因;并针对静态特征与时序特征融合的
论文部分内容阅读
聚合支付平台每天能够收集到海量的线下门店交易数据,这些数据是在平台上进行业务分析以及研发智能化服务的基础。通过对海量的商户信息和交易流水数据进行分析和挖掘可以得到商户的潜在特征,从而能够为商户提供个性化服务,并对平台的相关业务进行优化。本文关注的是聚合支付平台的商户流失预测问题,从业务场景出发提出了适用于聚合支付平台的特征工程方法,能够帮助业务部门了解商户流失的原因;并针对静态特征与时序特征融合的问题设计了全新的时间序列模型Mf GRU(Modality-fusion GRU),有效提升了预测结果的准确率;此外针对数据中的类重叠问题设计了全新的自步学习算法DSPL(Deep Self-paced Learning),极大提升了对流失商户的召回率。本文主要工作包括以下几个方面:1.提出了聚合支付平台的特征工程方法:现有的相关工作在特征提取阶段大多只考虑交易金额的统计学特征,如最值、均值、方差等等。这些特征反映的信息比较局限,并且与业务联系不紧密。本文从应用场景出发,提出了三大类特征,其中商户特征用于描述商户的固有属性,交易流水特征用于描述商户的经营模式和经营状况,风控特征用于反映商户刷单套现等异常行为。本文提取的特征能够帮助业务部门更清楚地了解商户流失的原因。2.设计了多模态时间序列模型:考虑到交易数据存在时序性,本文使用了时间序列模型建模以提升预测的准确率。此外,考虑到静态特征能提供与商户的固有属性、经营模式相关的信息,应在时间序列模型中融入静态特征以进一步提升预测准确率。但传统的时间序列模型不能直接输入静态特征,常见的方法是将静态特征与时序特征拼接或者与模型输出的表征拼接,这些方法并不高效,也无法让静态特征和时序特征充分交互。本文提出了一种全新的时间序列模型Mf GRU,模型的门控单元可以同时输入时序特征和静态特征,充分挖掘两个模态所包含的信息。实验结果证明Mf GRU要优于其他模型。3.提出了深度自步学习算法:本文的数据存在严重的类重叠现象,已有研究表明自步学习可以处理类重叠问题,但是传统的自步学习算法难以应用于深度学习模型的训练。本文提出了一种全新的自步学习算法DSPL,可以将自步学习算法以“插件”的形式与深度学习模型的训练相结合。DSPL算法通过全新的自步采样机制有效处理了数据中的类重叠问题,极大地提升了对流失商户的预测准确率。采用本文提出的方法进行商户流失预测,得到的F1分数为0.635,与目前实际使用的方法相比提高了31.5%。本文的数据分析方法和流失预测模型能够有效地分析商户流失原因,减少商户流失数量。这对企业降低运营成本、提升竞争力、保持长期效益具有重要意义。
其他文献
协作能力是21世纪人才必备技能之一。近年来,我国教育领域开始关注协作能力的发展,课堂教学大多都以协作的形式进行。但笔者通过文献梳理发现,大部分教师在进行协作教学时,其目的仅仅是为了更好的学习结果,反而忽视了对学生协作能力的提升。因此,在课堂上探索新的教学活动以提升学生的协作能力势在必行。本研究尝试将群体动力理论引入课堂教学中,从群体动力理论视域出发,在建构主义学习理论、活动理论的指导下,依据学生特
巫山淫羊藿(Epimedium wushanense Ying)为小檗科(Berberidaceae)多年生药用植物。本论文以巫山淫羊藿为试验材料,从花序及花的发育、种子萌发和组织培养这三方面入手,应用显微镜及石蜡切片等技术,观察巫山淫羊藿花序的发育及花的雌雄蕊各个时期的生殖变化;利用赤霉素浸种、温度层积、室温阴干这三种不同处理条件,探究种子萌发的最佳方法;选取萌发幼苗的子叶、总叶柄顶端、茎为外植
目的 分析老年2型糖尿病患者实施饮食护理的效果。方法 选取2019年9月—2021年9月泉州市第一医院收治的136例老年2型糖尿病患者为观察对象,根据双色球分组法分为参照组及观察组,各68例。参照组实施常规护理,观察组于参照组基础上实施自饮食护理。对两组干预前后饮食管理能力及饮食行为依从性进行评估对比;对两组干预前后体质指数(BMI)、糖化血红蛋白(Hb A1c)等指标进行对比。结果 干预前,两组
社会经济的快速发展加剧了企业之间的竞争态势,在大多数企业均拥有了必备的技术及科研实力后,作为市场推广的人才即销售人员则成为企业在行业竞争中制胜的法宝,他们是企业各种资源中相对比较具有活力、创造性及能动性的要素,因此优秀的销售人员成为企业培养发展与竞争的焦点。因此,为了获取企业发展的核心竞争优势,大家越来越重视对于销售人员的激励体系,不断在发展的过程中进行钻研与探索,以更好地激发销售人员在工作中的积
目的:了解山西省腹膜透析(peritoneal dialysis,PD)患者贫血的发生及治疗情况,并研究其危险因素。方法:收集2020年山西省经全国血液净化病例登记系统填报的PD患者的病例资料,包括基本资料、透析状况、药物使用及实验室指标,血红蛋白(hemoglobin,Hb)≥110g/L视为治疗达标,处理且分析数据。结果:(1)2020年山西省PD患者平均Hb水平为104.9±18.3g/L,
现代公司治理结构避免了传统企业中所有者兼具经营权的弊端,将经营权让渡给职业经理人。但由于经营权和所有权的分离,会导致作为委托人的股东和作为代理人的管理层之间信息不对称,同时股东和管理层的利益并不一致,很容易产生代理问题。股权激励作为一种针对管理层的长期激励机制,其诞生就是为了能有效解决委托代理问题。目前股权激励已被世界各国诸多公司广泛采用,但与此同时激励失败与激励效果不佳的公司不在少数。因此,如何
目的:探讨我国研究生五态人格与睡眠质量之间的关系,同时引入中医体质、心理压力等变量,借此探讨五态人格作用于睡眠质量的具体机制,试图为改善研究生的睡眠质量提供参考依据。方法:本研究选取安徽省,湖南省等多所高校研究生为被试,使用五态人格测验量表、匹兹堡睡眠质量指数量表、五五体质检测量表和研究生心理压力源量表对被试实施测验,使用SPSS 18.0 PROCESS程序对数据分析。结果:1.研究生群体中五态
我国实行的施工图审查制度规定,在工程施工前,建筑施工图设计文件必须进行合规性审查,保证施工图的质量。然而由于建筑业发展迅猛,工程体量庞大,仍存在工作量大、“阴阳图纸”和利益相关方合谋等问题。本文考虑到BIM和区块链在我国建筑业的应用趋势,在BIM审图的基础上研究基于区块链的建筑施工图合规性审查。首先,本文分析了区块链技术在基于BIM的施工图审查过程中的优势与可行性,选择了相对应的联盟链和Hyper
开源的RISC-Ⅴ架构为集成电路设计技术提供了新的创新平台,论文讨论了64位RISC-Ⅴ超标量乱序处理器BOOM。文章依托其整数指令执行级流水研究和关键路径时序阻塞的分析,对整数执行部件(EXU)进行优化设计。通过增加合理的硬件开销,达到减少执行周期,提升频率的高性能要求。完成的内容与工作如下:本文先对发射单元进行结构上优化设计,设计了不同指令周期长度的专用发射队列;提高分支指令优先级;采用pos
骨科植入物被广泛用于骨缺损的治疗中,其中钛由于自身良好的力学性能和生物相容性成为广泛使用的骨科植入物之一。近年来的研究表明尽管钛金属植入物可以满足植入部位支撑的作用,但面临着植入后感染和氧化应激生成活性氧(ROS)和导致炎症的问题。因此,对钛金属表面进行改性赋予其抗细菌黏附性和抗氧化性能是有效的解决方案。硒(Se)作为人体内的一种微量元素,被普遍认为具有较好的生物活性和生物安全性,尤其是硒纳米粒子