论文部分内容阅读
随着我国消费结构从生存型向着发展型和品质型消费过渡,我国消费金融迎来爆发。互联网消费金融的代表P2P网贷(Pear-to-Pear Leading)行业蓬勃发展,使得贷款更加方便快捷,同时也促进了社会消费水平的提高。但是目前的贷款需求呈现小额化和快速化的趋势,使得P2P网贷的模式也面临着挑战。现有贷款产品的授信源主要是靠抓取用户征信报告,抓取用户信用卡账单等方式。此类方式存在两大弊端,一是获取不及时,二是用户的征信报告以及信用卡的使用率底,信息覆盖率底,无法为每一位潜在用户提供服务。在面临挑战的同时,移动支付在我国的普及为新的贷款模式提供了基础。P2P金融风险控制系统主要是针对新形势下网贷需求所建立的,对用户的网络消费、移动支付、移动通讯等信息进行综合分析,为系统上下游的放贷和进件过程提供决策,保障系统高效、高收益地完成网贷任务。本系统本质是一个基于Web.py的RESTFul服务提供方。模型的训练开发以及数据的存储是建立在Hadoop生态之上的,这样保证了海量数据的存储以及数据运算的速度。本系统主要任务是为整个产品线提供用户的风险决策,包括是否放款、放款金额以及利率等。本系统中主要针对用户的支付宝、京东、通讯记录等数据进行分析,在原始的数据上进行特征工程,并基于Hadoop平台完成对数据的预处理。之后对授信模型进行训练,并通过 Logistic Regression、Xgboost(eXtreme GradientBoosting)模型的对比,选择最为准确的Xgboost-L授信模型,同时通过A/B测试来验证产品的准确性。本人主要负责产品反欺诈验证流程的设计和实现,以及特征工程和新模型的训练开发,参与了风险控制系统的web服务实现。本系统已通过公司线上小流量测试,授信模型以及反欺诈流程结果符合预期效果,特征工程被之后产品成功复用。