论文部分内容阅读
互联网金融(简称互金)的定义是将互联网技术与金融功能有机结合的一种新兴技术,一般情况下从功能上互金可以分成第三方支付、网络借贷、大数据金融、众筹、信息化金融机构、互联网金融门户六大类,而其中的网络借贷又包含了网络P2P借贷和网络小额贷款等。在网络P2P借贷中的风控按照阶段又分为审批前风控、审批环节风控、授信环节风控、贷后存量客户管理环节风控、贷后逾期客户管理环节风控、资金流动性管理环节风控、放款环节风控七类,其中最重要的风控就是前三个风控环节,这三个风控统称贷前风控,而网络P2P借贷中的贷前风控(简称借贷互金贷前风控)就是本次论文所讨论的重点和方向。对于借贷互金企业来说,风控的本质是对用户数据进行建模并对风险进行定价,一般的风险定价模式是采取对用户的信用程度打分的方式,在银行中,一般采用人民银行的征信报告来统一对客户的信用程度进行评判,其评判结果也被众多银行作为贷前风控的重要考量因素之一。对于借贷互金类企业来说,人行征信评判结果固然很好,但人行征信报告只对外提供了简单版本的评判报告,只有银行机构才有权限查看完整版的征信报告。这种简版的征信报告对于借贷互金类企业是不够的。这种市场空缺也促成了一批第三方征信机构的崛起,尽管人行征信数据并不对第三方征信机构和借贷互金企业开放,但基于互联网的优势,第三方征信机构和借贷互金企业依然可以根据所搜集到的海量用户数据、消费行为数据和社交行为数据完成了对用户的借贷风险定价,其价值在金融场景中与人行征信的效果是相似的,甚至在一部分特定场景下要比人行征信的风控效果还要优秀。其中比较有代表性的就是前海征信和蚂蚁金服,这两家互联网金融科技企业也是互联网金融领域内规模较大的企业,其中的蚂蚁金服比较多侧重于用户的电商场景,其数据来源多来自于淘宝,天猫和支付宝交易等电商业务场景。而前海征信的数据更多的来自平安集团旗下的银行,保险等场景,这种差异是与其产品生态特性是相关的。随着敢于超前消费的90后消费群体的成长,随之而来的是借贷互金的蓬勃发展,借贷互金企业推出了全新的风控模式迅速填补了市场空白,通过应用数据挖掘技术对海量用户数据的分析和建模,构造出了全新的风控评价机制,并在技术和算法的驱动下对海量数据进行分析,实现对用户的精准画像,完成了传统银行无法实现或者无法低成本实现的风控定价,从而实现了对金融风险定价的重塑,一方面降低了风控成本,提升了客户满意度,另一方面也将风控评价的效率和峰值容量等技术指标较传统模式有了大幅度的提升。新的风控模式一方面通过电脑自动审核并且无需人工干预,另一方面对用户的风险进行评判,通过观测某些数据指标来断定借款风险,极大的降低了审核成本,增加了企业利润。论文首先阐述了借贷互金贷前风控评价的背景、意义及目标和相关研究方法。并介绍了在本次论文中所涉及到的风控评价的相关理论依据和采用的技术和知识。重点介绍了行为金融学,数据挖掘的相关知识和本次论文实验用到的决策树算法和Weka软件。其次,本论文阐述了风控评价模型在借贷互金企业中所涉及到的诸多指标的分类和构建原则,分析期间应用了行为金融学的风险度量和心理决策知识将全部数据指标分成了认证,生物识别,借款还款和行为数据4大类别。并在此基础之上节选取了 47个风控指标数据作为本论文所讨论的风控评价模型的研究指标。再次,本论文讨论了如何通过对数据指标按照数据仓库星型结构规范设计风控评价数据仓库,详细阐述了数据仓库的建模实践原则和具体的字段含义。并以活动图的形式展示了数据仓库的清洗-转换-加载(ETL)的详细步骤。接着,本论文使用weka工具通过C4.5决策树算法对数据仓库的数据进行了分析和结果校对,并得出了准确率在96.49%的实验结论。最后,本论文对风控评价实验过程中的存在的问题和不完善之处进行了分析和总结,并对未来的研究方向进行了展望。本论文的创新点在于基于行为金融学理论对于借款人的行为数据进行分析和建模,希望能够发现行为数据与风控评价模型的关系。