论文部分内容阅读
伴随着网络借贷行业的兴起和繁荣,形形色色的欺诈事件在不断增加,甚至还形成了专门的黑色产业链,欺诈成了网络借贷行业难以规避的隐痛。网络借贷平台的风险控制能力是决定其是否能长期运行和健康发展的一个重要因素,是否能有效控制欺诈风险对网络借贷平台能否长期运行和健康发展更是起到至关重要的作用。为了丰富网络借贷平台的反欺诈手段,本文借鉴前人经验,提出了GBDTLogistic regression组合模型欺诈评分卡的理论并进行了实证分析,建立GBDTLogistic regression组合模型欺诈评分卡的具体步骤为:将多个原始变量作为GBDT模型的输入自变量,将是否欺诈作为GBDT模型的因变量,对GBDT模型进行参数选择和调优,然后通过调优后的GBDT模型生成欺诈概率,将其生成的欺诈概率进行WoE转换之后作为自变量与挑选的其余原始自变量一起经过因子分析转换生成因子得分,将因子得分作为Logistic regression模型的自变量输入,得到Logistic regression结果,然后再根据Logistic regression系数和因子分析结果将因子项还原成输入变量的方程,最后根据评分公式生成评分卡。本文分别对Logistic regression欺诈评分卡、GBDT模型、GBDT-Logistic regression组合模型欺诈评分卡进行了实证分析,并对这三种模型的结果进行了对比,对比结果表明,GBDT-Logistic regression组合模型欺诈评分卡比GBDT模型更稳定、更具可解释性;且GBDT-Logistic regression组合模型欺诈评分卡比Logistic regression欺诈评分卡区分能力和排序能力更强。