论文部分内容阅读
摘 要 本文以某中小商业银行推进互联网信贷业务发展为例,针对风控模型在互联网信贷业务中应用进行剖析,结合各类具体风险模型实现全覆盖线上业务场景中大数据风控风险模型集群体系建设,展示目前智能风控决策引擎系统优势及功能。本文提出各类风控模型从不同角度、层面有效识别并预警互联网信贷业务风险,对互联网信贷业务模型体系构建具有一定参考价值。
关键词 大数据风控模型 风险管理工具 智能风控引擎
中图分类号:D922.28;TP311 文献标识码:A 文章编号:1007-0745(2021)09-0040-03
随着金融科技高速发展,借助互联网优势逐步发展的互联网信贷业务逐步抢占个人及小微企业市场。2020年7月17日,银保监会发布《商业银行互联网带宽管理暂行办法》已对商业银行互联网贷款业务进一步规范。以下仅以中小型商业银行为例,对互联网信贷业务大数据风控模型群体系及核心风险管理工具建设情况进行阐述。
1 建立大数据风控风险模型集群体系
稳定建立互联网信贷业务全生命周期风险模型集群,包括身份验证模型、反欺诈模型、信用评估模型、授信额度模型、定价模型、风险预警模型、行为评分模型、催收评分模型等。
目前该行自主研发完成的风险模型均在开展的互联网信贷业务中应用,如蚂蚁花呗、借呗、美团生活费、度小满、平安普惠、小米等合作渠道业务及自营贷款产品中,能有效支撑线上贷款业务快速增长带来的大数据风控管理要求。
2 详细风险模型
2.1 身份验证模型
采用多种先进的大数据、人工智能等金融科技手段,实现申请人在线实时身份核验,具体包括银行卡四要素鉴权、手机三要素鉴权、地址信息验证、人脸活体识别等验证手段。
1.要素鉴权:通对接合规大数据厂商,进行手机三要素、银行卡四要素验证,对申请人进行实名认证。
2.地址核验:通过对接数据厂商,获取运营商基站定位信息,验证申请人填写的居住地、工作地与通过基站定位加逻辑计算后的实际地址经纬度进行比对,根据差异距离校验申请人地址真实性。
3.关联人验证:通过数据提供服务,获取申请人的关联关系信息,验证申请人联系人信息的真实性、联系人的风险行为。
4.人脸活体识别:通过商汤科技,连接公安去网纹证件照联网核查,实现人脸活体识别功能,进而实现对借款人本人身份的真实性进行核实,防止身份冒用等风险。
5.声纹识别:通过对接腾讯云的声纹识别服务,将提取的申请人声纹与黑名单库中的声纹做对比,如果命中黑名单,则可以调低信用级别或直接拒绝。
2.2 反欺诈模型
线上互联网贷款业务面临最大的风险就是欺诈,针对不同类型的欺诈,接入丰富的外部数据,通过规则设置、交叉验证,最大程度识别和预防欺诈行为。
目前该行已经实现的反欺诈模型体系包括黑名单+反欺诈规则+欺诈评分模型,并逐步加入机器学习模型以及关联图谱模型(如图1)。
通过多种模型组合构建的反欺诈风控策略,将实现多维度的欺诈防控体系,识别申请人养卡养号、黑产中介、多头借贷、逾期黑名单、涉诉黑名单、地址欺诈、团伙欺诈等各类高风险欺诈行为(如图2)。部分关键的反欺诈手段如下。
1.黑名单:反欺诈第一关即为黑名单过滤,通过对接多个外部平台,尽最大努力覆盖司法涉诉、外部逾期、中介包装、运营商黑名单、其他行业关注名单等黑名单信息,简单高效过滤严重高风险客户。
2.设备欺诈:对接外部数据平台,获得申请人设备指纹信息,识别申请人设备关联多个不同身份信息的欺诈风险反欺诈。
3.多头借贷:对接外部数据平台,获得申请人的银行或非银类多严重头借贷信息,识别申请人注册多头、申请多头、放贷多头等。
4.手机号欺诈:对接外部平台建立的风险号码库,识别申请人通信小号、虚拟号码,高风险号码;通过手机号在网时长、状态、消费情况、使用习惯等信息,识别猫池养卡等手机号欺诈。
5.欺诈评分:接入欺诈评分服务,对申请人从设备、身份证、手机等多角度关联的欺诈行为进行综合评分,对于欺诈分数较高的客户,直接拒绝。
2.3 信用评估模型
通过构建申请评分模型评估客户的信用风险,实现客户风险等级的判定,根据风险等级进行准入决策。申请评分模型采用定量及定性分析方法,从稳定性、偿债能力、还款意愿等多角度出发,整合客户多维度信息,包括:基本信息、社会信息、消费信息、资产负债信息、电信信息、外部征信信息等,全面刻画申请人信用风险。
根据业务场景实际情况,采用不同的模型构建方法,对于客群场景相同且已有足够的放贷表现数据,采用标准的逻辑回归方法构建申请评分卡;对于不满足上述条件的情况,采用专家经验冷启动方法构建。将构建的申请评分模型部署到风控实时决策引擎AnyEST系统,则实现实时自动评估申请人信用风险,划分信用等级,根据风险等级进行准入决策。
2.4 授信额度模型
根据产品特点、风险偏好,设计产品额度区间和件均额度,针对不同客户风险差异,对客户进行申请评分,根据申请评分评定的风险等级,确定调整幅度。
2.5 风险定价模型
不断优化分客群、分场景的信用风险模型,区分不同客户群体的违约风险,测算相应的风险溢价,对于不同风险、不同场景申请人实现差异化定价,适当提高风险客户定价,降低优质客户的成本,逐渐积累沉淀优质客户。
2.6 风险预警模型
對客户在还款过程中的信用和行为进行监测,进而对高风险客户进行识别和预警的模型。风险预警模型主要实现方式包括风险监测预警规则和行为评分模型。应综合考虑数据查询成本和违约风险,接入外部风险数据,构建监测风险预警规则,定期监测已放贷客户的外部表现,如发现风险行为,及时触发风险预警信号,进行风险预警。应通过构建行为评分模型,预测客户违约概率,判定违约预警等级,对不同违约风险客户,采取相应的贷后处理。 3 未来将实现的大数据风控模型
3.1 构建实时智能学习的反欺诈策略引擎
未来将通过统计分析与机器学习方法,构建自学习的反欺诈策略引擎,结合历史放贷表现以及特征阈值的迭代智能学习,实现高精度反欺诈策略规则的自动发现、自动评估,实时输出策略。
3.2 基于机器学习和关联图谱升级反欺诈模型体系
将采用更精准的xgboost、随机森林、深度学习等算法,构建二元欺诈客户好坏分类模型,自动挖掘更多隐藏弱特征,在弱变量中挖掘更多潜在的欺诈风险。另外,也可以通过多模型的组合投票,对于申请人的风险分类给出更精准的结果,提升反欺诈精度。
在线上信贷市场中,黑产遍布、欺诈团伙盛行,对于线上信贷业务产生严重威胁。该行将通过关联图谱技术,构建群体欺诈检测模型,严密防控团伙欺诈行为。
3.3 行为评分模型
还需要对接三方数据,监测资产的外部表现,如涉诉、逾期、多头借贷等行为,并通过构建行为评分模型,预测客户违约概率,判定违约预警等级,对不同违约风险客户,采取相应的贷后处理。
3.4 贷后催收评分模型
根据历史催收记录,客户账龄、金额、风险等级等信息,构建的客户逾期催回成功可能性的模型。
4 大数据风控核心风险管理工具建设
4.1 互联网信贷业务智能风控决策引擎系统
为支持互联网贷款实时自动化审批,该行目前已构建了一套100%面向业务团队的可视化、分布式、多线程、支持高并发的智能风控决策引擎。该决策引擎可以实现规则的灵活配置与部署,支持基本准入、反欺诈规则及评分卡的部署与运行,实现在线自动化反欺诈检测与信用风险评估。引擎具有以下特性。
4.1.1 图形化操作,规则配置灵活易用
支持多种方式的规则配置,有规则集、决策树、决策流、评分卡。规则的配置全部通过可视化界面鼠标点击的方式完成,无需改动程序代码,业务人员可以以较低的学习成本快速上手。
4.1.2 多数据源对接
系统可以集成多方数据来源,包括第三方数据和内部数据,可以根据业务需求选择使用哪些数据进行查询。基于不同的业务产品,可以配置通过界面可视化的方式选择相应的第三方数据、内部数据。
4.1.3 与业务系统对接简单
采用统一接口服务的方式,与业务系统对接简单方便,减少对接工作量,支持业务快速开展。
4.1.4 支持规则热部署
本产品支持对规则的热部署,当需要变更规则时,可以在规则引擎中修改规则、对规则。
4.1.5 风控规则移植便捷
配置好規则以后,对于类似的业务条线,可通过对配置好的规则进行复制、导入导出,将规则移植到其它类似业务条线中,只需少量人工配置。
4.1.6 模型仿真测试
在模型正式部署至生产环境之前,可以对模型规则进行仿真测试,模拟输入进件信息,验证模型的正确性。
4.1.7 实时风险大盘
系统可以实时统计各类风险决策,并以表格、饼图、柱状图等形式实时分析和直观展现。
4.1.8 集群部署,支持大规模并发业务请求
性能方面,决策引擎系统支持集群部署,可随着业务量的增大扩展硬件,提高系统吞吐量及处理能力,保障业务的高可用性。支持多线程并行批处理机制,充分利用服务器CPU资源,缩短批处理时间,实现秒级的结果返回。
4.1.9 未来将实现的决策引擎功能优化
(1)支持复杂机器学习模型部署。决策引擎系统支持基于机器学习语言的模型部署,如神经网络模型等,充分利用人工智能等最新技术提升风控能力。支持将模型以pmml格式进行上传,系统自动解析模型输入和输出参数,可配置在决策流中进行调用。
(2)支持各类模型优化部署方式。支持模型的优化,支持A/B测试、冠军/挑战者或规则回溯,可以对新旧模型的执行效果进行对比分析,以判断模型优势,进而决定是否需要对模型进行优化和部署新的模型。
(3)支持决策表功能。增决策表功能,使业务配置风控模型决策丰富化。
(4)将由目前的支持贷前实时审批功能,升级为支持贷前审批、贷中预警、贷后催收等全流程业务的功能更加全面、更加智能的风控决策引擎。
4.2 互联网信贷业务智能催收系统
构建智能催收策略引擎,为不同程度、不同类型违约客户配置相应的贷后预警或催收策略,当系统识别出违约风险,智能催收系统会生成相应的自动催收方式,例如自动短信提醒、智能外呼等。
结合历史催收记录、客户行为等大数据信息,构建催收评分模型,配以相应的智能催收策略,提高催收成功率。
关键词 大数据风控模型 风险管理工具 智能风控引擎
中图分类号:D922.28;TP311 文献标识码:A 文章编号:1007-0745(2021)09-0040-03
随着金融科技高速发展,借助互联网优势逐步发展的互联网信贷业务逐步抢占个人及小微企业市场。2020年7月17日,银保监会发布《商业银行互联网带宽管理暂行办法》已对商业银行互联网贷款业务进一步规范。以下仅以中小型商业银行为例,对互联网信贷业务大数据风控模型群体系及核心风险管理工具建设情况进行阐述。
1 建立大数据风控风险模型集群体系
稳定建立互联网信贷业务全生命周期风险模型集群,包括身份验证模型、反欺诈模型、信用评估模型、授信额度模型、定价模型、风险预警模型、行为评分模型、催收评分模型等。
目前该行自主研发完成的风险模型均在开展的互联网信贷业务中应用,如蚂蚁花呗、借呗、美团生活费、度小满、平安普惠、小米等合作渠道业务及自营贷款产品中,能有效支撑线上贷款业务快速增长带来的大数据风控管理要求。
2 详细风险模型
2.1 身份验证模型
采用多种先进的大数据、人工智能等金融科技手段,实现申请人在线实时身份核验,具体包括银行卡四要素鉴权、手机三要素鉴权、地址信息验证、人脸活体识别等验证手段。
1.要素鉴权:通对接合规大数据厂商,进行手机三要素、银行卡四要素验证,对申请人进行实名认证。
2.地址核验:通过对接数据厂商,获取运营商基站定位信息,验证申请人填写的居住地、工作地与通过基站定位加逻辑计算后的实际地址经纬度进行比对,根据差异距离校验申请人地址真实性。
3.关联人验证:通过数据提供服务,获取申请人的关联关系信息,验证申请人联系人信息的真实性、联系人的风险行为。
4.人脸活体识别:通过商汤科技,连接公安去网纹证件照联网核查,实现人脸活体识别功能,进而实现对借款人本人身份的真实性进行核实,防止身份冒用等风险。
5.声纹识别:通过对接腾讯云的声纹识别服务,将提取的申请人声纹与黑名单库中的声纹做对比,如果命中黑名单,则可以调低信用级别或直接拒绝。
2.2 反欺诈模型
线上互联网贷款业务面临最大的风险就是欺诈,针对不同类型的欺诈,接入丰富的外部数据,通过规则设置、交叉验证,最大程度识别和预防欺诈行为。
目前该行已经实现的反欺诈模型体系包括黑名单+反欺诈规则+欺诈评分模型,并逐步加入机器学习模型以及关联图谱模型(如图1)。
通过多种模型组合构建的反欺诈风控策略,将实现多维度的欺诈防控体系,识别申请人养卡养号、黑产中介、多头借贷、逾期黑名单、涉诉黑名单、地址欺诈、团伙欺诈等各类高风险欺诈行为(如图2)。部分关键的反欺诈手段如下。
1.黑名单:反欺诈第一关即为黑名单过滤,通过对接多个外部平台,尽最大努力覆盖司法涉诉、外部逾期、中介包装、运营商黑名单、其他行业关注名单等黑名单信息,简单高效过滤严重高风险客户。
2.设备欺诈:对接外部数据平台,获得申请人设备指纹信息,识别申请人设备关联多个不同身份信息的欺诈风险反欺诈。
3.多头借贷:对接外部数据平台,获得申请人的银行或非银类多严重头借贷信息,识别申请人注册多头、申请多头、放贷多头等。
4.手机号欺诈:对接外部平台建立的风险号码库,识别申请人通信小号、虚拟号码,高风险号码;通过手机号在网时长、状态、消费情况、使用习惯等信息,识别猫池养卡等手机号欺诈。
5.欺诈评分:接入欺诈评分服务,对申请人从设备、身份证、手机等多角度关联的欺诈行为进行综合评分,对于欺诈分数较高的客户,直接拒绝。
2.3 信用评估模型
通过构建申请评分模型评估客户的信用风险,实现客户风险等级的判定,根据风险等级进行准入决策。申请评分模型采用定量及定性分析方法,从稳定性、偿债能力、还款意愿等多角度出发,整合客户多维度信息,包括:基本信息、社会信息、消费信息、资产负债信息、电信信息、外部征信信息等,全面刻画申请人信用风险。
根据业务场景实际情况,采用不同的模型构建方法,对于客群场景相同且已有足够的放贷表现数据,采用标准的逻辑回归方法构建申请评分卡;对于不满足上述条件的情况,采用专家经验冷启动方法构建。将构建的申请评分模型部署到风控实时决策引擎AnyEST系统,则实现实时自动评估申请人信用风险,划分信用等级,根据风险等级进行准入决策。
2.4 授信额度模型
根据产品特点、风险偏好,设计产品额度区间和件均额度,针对不同客户风险差异,对客户进行申请评分,根据申请评分评定的风险等级,确定调整幅度。
2.5 风险定价模型
不断优化分客群、分场景的信用风险模型,区分不同客户群体的违约风险,测算相应的风险溢价,对于不同风险、不同场景申请人实现差异化定价,适当提高风险客户定价,降低优质客户的成本,逐渐积累沉淀优质客户。
2.6 风险预警模型
對客户在还款过程中的信用和行为进行监测,进而对高风险客户进行识别和预警的模型。风险预警模型主要实现方式包括风险监测预警规则和行为评分模型。应综合考虑数据查询成本和违约风险,接入外部风险数据,构建监测风险预警规则,定期监测已放贷客户的外部表现,如发现风险行为,及时触发风险预警信号,进行风险预警。应通过构建行为评分模型,预测客户违约概率,判定违约预警等级,对不同违约风险客户,采取相应的贷后处理。 3 未来将实现的大数据风控模型
3.1 构建实时智能学习的反欺诈策略引擎
未来将通过统计分析与机器学习方法,构建自学习的反欺诈策略引擎,结合历史放贷表现以及特征阈值的迭代智能学习,实现高精度反欺诈策略规则的自动发现、自动评估,实时输出策略。
3.2 基于机器学习和关联图谱升级反欺诈模型体系
将采用更精准的xgboost、随机森林、深度学习等算法,构建二元欺诈客户好坏分类模型,自动挖掘更多隐藏弱特征,在弱变量中挖掘更多潜在的欺诈风险。另外,也可以通过多模型的组合投票,对于申请人的风险分类给出更精准的结果,提升反欺诈精度。
在线上信贷市场中,黑产遍布、欺诈团伙盛行,对于线上信贷业务产生严重威胁。该行将通过关联图谱技术,构建群体欺诈检测模型,严密防控团伙欺诈行为。
3.3 行为评分模型
还需要对接三方数据,监测资产的外部表现,如涉诉、逾期、多头借贷等行为,并通过构建行为评分模型,预测客户违约概率,判定违约预警等级,对不同违约风险客户,采取相应的贷后处理。
3.4 贷后催收评分模型
根据历史催收记录,客户账龄、金额、风险等级等信息,构建的客户逾期催回成功可能性的模型。
4 大数据风控核心风险管理工具建设
4.1 互联网信贷业务智能风控决策引擎系统
为支持互联网贷款实时自动化审批,该行目前已构建了一套100%面向业务团队的可视化、分布式、多线程、支持高并发的智能风控决策引擎。该决策引擎可以实现规则的灵活配置与部署,支持基本准入、反欺诈规则及评分卡的部署与运行,实现在线自动化反欺诈检测与信用风险评估。引擎具有以下特性。
4.1.1 图形化操作,规则配置灵活易用
支持多种方式的规则配置,有规则集、决策树、决策流、评分卡。规则的配置全部通过可视化界面鼠标点击的方式完成,无需改动程序代码,业务人员可以以较低的学习成本快速上手。
4.1.2 多数据源对接
系统可以集成多方数据来源,包括第三方数据和内部数据,可以根据业务需求选择使用哪些数据进行查询。基于不同的业务产品,可以配置通过界面可视化的方式选择相应的第三方数据、内部数据。
4.1.3 与业务系统对接简单
采用统一接口服务的方式,与业务系统对接简单方便,减少对接工作量,支持业务快速开展。
4.1.4 支持规则热部署
本产品支持对规则的热部署,当需要变更规则时,可以在规则引擎中修改规则、对规则。
4.1.5 风控规则移植便捷
配置好規则以后,对于类似的业务条线,可通过对配置好的规则进行复制、导入导出,将规则移植到其它类似业务条线中,只需少量人工配置。
4.1.6 模型仿真测试
在模型正式部署至生产环境之前,可以对模型规则进行仿真测试,模拟输入进件信息,验证模型的正确性。
4.1.7 实时风险大盘
系统可以实时统计各类风险决策,并以表格、饼图、柱状图等形式实时分析和直观展现。
4.1.8 集群部署,支持大规模并发业务请求
性能方面,决策引擎系统支持集群部署,可随着业务量的增大扩展硬件,提高系统吞吐量及处理能力,保障业务的高可用性。支持多线程并行批处理机制,充分利用服务器CPU资源,缩短批处理时间,实现秒级的结果返回。
4.1.9 未来将实现的决策引擎功能优化
(1)支持复杂机器学习模型部署。决策引擎系统支持基于机器学习语言的模型部署,如神经网络模型等,充分利用人工智能等最新技术提升风控能力。支持将模型以pmml格式进行上传,系统自动解析模型输入和输出参数,可配置在决策流中进行调用。
(2)支持各类模型优化部署方式。支持模型的优化,支持A/B测试、冠军/挑战者或规则回溯,可以对新旧模型的执行效果进行对比分析,以判断模型优势,进而决定是否需要对模型进行优化和部署新的模型。
(3)支持决策表功能。增决策表功能,使业务配置风控模型决策丰富化。
(4)将由目前的支持贷前实时审批功能,升级为支持贷前审批、贷中预警、贷后催收等全流程业务的功能更加全面、更加智能的风控决策引擎。
4.2 互联网信贷业务智能催收系统
构建智能催收策略引擎,为不同程度、不同类型违约客户配置相应的贷后预警或催收策略,当系统识别出违约风险,智能催收系统会生成相应的自动催收方式,例如自动短信提醒、智能外呼等。
结合历史催收记录、客户行为等大数据信息,构建催收评分模型,配以相应的智能催收策略,提高催收成功率。