论文部分内容阅读
近年来,我国信用卡行业得到跨越式的大发展,在信用卡发卡量和信贷规模不断增长的同时,发卡机构的风险管理策Logistic手段的发展却存在明显的滞后性,信用卡行业的不确定性逐渐上升,风险隐患开始显现。为了有效提升信用卡风险管理水平,各家信用卡发卡机构开始逐步尝试基于数据挖掘手段进行信用卡资产组合管理,并在全盘考量业务风险与收益的前提下,实施更为有效的风险管理,特别是数据挖掘技术中的信用评分技术的应用受到了普遍关注。 在上述信用卡行业的发展背景之下,本文旨在采用实证分析的方法,基于大量真实的信用卡客户数据,探讨如何通过建立更为科学的计量分析模型来具体量化信用卡客户的风险水平,进一步完善信用卡贷中、贷后风险管理的技术手段,提高对信用卡客户信用风险的识别、衡量和管理能力,从而实现风险管理策略的优化。 本文通过回顾国内外具有代表性的模型技术研究文献,对判别分析模型、决策树模型、回归模型和神经网络模型的基本技术思路和优缺点进行了简要概括,并对当前主流的风险计量模型技术的区分能力和稳定性进行了比较,再结合信用卡风险评分模型开发所需要达成的业务目标,最终选择了技术较为成熟、预测准确性高、运行稳定且符合业务目标的Logistic回归技术进行模型开发。 在模型变量的定义上,本文综合考虑了业务实际情况、数据时效性、数据历史积累情况和业界通用标准等多方面因素,将风险评分模型定义为,根据观察时点之前6个月的客户交易数据来预测该客户在未来12个月内发生90天及以上拖欠的违约概率。 本文所构建的风险评分模型主要基于的客户行为特征变量进行设计,在模型自变量的选择方面,在对所有潜在变量逐一进行单变量分析和双变量分析的基础上,结合风险管理业务经验,初步筛选出候选X变量。为了尽量减小多重共线性对模型可能造成的影响,并使风险预测模型能够反映出存量客户的不同行为特征,模型X变量的选取遵循了以下原则,包括:(1)在选取变量时尽可能地从消费行为变量、取现行为变量、还款行为变量等不同类型的特征变量中进行甄选,以反映存量客户的整体行为特征,减少风险评分模型对某一类型行为信息的过度依赖性;(2)对于同一类型的变量,分别从严重性、近期性、频率性、货币价值性及组合性等五个不同方面选取特征变量;(3)参考双变量分析结果、IV值统计情况和专家意见,尽可能地选取预测能力强的变量;(4)考虑变量选取的合理性,只选用变量分布情况与实际经验相符并且可以解释的变量;(5)考虑模型实际应用的便利性,尽量选取计算简便、容易解释的变量。 为了评估候选X变量的预测能力,本文依据IV值对候选自变量的预测能力和重要性进行了量化与衡量,选择其中预测能力最强的变量引入模型。同时,通过IV值的计算得到初步的分组方式,再结合专家意见,确定了与业务经验最为相近的且符合统计学原则的变量分组方式,进而给出生成虚拟变量的初步方向。 在最终确定了模型候选变量后,使用SAS系统,将已经生成的虚拟X变量和Y变量代入其逻辑回归过程中进行计算,得到对Y变量有影响的解释变量及其系数、卡方、P值等统计量。至此,经过基础数据分析、变量筛选、变量分组、逻辑回归等步骤,最终得出了风险预测模型的结果,共引入了“性别”、“年龄”、“开户月数”、“平均取现次数”等12个变量,该预测模型的K-S值达到0.639,AUC值达到了0.893,模型预测能力非常强。 为了保证模型的准确性和可用性,本文从模型预测效果、客户特征分布稳定性、评分分布及违约率稳定性这三个方面进行了模型验证工作。为了排除建模样本有偏的可能性,检验训练样本是否具有代表性,分别采用了样本内与样本外两个数据集进行验证,从多个角度验证考察模型的稳定性、有效性和适用性。基于建模基础客户数据中随机保留的30%数据进行样本内验证,得到样本内验证的K-S值为0.635,AUC为0.893,这与建模样本得到的K-S值及AUC值相差不大;基于模型开发观察窗口6个月后的客户数据对模型进行样本外验证,得到样本外验证的K-S值为0.635,AUC为0.889,也与建模样本的K-S值和AUC值相差不大。这说明本文开发的风险评分模型有很强的区分能力,且随着时间的推移,该风险评分模型对客户的风险预测能力仍然稳定有效。 由于客户细分策略及差异化风险管理策略,都建立在客户风险水平可识别、可计量的基础之上的,也就是说,风险评分模型是信用卡客户管理策略实施的基础。本文所建立的基于Logistic的风险评分模型正是通过客户的交易行为信息,挖掘其风险特征,并预测其风险水平的可靠技术手段。基于该模型,本文探讨了风险评分在贷中、贷后风险管理中的应用。 由于本文所建立的风险评分模型是基于客户历史行为变量对其未来违约概率做出的预测,其中客户历史用卡行为数据的积累至少要达到6个月以上,因此该模型不适用于客户引入和成长初期的风险策略制定,而主要适用于已经积累了一定交易历史的存量客户,即可应用于信用卡贷中交易管理及早期催收策略的制定。从客户积累了一定的交易表现开始,到客户流失或退出之前的整个时间区间内,风险评分可成为额度调整、交叉销售、交易监控、授权策略及早期催收等多种风险管理决策的制定依据和管理工具。对于风险评分水平不同的客户,发卡机构可部署不同的风险管理策略。特别的,基于风险评分模型的策略目标并不是以单纯风险最小化为目的的,而是要实现在发卡行风险容忍度范围内的、风险调整后的收益增长。 接下来,本文以贷中额度调整策略为例,讨论风险评分在策略制定中的作用。信用额度调整策略至少包括两方面内容:一是对什么人进行调额,二是上调(或下调)多少额度。对于额度上调来说,调额准入条件的确定必定伴随着对持卡人未来风险情况的评估,而就具体调额幅度而言,也需要在满足调额准入的客户范围内进行进一步的细分,从风险角度而言,通常风险评分越高的客户对应的可调额幅度越大。当然,在实际业务中,风险因素仅是额度调整策略需要参考的一个方面,同时还需要综合持卡人行为特征及用卡需要等多方面因素进行评估。基于数据分析与风险评分模型,能够实现对客户行为特征与客户需求的有效发掘。有效的额度管理策略应该是以客户为中心的,即根据客户生命周期的发展阶段及用卡需求变化进行的额度管理,具体来说,发卡机构可根据客户引入的时间维度和客户的需求维度这两个方面来制定有针对性的调额策略。同时,在具体实践中,对于调额策略需要进行持续跟踪,通过风险评分可以从风险角度追踪调额策略实施的结果,实现对现有调额策略的灵活配置及不断优化。 风险计量实际上是将风险识别、分析、评估和管理整合为一体的过程,而上述各个环节的实现均要以准确有效的数据计量为基础,专业计量技术人才作保证,科学的风险管理意识贯穿始终。考虑到当前国内信用卡行业的现实情况,风险评分模型的开发和应用,还要受到数据情况、风险管理观念及业务人员素质等条件的制约。同时,对于开发完成的风险评分模型,在具体业务应用中也要结合业务实际情况进行判断,在全面风险管理的体系框架内也应该尝试引入更多的管理工具,从欺诈风险、操作风险、市场风险等多角度进行资产组合的评估与管理,寻求最优的策略实施。 综上,经过实证研究的检验,基于Logistic回归的风险评分模型对信用卡客户违约概率的具有较好的识别能力及稳定性,同时基于对客户违约概率的识别与评估,该模型评分能够成为客户贷中、贷后多种客户管理策略的制定依据,在客户细分、策略制定、实施、监控与不断优化的过程中起到重要作用,从而实现信用卡风险管理水平和客户管理水平的有效提升。