论文部分内容阅读
随着近年来国内外信贷消费的蓬勃发展,信用风险管理越来越受到金融行业的重视并逐渐成为客户关系管理中的核心问题。其中,信用评分方法成为信用风险预测的主要方法,它使得信贷决策过程自动化、科学化,大大提高了金融行业的收益。
本文以实际项目为研究对象,通过对问题的分析和理解,建立线性判别分析评分模型,并应用遗传算法对其求解。以此模型为核心开发出不良顾客预测系统,应用在信用审查业务中。
本文首先应用数据挖掘和统计分析方法,对消费者的基本属性、信用历史记录等大量数据作统计分析,挖掘数据中蕴含的与行为棚关的特征,寻找判别能力较强的变量。为便于模型的应用,进行了离散变量的分组化、连续变量的离散化处理。
针对一次变量难以表达变量间交叉特征的问题,本文提出二次变量的概念。由于寻找二次变量的过程构成组合优化问题,本文进一步提出并应用遗传规划方法生成二次变量。结合人工筛选,所生成的二次变量不仅可以表达一次变量难以表达的交叉特征,而且具有较强的分辨能力。实验结果证明二次变量的引入可以明显提高模型的精度。
由于判别分析模型的求解是一个组合优化问题,本文提出采用遗传算法进行求解。针对实际问题的特点,设计了一种简便灵活的编码方式,以变量为基因,基因的顺次排列构成染色体,每个基因中包含了变量的两个信息:变量是否选入;变量的系数。这种方式实现了进化时变量的选择与系数分配同时进行。实验仿真结果验证了算法的有效性与可行性。
针对信用评分,本文还建立了支持向量机模型和逻辑回归模型,并在同一组测试数据上进行了仿真结果的对比分析,判别分析模型以预测能力强、精度高、易于理解、有效、实用的特点为用户所接受与采纳。
基于信用评分模型,对不良顾客预测系统的总体结构以及主要功能模块进行了设计,并采用C++实现了整个系统。实际应用效果稳定、可靠,满足了用户的要求。